KaggleMasterになるまで!期間4年間の難易度へ金メダルへ挑戦と学び

こんにちは!チームシャイニー スタッフで Kaggle Master近藤俊彦 です。チームシャイニー は発達障害のある方のための 就労移行支援 事業所として、 データサイエンス 、AI、Webマーケティングに特化したトレーニングを提供しています。私自身も日々の業務や支援を通じてデータサイエンスの世界に深く関わる中で、世界的なデータサイエンスプラットフォームである Kaggle での挑戦を続けてきました。

参考スライドはこちら

そしてこの度、約4年間の挑戦を経て、多くのデータサイエンティストが目指す称号の一つである Kaggle Competitions Master を達成することができました!(2024年7月達成)

今回は、私が Kaggle Master に至るまでの道のり、 機械学習コンペティション で得た学び、そして 発達障害者支援 の現場での経験との繋がりについて、振り返ってみたいと思います。

目次

Kaggleとの出会いとデータサイエンスへの初期挑戦 (2020年〜2021年)

Kaggleとの出会いとデータサイエンスへの初期挑戦 (2020年〜2021年)

私がKaggleを始めたのは2020年10月頃。チームシャイニーでの業務がきっかけでした。

 私がKaggleを始めたのは2020年10月頃。チームシャイニーでの業務がきっかけでした。 プログラミング 経験はほとんどありませんでしたが、チームシャイニーでは、業務時間の一部をKaggleへの挑戦に充てることを奨励されており、学習に集中できる環境がありました。これは、専門スキルを習得したいと考えている方にとって、集中できる環境がいかに重要かを示す一例かもしれません。

前職が画像関係だったため、当初は画像系のコンペに挑戦しましたが、結果は銅メダル止まり。なかなか思うような結果が出ない時期もありました。そんな中、2021年5月の Shopee – Price Match Guarantee コンペ(マルチモーダル)で初のKaggleメダル(銅)を獲得。この時はまだ手探り状態でしたが、「データサイエンスコンペの感覚」を掴む良いきっかけとなりました。

Kaggle Masterになるまで:銀メダル獲得と試行錯誤の難易度へ日々 (2022年)

Kaggle Masterになるまで:銀メダル獲得と試行錯誤の日々 (2022年)

2022年は、私にとって飛躍の年となり、複数のコンペで銀メダルを獲得できました。この年の主な挑戦を表にまとめます。

コンペ名分野主な取り組み・学び結果参加形態
Jigsaw Rate Severity of Toxic Comments自然言語処理TF-IDF等の特徴量エンジニアリングに特に注力。データセット調整、ノイズ削除など、精度向上に向けた地道な試行錯誤が実を結んだ。初銀メダルソロ
Google AI4Code – Understand Code in Python Notebooks自然言語処理ハイブリッドモデルの挑戦は精度が出なかったが、チームでの協力、特に他のデータサイエンティストとの議論や役割分担の重要性を学んだ。銀メダルチーム
Feedback Prize – English Language Learning自然言語処理過去のコンペ経験や公開Solutionを参考にアプローチ。特に評価指標に合わせたモデル調整に注力。自然言語処理(NLP)のスキルセットが着実に身についてきた実感があった。銀メダルソロ

この頃から、 テーブルデータ自然言語処理 の分野で結果が出始め、自分の得意な 機械学習 領域が見えてきました。もちろん、全てのコンペで上手くいったわけではなく、多くの時間を使っても結果に繋がらないことも多々ありました。

そして、Kaggle Masterへ:テーブルデータコンペでの金メダル (2024年)

そして、Kaggle Masterへ:テーブルデータコンペでの金メダル (2024年)

Kaggle Expertの称号を得てからMasterになるまでは長い道のりでしたが、諦めずに挑戦を続けました。

そして2024年7月、NeurIPS 2024 – Predict New Medicines with BELKA (テーブルデータ) コンペで、ついに初の金メダルを獲得!これにより、 Kaggle Master の称号を得ることができました。驚くべきことに、1DCNN(1次元畳み込みニューラルネットワーク)を使った比較的シンプルな 機械学習モデル のベースラインが高い評価を得たのです。複雑な手法が必ずしも最良とは限らないという、興味深い学びがありました。これは、 テーブルデータ のような系列データに対する特定モデルの有効性を示す結果でした。

Kaggleとの向き合い方:難易度は高いが継続と楽しむ心がデータサイエンティストへ

Kaggleとの向き合い方:継続と楽しむ心がデータサイエンティストを育む

私がKaggleを楽しみながら続けられたのには、いくつかの理由があります。

ゲーム感覚で楽しむ:

ランキングやスコアを追いかけるプロセスをゲームのように楽しむことで、モチベーションを維持しました。

とにかく打席に立つ (挑戦する)

完璧を目指すより、まずは参加してみること。公開されているDiscussionを読んだり、論文を参考にしたりはもちろん、「できることは全部試す」気持ちで挑戦回数を重ねました。 継続 していれば、思わぬところで良い結果に繋がることもあります。

戦略とコツを楽しむ

どうすればスコアが上がるか、どんな 機械学習アルゴリズム や工夫が有効か。戦略を考え、試行錯誤するプロセス自体を楽しむことが、 データサイエンティスト としての成長に繋がったと感じています。

環境と人との出会い

チームシャイニーという データサイエンス に集中できる環境、チームを組んでくれた仲間、励ましてくれた家族や職場の方々。周りのサポートの重要性を実感しています。

就労移行支援チームシャイニーの現場とKaggleから得た学び:個々の強みを活かす

就労移行支援チームシャイニーの現場とKaggleから得た学び:個々の強みを活かす

発達障害 のある方の 就労移行支援 に携わる中で、「その人自身の強みや興味を活かせる環境を見つけること」「試行錯誤しながら、自分に合ったやり方を見つけていくこと」の大切さを日々感じています。

得意分野を見つける

画像、テーブルデータ、自然言語処理…色々な分野に挑戦する中で、自分の得意な領域が見えてくる。これは、 就労支援 における適性発見にも通じます。

自分に合った学習・作業スタイル

短期決戦が苦手なら、期間の長いコンペを選ぶ。テクニックの暗記が苦手なら、その都度調べながら実践する。自分に合ったペースや方法を見つけることが大切です。

継続することの価値

すぐに結果が出なくても、諦めずに打席に立ち続けることで道が開けることがある。 就労 に向けても、粘り強さが求められる場面があります。

楽しむことの重要性

義務感ではなく、「楽しい」「もっと知りたい」という気持ちが、スキル習得や目標達成の大きな原動力になります。

もちろん、Kaggleコンペと 就労 は目的が異なります。

 しかし、「自分を知り、環境を選び、試行錯誤を楽しみながら継続する」というプロセスは、 発達障害 の有無に関わらず、どんな目標に向かう上でも、きっと力になるはずだと信じています。

私自身、 データサイエンス の世界は日進月歩であり、まだまだ道半ばです。最近はLLM(大規模言語モデル)の進化に少し置いていかれ気味ですが、ChatGPTなどを活用しながら、これからも学び続けていきたいと思っています。

チームシャイニーで、あなたもデータサイエンスの世界へ挑戦しませんか?

この記事を読んで、データサイエンスやAI、Kaggleの世界に少しでも興味を持った方、特に発達障害や精神障害の特性を活かしながら専門スキルを身につけたいと考えている方へ。

私たち チームシャイニー は、東京都千代田区(秋葉原)にある 就労移行支援事業所 です。 データサイエンス、生成AI、Webマーケティング に特化し、専門的な知識やスキルを基礎から学べる環境を提供しています。

特長内容
専門分野特化データサイエンスやAIといった先端IT分野に特化。
当事者スタッフスタッフ自身も障害特性への理解があり、安心して相談できる環境。
成長できる環境大学や企業とも連携し、実践的なスキルアップを目指せる。
助け合いの精神仲間と共に切磋琢磨し、互いに支え合いながら成長できる。

私自身がそうであったように、プログラミング未経験からでも、興味と意欲があれば大丈夫です。チームシャイニーは、あなたの「やってみたい」を全力でサポートします。

データサイエンスの力で未来を切り拓きたい方、自分の可能性を信じて挑戦したい方、ぜひ一度チームシャイニーのウェブサイトをご覧いただき、お気軽にお問い合わせください。

まとめ:感謝とこれからの挑戦

目標としていた Kaggle Master になれたことは、大きな自信になりました。しかし、これは決して私一人の力ではありません。チームメイト、家族、職場の方々、そしてKaggleコミュニティの皆さんに心から感謝しています。

これからも、楽しみながら Kaggleコンペ に参加し続けたいと思います。そして、この データサイエンス機械学習 の経験から得た学びを、日々の 発達障害者就労移行支援 にも少しでも活かしていければ嬉しいです。

この記事が、Kaggleに挑戦している方、データサイエンスに興味がある方、そして 発達障害 のある方の 就労支援 に関わる方にとって、何かの参考になれば幸いです。記事へのご感想やご質問もお待ちしております。

これからも対戦よろしくお願いします!

項目内容
名前近藤 俊彦 (Toshihiko Kondo)
所属チームシャイニー スタッフ
実績Kaggle Competitions Master (2024年7月達成)
専門データサイエンス(特にテーブルデータ、自然言語処理)、Kaggle
ひとこと楽しみながら継続することが大切だと感じています。データサイエンスやKaggleに興味のある方、一緒に頑張りましょう!

この記事を書いた人

チームシャイニーブログ管理人
生成AIやWEBマーケティングの講師も実施中

https://careland.org/

コメント

コメントする

目次