日本国内外のデータ分析/機械学習のコンペサイトをまとめました。kaggleやsignateのような有名なサイトから、新興サイトまで幅広く紹介していきます。随時更新していきます。
Kaggle(米国)
運営:Google
URL:https://www.kaggle.com/
特徴:世界的に最もよく知られた分析コンペのプラットフォームで、2021年で800万人以上のユーザーが参加しています。コンペティションだけではなく、Kaggle Notebooksと言われるクラウド上のデータ分析環境や、情報交換できる掲示板(Discussions)、自作のデータセットを公開する機能であるDatasetなど様々なサービスを提供しているのも特徴です。日本企業であるメルカリやリクルートも過去にKaggleでコンペを開催しています。
- Mercari Price Suggestion Challenge(Mecari )
- Recruit Restaurant Visitor Forecasting(Recruit Holdings)
AIcrowd(スイス)
運営:AIcrowd
URL:https://www.aicrowd.com/
特徴:こちらも世界的な分析コンペサイトで、約4.7万人以上のユーザーが参加しています。またホストも、Facebook、SONY、Spotify、MicrosoftやIBMなど有名な企業が多くあります。ゲームのMinecraftのコンペティションが度々行われているのも特徴です。
- The Music Demixing (MDX) Challenge(Sony Group Corporation)
- The MineRL 2021 Diamond Competition(MineRL Labs – Carnegie Mellon University)
SIGNATE(日本)
運営:SIGNATE
URL:https://signate.jp/
特徴:日本最大の分析コンペプラットフォームで、これまでのべ6万人が参加しています。サイトが日本語であり、経済産業省、パナソニック株式会社や株式会社SUBARUなど日本企業がホストであることから、馴染みやすく取り組みやすいです。
- SUBARU 画像認識チャレンジ(株式会社SUBARU)
- アイディアコンテスト:訪日外国人を分析せよ!(経済産業省)
DrivenData(米国)
運営:DrivenData
URL:https://www.drivendata.org/competitions/
特徴:より良い世界を構築するためのデータサイエンスコンペティションで、国際開発、健康、教育、公共サービスなど社会貢献のためのタスクが主になります。コンペを通して、野生生物の保護や公衆衛生の向上など、より社会貢献したい人にはオススメのコンペサイトになります。
- Deep Chimpact: Depth Estimation for Wildlife Conservation(MathWorks)
- Random Walk of the Penguins(DrivenData)
PHMC データチャレンジコンテスト(日本)
運営:株式会社電通国際情報サービス
URL:https://industrial-big-data.io/
特徴:日本の製造業におけるPHM(Prognostics and Health Management)の取組拡大、活性化を目的として実施されているコンテストで、毎年春から秋頃のいずれかで行われています。これまでに、以下のような分析課題が出題されています。
- 2020年 工作機械の刃具の摩耗予測
- 2021年 バッテリーの残寿命予測
分析ツール協力にMathWorksがおり、Matlabをお試しで使えるのも特徴です。
DCASE CHALLENGE
運営:DCASE Community
URL:https://dcase.community/
特徴:世界最大の音響認識分野の国際コンペティションで、毎年開催されています。音響認識分野の中でも様々なタスクがあり、2022年は6つのタスクが開催される予定です。
- Task 1, Low-Complexity Acoustic Scene Classification
- Task 2, Unsupervised Anomalous Sound Detection for Machine Condition Monitoring Applying Domain Generalization Techniques
- Task 3, Sound Event Localization and Detection Evaluated in Real Spatial Sound Scenes
- Task 4, Sound Event Detection in Domestic Environments
- Task 5, Few-shot Bioacoustic Event Detection
- Task 6, Automated Audio Captioning and Language-Based Audio Retrieval
3~6月の3ヶ月間で解法を検討し、7月に結果が発表されます。また、技術文の提出が必要なのが特徴です。過去に、ソニーやセコムが上位入賞しています。
ぐるぐる:atmaCup(日本)
運営:atma
URL:https://www.guruguru.science/
https://atma.connpass.com/
特徴:atma株式会社が主催するオンサイトデータコンペティションで、他のコンペとの大きな違いはオンラインで集まり短時間で分析を行います。現在は、新型コロナウイルスのためオンラインでの開催を主としています。毎回、初心者向けの講座を開催しており、無料で受けれることも特徴です。絵の分類タスクが多い印象です。
InnoCentive(英国)
運営:Wazoku
URL:https://www.innocentive.com/challenge/
特徴:イギリスのコンペサイトで、主にライフサイエンスに関する問題を取り扱っています。例えば、マラリアを媒介する蚊による感染の削減や、清潔な水へのアクセスを容易にするためのタスクなどがあり、世界的に差し迫った問題を解決するタスクが多いのが特徴です。
ProbSpace(日本)
運営:ProbSpace
URL:https://comp.probspace.com/
特徴:日本の新興のコンペサイトで、日本語で取り組めて、ユーザーもまだ少ないことから、上位が狙いやすいです。「宗教画テーマ分類」、「浮世絵作者予測」や「くず字識別チャレンジ」など面白いテーマが多いのも特徴です。
Nishika(日本)
運営:Nishika
URL:https://www.nishika.com/competitions
特徴:2019年にオープンした日本語のコンペサイトで、こちらもまだ参加者が少ないことから上位が狙いやすいと思います。これまでに、特許庁、防衛装備庁やMathWorks Japanがホストを務めています。またJobオファーや副業案件などもあるのが特徴です。
Analytics Vidhya(インド)
運営:Analytics Vidhya
URL:https://datahack.analyticsvidhya.com/contest/all/
特徴:インドのデータサイエンティストのためのコミュニティサイトで、データサイエンスの学習リソースの提供や、ハッカソンを開催しています。100万人以上が参加しており、ハッカソンの上位入賞者には、開催企業からJobオファーもあるそうです。
Marketing Analysis Contest(日本)
運営:野村総合研究所
URL:https://www.is.nri.co.jp/contest/
特徴:さまざまな視点から生活者の購買要因を掘り下げてデータを分析し、斬新なビジネスの法則や新しいマーケティング指標等の発見を競うコンテストで毎年開催されています。2021年のコンテストでは、メディアへの接触状況から、商品の購買状況がどのようになるか分析することが求められていたようです。
Tianchi (中国)
運営:Alibaba
URL:https://tianchi.aliyun.com/competition/gameList/activeList
特徴:中国Alibaba Cloudによるデータ分析コンペサイトで、非常にKaggleに似ています。世界中の企業や政府と連携しており、数十万人のデータサイエンティストが登録しているそうでうす。
Quevico(日本)
運営:Mewcket
URL:https://quevico.com/
特徴:オープンして間もないコンペサイトで、まだタスクがあまりないです。今後増えていくことに期待しましょう。日本の会社が運営していますが、基本的に英語になります。
bitgrit(日本)
運営:Bitgrit
URL:https://bitgrit.net/competition/
特徴:日本のスタートアップ企業Bitgritが立ち上げたデータ分析コンペサイトで、コミュニティの参加者は、すでに25,000人を超えているそうです。ロードマップを見ると、これから様々な機能が追加予定になっており、今後が楽しみなコンペサイトです。日本の企業ですが、すべて英語になります。
Topcoder(米国)
運営:アピリオ
URL:https://www.topcoder.com/
特徴:競技プログラミングのサイトですが、分析コンペも開催されています。
DATA SCIENCE COMPETITIONS
運営:DataCamp
URL:https://www.datacamp.com/data-science-competitions
Kaggke関連おすすめ本
Kaggleで勝つデータ分析の技術
Kaggle全体の説明や、Kaggleで上位に入るためには必ず知らなければいけない手法やテクニックが体系的にまとめられています。これからデータ分析コンペに参加しようと思っている方、既にコンペに参加しているが上位になかなか入れない方にオススメの本です。
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
Kaggle Masterである石原 祥太郎(u++)さんと村田 秀樹(カレー)が書かれた初学者向けのKaggle入門書です。初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれることを目標に書かれています。
The Kaggle Book: Data analysis and machine learning for competitive data science
The Kaggle Book: Data analysis and machine learning for competitive data science
二人のグランドマスターによる共著で、Kaggleにおけるモデリング戦略や暗黙知などが書かれています。
コメント