[データサイエンティストの思考法〜KDD Cup世界第2位の頭の中〜]

データ分析競技という世界の実際と魅力【第1回】

2015年11月19日(木)原田 慧(金融エンジニアリング・グループ コンサルティング本部 第1部 第1グループ 副主任コンサルタント)

「ビッグデータ」「データサイエンティスト」といったキーワードとともに、データ分析が注目されています。しかし実際には「何をやれば良いのかよく分からない」「どんな人材を育てれば良いのか」という声を多々耳にします。筆者らのデータ分析チームは、「KDD Cup 2015」というデータ分析の国際大会で2位に入賞しました。本連載では、同大会でのデータ分析の中で分析者が何を思い、何を考え、何をしたのかを題材に解説します。私たちの思考の足あとを通して、読者の皆様にデータ分析とは何かを少しでも伝えられれば幸いです。第1回は、本連載の題材であるKDD Cupに代表されるデータ分析競技の世界を紹介します。

 2015年7月13日月曜日の午前9時、データ分析の国際大会「KDD Cup 2015」の競技が終了し、その結果が発表されました。筆者ら新日鉄住金ソリューションズ(NSSOL)と金融エンジニアリング・グループ(FEG)の混成チームである「FEG&NSSOL@DataVeraci」の結果は世界第2位でした。

 その瞬間、第2位を喜ぶメンバーは1人もいませんでした。「なんとかたどり着いた2位」ではなく、「長らく守ってきた暫定1位の座から最終日に転落しての2位」という悔しさと、この2カ月強にわたる競技の緊張からの解放感と、「やれるだけのことはやった」という達成感と、やりきれなかった分析についての後悔と、とにかくみな、それぞれに疲れた顔をしていました。

写真:KDD Cup 2015の授賞式で笑顔を見せる今回のメンバー写真:KDD Cup 2015の授賞式では笑顔を見せたチームのメンバー

データ分析競技は2〜3カ月をかけて開催される

 筆者らが第2位に入賞したKDD Cupは、データ分析競技の元祖といえる大会です。コンピュータ科学分野の国際学会であるACM(Association for Computing Machinery)のデータ分析の分科会「SIGKDD(Special Interest Group on Knowledge Discovery and Data Mining)」が毎年主催する国際会議「KDDカンファレンス」とともに開催されます。毎回、世界的な企業がスポンサーになりデータと課題と賞金を提供し、大学や企業の研究者など幅広い層の参加者を集めています(表1)。2015年は821チームが参加しました。

表1:KDDCupの過去5年間のスポンサー企業と課題表1:KDDCupの過去5年間のスポンサー企業と課題
拡大画像表示

 データ分析のコンペとして今、最も規模が大きく有名なのは「Kaggle(カグル)」というプラットフォームです。このWebサイトでは複数のコンペが日常的に開催されています。2015年10月時点で、世界中で約40万人が参加者としてアカウントを登録しています。最近では1つのコンペに1000人以上が参加することも珍しくありません。KDDCupも2012年から2014年は、このKaggleの上で開催されました。

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
登録済みの方はこちら

IT Leaders 雑誌版、電子版をご購読の方、会員登録済みの方は下記ボタンよりログインして続きをお読みください

初めての方はこちら

IT Leaders 会員になると
会員限定公開の記事を読むことができます
IT Leadersのメルマガを購読できます

【次ページ】データの後ろにあるビジネスを見ている
  • 1
  • 2
  • 3
  • 4
バックナンバー
データサイエンティストの思考法〜KDD Cup世界第2位の頭の中〜一覧へ
関連記事

Special

-PR-

データ分析競技という世界の実際と魅力【第1回】「ビッグデータ」「データサイエンティスト」といったキーワードとともに、データ分析が注目されています。しかし実際には「何をやれば良いのかよく分からない」「どんな人材を育てれば良いのか」という声を多々耳にします。筆者らのデータ分析チームは、「KDD Cup 2015」というデータ分析の国際大会で2位に入賞しました。本連載では、同大会でのデータ分析の中で分析者が何を思い、何を考え、何をしたのかを題材に解説します。私たちの思考の足あとを通して、読者の皆様にデータ分析とは何かを少しでも伝えられれば幸いです。第1回は、本連載の題材であるKDD Cupに代表されるデータ分析競技の世界を紹介します。

PAGE TOP