[海外動向]

【PARTNERS 2014報告】米eBayの100PB超のデータ分析など最新ビッグデータ活用事例が続々

2014年10月28日(火)田口 潤(IT Leaders編集部)

米国ではデータを分析し、経営や事業に生かすことが常識になっているのかも知れない。それも人事や会計、生産管理といった定型業務とほぼ同じレベルで業務に溶け込んでいる−−。2014年10月下旬に開催されたカンファレンス「PARTNERS 2014」(主催は米テラデータのユーザー組織)に参加し、数々の事例に触れる中で、その思いは確信に近いものになった。

 データ分析が米国では業務に溶け込んでいると考える理由の1つは、「PARTNERS 2014」の参加者数は4000人を超え(前年は3600人)、金融や流通、サービス、製造、公共など様々な業種の企業・組織が集まっていること。データウェアハウス(DWH)の老舗とは言え、米テラデータ1社のユーザーカンファレンスに、10万円以上の費用を支払って参加する人がこれだけいる。

 より大きな、もう一つの理由は、事例発表の内容だ。確実なROI(Return of Investment:投資対効果)を見込んで実際に達成したとか、コスト低減を実現したという発表ばかりではない。むしろ「データがある以上、あらゆる技術を動員して分析や活用に取り組むのは当たり前。その結果として成果を生み出せれば御の字」といった姿勢を感じるものが多かった。

 底流には、ある種の“不安”や“恐れ”があるかのようだ。消費者向けビジネス(B2C)を主体とする企業はもちろん、B2Bの企業もデジタル時代の波に洗われ、日々変化する状況に対応を迫られている。状況を詳細に把握したり競合他社に先んじてサービスを洗練させたりして、顧客へのエンゲージメント(関与)を強めないと生き残りが危うくなる−−そんな印象だ。

写真1:事例発表セッション会場。写真は、千趣会マーケティング部の西口浩司 戦略顧客チーム・マネージャー。日本企業の発表にしては外国人の聴講者が多かった写真1:事例発表セッション会場。写真は、千趣会マーケティング部の西口浩司 戦略顧客チーム・マネージャー。日本企業の発表にしては外国人の聴講者が多かった
拡大画像表示

 前置きが長くなった。以下では、PARTNERS 2014で発表された取り組み事例を紹介する(写真1)。「規模が大きいだけでは」とか「技術的には先進的かもしれないが、成果はどうなのか」といった疑問が出るかも知れない。そこには上記のような背景があることを考慮いただきたい。

 人、モノ、コトのすべてがデジタル化され、つながるIoT(Internet of Things:モノのインターネット)時代を迎える中で、データの分析・活用がなくてはならない業務に位置づけられつつある。

事例1:eBay
総計100PBを上回るデータを3つのシステムで分析

図1:eBayが分析用途に持もつ3つのデータプラットフォーム図1:eBayが分析用途に持もつ3つのデータプラットフォーム
拡大画像表示

 オンラインマーケットプレイスの運営企業であり、特にインターネットオークションでは世界最大の米eBay(2013年の売上高は1兆8000億円弱)。同社が「Extreme Analytics @ eBay」と題して講演した。そのデータ分析プラットフォームは“Extreme(究極の、並外れた)”と呼ぶにふさわしいものだ(図1)。

 eBayの分析システムは、構造化データのための企業データウェアハウス(EDW)と、半構造化(Semi-structured)データを扱う「シンギュラリティ」と呼ぶシステム、それに非構造データのためのHadoopシステムからなる。扱うデータ量は、それぞれ15PB(最大27PB)、36PB(同42PB)、50PB(同90PB)と、想像を超える規模ある。増加量もすさまじく、毎年40〜100%で伸びているという。

 もはやビッグデータではなくエクストリームデータだ。その理由を同社のアーキテクチャー担当上級技術スタッフであるTom Fastner氏は、こう話す。

 「世界中に1億5000万人の顧客がいます。当社のサイトに、いつ誰が来てどれだけの時間を費やしたか、サイト上のどの項目をどんな順番で閲覧したか(クリックストリーム)などを、すべての顧客について把握しています。顧客の次回の買い物を、常により良くするのが目的です」

 講演では3つのシステムの用途に言及した。EDWは定型レポートやキャンペーンの効果把握などに利用する。「150から200人が同時にアクセスします」。

図2:eBayの「シンギュラリティ」の使用例図2:eBayの「シンギュラリティ」の使用例
拡大画像表示

 シンギュラリティの実体は、ストレージ容量の多さを重視したTeradataシステムである。クリックストリームを蓄積し、いわゆる「ABテスト」を実施して、サイトを日々改良するのに使用している。ABテストは、例えば文字の色をAとBの2種類用意し、どちらがより多くクリックされるかを調べるものだ(図2)。

図3:eBayにおけるHadoopの使い方図3:eBayにおけるHadoopの使い方
拡大画像表示

 最後のHadoopにはWebサイトの画像データやそれに紐付けたクリック数、あるいはEDWから送られる購入履歴データを蓄積する。そこでは例えば、画像の質が販売にどのように影響するかを調べている(図3)。結果はどうかというと「質と販売には強い関係があることが分かりました」(Fastner氏)。そのうえで、プラットフォーム運営者であるeBayとしては「劣悪な画像を掲載している出品者には連絡し、修正を依頼します」(同)。

関連記事

【PARTNERS 2014報告】米eBayの100PB超のデータ分析など最新ビッグデータ活用事例が続々米国ではデータを分析し、経営や事業に生かすことが常識になっているのかも知れない。それも人事や会計、生産管理といった定型業務とほぼ同じレベルで業務に溶け込んでいる−−。2014年10月下旬に開催されたカンファレンス「PARTNERS 2014」(主催は米テラデータのユーザー組織)に参加し、数々の事例に触れる中で、その思いは確信に近いものになった。

PAGE TOP