[海外動向]

【PARTNERS 2014報告】米eBayの100PB超のデータ分析など最新ビッグデータ活用事例が続々

2014年10月28日(火)田口 潤(IT Leaders編集部)

米国ではデータを分析し、経営や事業に生かすことが常識になっているのかも知れない。それも人事や会計、生産管理といった定型業務とほぼ同じレベルで業務に溶け込んでいる−−。2014年10月下旬に開催されたカンファレンス「PARTNERS 2014」(主催は米テラデータのユーザー組織)に参加し、数々の事例に触れる中で、その思いは確信に近いものになった。

図4:eBayの在庫管理の難しさ図4:eBayの在庫管理の難しさ
拡大画像表示

 出品される商品を分類して体系的に整理することもHadoopで行っている。「例えば“ピンク”という文字が何を意味するのか。色かアーティスト名か、それともブランド名なのかは出品者に依存します」(Fastner氏)。これを放置すると「ピンク」で検索した際に異なる種類の商品が表示され、探しにくくなってしまう。「これを避けるためにクラス化は必須です」。

図5:eBayのDataHub上のUI画面図5:eBayのDataHub上のUI画面
拡大画像表示

 当然だが、3つのシステム間のデータ統合には工夫している(図5)。「分析に詳しくない社員、例えば財務の担当者が簡単な操作で使える、それも3つのすべてを使える仕組みがあります。またデータをバラバラに管理するとコストやスピードで損失につながるのでデータハブも用意しています」。

 それでも急ピッチでデータが増加するだけに「クリーンなデータを作るために分析作業の8%が費やされます」と語る。これがeBayが抱える大きな課題とのことだ。Fastner氏は「課題を減らし、データ活用を進めるために、分析の基本原則を作りました。分析は企業内のエコシステムそのものです。我々は3つのプラットフォームを持ち、それらを統合していきます」と締めくくった(図6)。

図6:eBayのアナリティクス指針図6:eBayのアナリティクス指針
拡大画像表示

 図6にある10原則のうち9番目の「Fail Fast」は、基調講演を含め、複数のセッションで何度も語られた言葉である。「失敗を恐れるべきではない。ただし遅くなれば痛手も大きくなるので、早い段階で失敗すること。そのために分析(や関連技術、手法)を活用せよ」といったニュアンスだ。

事例2:Dell
ITとビジネスの融合を目指せ!3層から成るBI環境を整備

 パソコン/IAサーバー大手の米Dellによる講演は「IT/Business Collaborative Multi-Tier BI Environment using Teradata UDA」。やや抽象的だが、平たく言えば、ビジネス(事業部門)が本当の意味で使えるBI環境の必要性を提唱し、その具体像としてDellの実践例を示したものだ。

 「IT部門はIT基盤の統制やシステムの機能を提供してきました。それを転換し、ビジネスの変革/イノベーションの支援が求められます。そのために市場で何が起きているのか、問題は何かを、事業部門が自ら認識する環境が必要です。事業部門が使える、進んで使いたくなるBI環境が必要なのです」(同社IT LeadersストラテジストのAnand Lakshmanan氏)というわけである。

図7:Dellの3層データ分析基盤図7:Dellの3層データ分析基盤
拡大画像表示

 そのためにDellが構築したシステムは3層から成る(図7)。最上位層は、ITが統括し、事業部門の日々の業務を支える「プロダクション(完成品)」。きちんと予算化して構築する定型的なデータ分析のほか、アドホックなデータマイニングを支援するBI環境である。

 対極にあるのが事業部門が自由に使える「Sandbox(砂箱、砂場)」だ。永続的ではなく、思いついたことを試せる場である。Sandboxの仕組みやインフラはIT部門が提供し、利用を事業部門に任せる。最後が両方の中間に位置する「Semi-Prod(半完成品)」。Sandboxで有用性が明らかになった分析をProductionにするための中間的な環境に位置付ける。

図8:Dellにおけるマーケティング分析ワークベンチ図8:Dellにおけるマーケティング分析ワークベンチ
拡大画像表示

 使いやすさはどうか?Dellでは「Marketing Analysis Workbench(MAW)」と呼ぶUIを用意している(図8)。利用者に意識させることなく、3層のBI環境をシームレスに使えるようにするものだ。

 「ビジネスでは俊敏性が大事。PoC(効果検証)の時間を極力短くする必要もあります。Production層はそれには向きませんから、Sandboxが必要です。これとMAWによって”Fail Fast”の実施が可能になりました」。

図9:DellにおけるUDA(ユニファイド・データ・アーキテクチャー)を利用した3層アーキテクチャー図9:DellにおけるUDA(ユニファイド・データ・アーキテクチャー)を利用した3層アーキテクチャー
拡大画像表示

 テラデータが提唱するUDA(ユニファイド・データ・アーキテクチャー)に基づくため、構造化データも非構造化データも分析できるという(図9)。「3層のアーキテクチャーによって、事業部門にBIが根付きつつあります。仮説に基づき、様々な分析をしてみるユーザーが増加し、Webサイトのストリームデータを参照する試みも増えています。Sandboxを使った事業部門独自のプロジェクトも65件に上ります」。

関連記事

Special

-PR-

【PARTNERS 2014報告】米eBayの100PB超のデータ分析など最新ビッグデータ活用事例が続々 [ 2/3 ] 米国ではデータを分析し、経営や事業に生かすことが常識になっているのかも知れない。それも人事や会計、生産管理といった定型業務とほぼ同じレベルで業務に溶け込んでいる−−。2014年10月下旬に開催されたカンファレンス「PARTNERS 2014」(主催は米テラデータのユーザー組織)に参加し、数々の事例に触れる中で、その思いは確信に近いものになった。

PAGE TOP