[新製品・サービス]

「ビッグデータは“量”ではない」~テラデータ・コーポレーション CTO スティーブン・ブロブスト氏

2012年3月14日(水)

2012年3月8日、日本テラデータはデータウェアハウスをテーマとしたカンファレンス「Teradata Universe Tokyo 2012」を開催した。IT Leadersは、同イベントに合わせて米国から来日したテラデータ・コーポレーションのCTOスティーブン・ブロブスト氏にインタビューし、「ビッグデータ」の本質について意見を聞いた。(聞き手は本誌編集長 田口潤)

「ビッグデータ」を巡る議論が盛んだが、大量のデータを扱う手段は今までも存在していたはず。昨今のブームにはやや疑問を感じる部分がある。

その指摘は的を射ている。テラデータは長年、データの増加に対応してきた。“量”だけの変化であれば新しい言葉をわざわざ持ち出す必要はない。ビッグデータとは“インタラクションデータ”と言いかえることができる。“トランザクションデータ”が生まれる過程で発生する詳細なデータのことだ。

例えば、ある人が別の人に電話を掛けたとしよう。料金請求システムは“誰が誰と何分間通話したか”という事実だけを記録する。しかし、通話を管理するシステムはネットワーク接続の確立から、基地局間あるいはプロバイダー間での通信の転送、そして切断にいたるまであらゆる事実を記録している。

オンラインショップでも同じだ。我々が普段関心を寄せるのは商品名や個数、金額や割引率などを記録した購入データだろう。しかし、アプリケーションのログには消費者が購入に至るまでにたどった道のりが、クリック1つひとつのレベルで記録されている。それらの活用がビッグデータの本質だ。

粒度が細かい分、インタラクションデータのサイズは大きくなる傾向にあるが、それは付随する性質に過ぎない。ある企業のインタラクションデータが、別の企業のトランザクションデータよりも小さい可能性もあり得る。それでもトランザクションデータをビッグデータとは言わない。

重要なのはデータの「質」であって「量」ではない。

その通りだ。同様に誤解されやすいのが「非構造化データ」という言葉だ。RDBMSの技術者の中には“リレーショナルでなければ構造化データとは呼ばない “と言わんばかりの人々もいるが、KVSもXMLもちゃんと構造を持っている。正確には「非リレーショナル」と呼ぶべきだろう。

ビッグデータ、つまりインタラクションデータの活用にはリレーショナル以外のデータ構造を扱うための技術、いわば“多様性に対するキャパシティ”が必要になる。それこそが“量”以上に重要なビッグデータの課題であり、われわれは買収という形でそのための技術を揃えてきた。

例えば、MapReduce技術。ビッグデータを処理するための重要な技術だ。ただし、Apache HadoopはJavaやC++のプログラマーでしか使いこなせない。そこで米アスターデータ社を買収。データアナリストがSQLを使って MapReduceを操作する環境を提供できるようにした。

BIの活用すらままならない状況で今度はビッグデータだという。困惑するユーザーは少なくないはずだ。どちらに取り組むべきか。

流行り言葉に惑わされず、期待できるビジネス的な価値に注目すべきだ。自分達のビジネスについて何を変えるべきか、何を得るべきかを議論する。その上で、コストとバリュー、取り組みやすさの観点からやるべきことを優先順位付けする。そして上位のものから取り組むと良いだろう。

その過程でビッグデータ活用が必要になる可能性もないではないが、実際には従来のデータの枠でコストもリスクもなくできることがあるはずだ。もちろん、新しい技術に取り組むことは重要だ。今後の新しいビジョンは示していくが、今までのBIから得られるものは非常に多いはずだ。

ビッグデータ活用の成功例を紹介してほしい。

金融だと顧客体験の向上に活用している例がある。伝統的な銀行では預金やクレジットカード、不動産ローンなど部門ごとに縦割りになっていて、顧客情報も分散している。そこに横串を差して顧客と銀行全体の付き合いを捉える。顧客との取引において各サービスがどのように相互に影響しあっているか、顧客との各接点が売上にどの程度貢献しているかを把握する。バンクオブアメリカやウェルスファーゴなどが取り組んでいる。

リスク管理も成功事例の1つと言える。これまで金融機関はビジネスごとにリスク管理担当部門を置いていたが、最近は全部門を総合的に見るCRO(Chief Risk Office)を設ける動きがある。それに伴い、各部門に分散したリスク情報を一カ所にまとめて総覧する環境が必要になった。ロイズやHSBCではサイロ化したシステムをまとめるためにテラデータのDWHを使っている。

米国においてビッグデータはどのようなフェーズにあると考えるか?

普及期の一歩手前、“キャズム”の段階にある。現在、実際にビッグデータを活用しているのは、テクノロジーをビジネスの糧とするWeb系の企業。 “アーリーアダプター”とよばれる企業でも、今のところ調査会社のレポートを購入し、イベントに人を派遣する“数千ドルの投資”にとどまっている。

今後、ビッグデータ活用が本格的に普及するためには、非テクノロジー系の企業、例えば、銀行や通信などの企業に浸透する必要がある。まさに“キャズム”を超えるための手助けを行っているところだ。

関連記事

「ビッグデータは“量”ではない」~テラデータ・コーポレーション CTO スティーブン・ブロブスト氏2012年3月8日、日本テラデータはデータウェアハウスをテーマとしたカンファレンス「Teradata Universe Tokyo 2012」を開催した。IT Leadersは、同イベントに合わせて米国から来日したテラデータ・コーポレーションのCTOスティーブン・ブロブスト氏にインタビューし、「ビッグデータ」の本質について意見を聞いた。(聞き手は本誌編集長 田口潤)

PAGE TOP