データマネジメント データマネジメント記事一覧へ

[データマネジメント2014]

オープンソースでビッグデータ統合を実現、データに基づいた経営でビジネスを変える

データマネジメント2014注目講演:Talend

2014年5月12日(月)

データを高度に活用した意思決定が急がれている。しかし、静的データだけでなく動的データも取り扱い、さらには非構造化データまで対象を広げた途端に、その量は膨大となって複雑化し、品質は不安定になる。フランス生まれのオープンソースベンダーであるTalendは、この課題解決に向けて多様なソースからデータを集め、整備・統合するソフトウェアを提供している。

ビッグデータ統合でビジネスが変わる
~データ活用のオープンソース戦略~

Talend株式会社 マーケティングディレクター 寺澤 慎祐 氏

 経営者が「知りたいこと」は、現在の実力(最も売れている商品)、将来性(今後、売り上げが伸びる商品)、確実性(何かがあると必ず売れる商品)、着実性・安定性(いつも一定して売れる商品)、一過性・断続性(時々よく売れる商品)の5つに集約される。

 売上高で年率128%の急成長を遂げているオープンソース企業のTalendは、「ビッグデータインテグレーション」によってこのニーズに応え、データに基づいた経営(データドリブン経営)を支援・実現していくことをミッションに事業を展開している。

 同社マーケティングディレクターである寺澤慎祐氏は、そこで核となるデータ統合について「データの収集から意思決定までのプロセスを、次の一手までつなげてオートメーション化する技術」と定義すると共に、次の3つのキーワードを示した。

 第1は「リアルタイム」で、スナップショット(静的)データだけでなく、ストリームされるリアルタイムなデータも統合の対象とする。第2は「プログラマブル」であること。すなわち、データ統合にまつわる分析、ビジネスルール、モデル、アルゴリズムをすべてプログラミング可能とする。第3は「オートメーション」。第2のプロセスから得た情報をインテリジェンスに変換し、さらに次のシステムに渡し、あらかじめ決められたアクションを適宜実行する。

多種多様なデータソースとつなぐ500以上のコンポーネントを提供

 Talendは、データおよびアプリケーションの統合からテスト、デプロイまで一連の管理を担うGUIベースの開発環境として「Talend Studio」を提供している。ここからノンプログラミングで生成されたJARファイルによって、多様なデータソースからのインプットならびに、多様なシステムへのアウトプットをコントロールする仕組みだ。

 「Talend Studioで生成されたJARファイルは、JREやMapReduceはもちろん、業界初で唯一、Talendが対応した「YARN」上でもネイティブに動作し、データ統合エンジン、データクレンジング、ビッグデータインテグレーションを、分散環境において圧倒的なスピードで実行できる」と寺澤氏は強調する。

 ちなみにYARNとは、Hadoopを構成するMapReduceとHDFSの間に入る汎用的なフレームワークである。これにより、MapReduceに準拠していないデータモデルも対象とした、幅広いアプリケーションをHadoop上で実行することが可能となった。さらに、従来のMapReduceで利用できる分散サーバーのノード数が4000程度だったのに対して、YARNは約1万にまでノードを拡大できる。

 データの取り扱いもシンプルになる。「高速な分散処理技術としてHadoopへの期待が高まっているが、MapReduceを使えるエンジニアはまだまだ不足しているのが実情。Talendは、Hadoopのほか各種のNoSQLデータベース、各ベンダーの分散処理技術など、先進テクノロジーを容易に活用できるAPIを提供する」(寺澤氏)。

 ここで活きてくるのが、同社がOSSをベースに推進しているオープンビジネス戦略だ。Talendならびにコミュニティで開発された各種データソースを扱うコンポーネントは500以上を数える。今後登場してくるデータソースについても、即座にコンポーネントが開発され、オープンソースとして提供される。

 様々なシステムの構成図や概念図、フローチャートを記述する際、モジュール間を「矢印」でつなぐのが通例。「Talendは、まさにその部分にフォーカスした『矢印ベンダー』として、ビッグデータインテグレーションを支援していく」と寺澤氏は締めくくった。


問い合わせ先
Talend株式会社
http://jp.talend.com/
 

バックナンバー
データマネジメント2014一覧へ
関連記事

オープンソースでビッグデータ統合を実現、データに基づいた経営でビジネスを変えるデータを高度に活用した意思決定が急がれている。しかし、静的データだけでなく動的データも取り扱い、さらには非構造化データまで対象を広げた途端に、その量は膨大となって複雑化し、品質は不安定になる。フランス生まれのオープンソースベンダーであるTalendは、この課題解決に向けて多様なソースからデータを集め、整備・統合するソフトウェアを提供している。

PAGE TOP