[新製品・サービス]

大量データの処理に強みを持つEMCの「Greenplum」、製品ロードマップやデータ統合ソフトを発表

2011年8月22日(月)

EMCジャパンは2011年8月9日、DWH製品「Greenplum」に関する記者向け説明会を開催した。大量データを高速処理する仕組みや、今後の新製品投入時期について言及した。

説明会の冒頭、データ・コンピューティング事業本部 テクノロジー&プロフェッショナルサービス部の仲田聰部長は、「企業が保持するデータは、今後10年間で50倍に増加する」と指摘。こうした膨大なデータを分析/活用できるシステムの必要性を強く訴えた。

同社はそのための製品としてGreenplumを位置付ける。分析対象となるデータの違いから2タイプあり、構造化データを分析する「Greenplum DB」と、文書ファイルなどの非構造化データを分析する「Greenplum HD」を提供する。

Greenplum DBは、スケールアウトによりサーバーを追加する度に処理性能を高められる点が特徴だ。特にデータをロードする際の処理スピードを売りとする。「一般的なスケールアウト型DWHの場合、データ処理を担うセグメントサーバーにデータをロードする時に、データを振り分けるマスターサーバーに負荷が集中してしまう。Greenplum DBはデータの振り分けを複数のセグメントサーバーが分散処理するため、マスターサーバーのボトルネックを解消できる」(データ・コンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 テクニカル・コンサルタント 中村完氏)。専用サーバーではなく汎用的なサーバーを利用できることから、「他社のDWH製品より価格を抑えられる点もメリットである」(同氏)。

提供形態はソフトウェアのほか、ハードウェアを組み合わせたアプライアンス「Greenplum Data Computing Appliance(DCA)」を用意。2011年第4四半期には、SAS InstituteのBIソフトを搭載した「SAS High-Performance Analytics on Greenplum DCA」を発売する予定だ。

Greenplum HDはHadoopを用いた分散処理システムを構築するソフト。Javaで記述するHadoopをC言語で書き直したことにより、「Hadoopより処理性能を3~5倍高めた」(中村氏)。一方で「Hadoopとの互換性は100%である」(中村氏)とし、Javaで開発したHadoop用アプリケーションをGreenplum HD上で利用することもできる。

Greenplum HDとGreenplum DBを連携してデータを分析することも可能だ。Greenplum HDを用いて非構造化データの中から条件に見合うデータを抽出。そのデータをGreenplum DBが取り込み、構造化データと掛け合わせた分析を実施することもできる。Greenplum DBのデータロード機構により、大量データのやり取りも高速化する。

Greenplum HDは2011年第3四半期に発売する予定。Greenplum DB同様、ソフトウェアとアプライアンス「Greenplum HD DCA」を用意する。

なお同社は、仮想的にデータを統合するソフト「Greenplum Chorus」を2011年内に投入予定であることを発表した。ユーザーがポータル画面から必要なデータを収集して仮想データマートを作成する。IT部門に依頼せずとも必要なデータを調達できることから、迅速な情報活用が可能となる。対象となるデータソースは「Greenplum DB」のみだが、今後はオラクルやテラデータなどをサポートする予定。

関連記事

大量データの処理に強みを持つEMCの「Greenplum」、製品ロードマップやデータ統合ソフトを発表EMCジャパンは2011年8月9日、DWH製品「Greenplum」に関する記者向け説明会を開催した。大量データを高速処理する仕組みや、今後の新製品投入時期について言及した。

PAGE TOP