[新製品・サービス]

“情報爆発”の時代に向け、大規模データ検索のボトルネック解消へ

2009年3月23日(月)

データウェアハウス用システム HP Oracle Database Machine/日本オラクル “情報爆発”という言葉があるほど、大規模化する一方のデータ容量。それゆえ特にハイエンドの領域では、蓄積したデータの検索や分析は容易ではない。結果が戻るまでに数分、数十分以上の待ちが生じかねないからだ。この解決策として、日本オラクルは2009年1月20日、「HP Oracle Database Machine」など一連の製品を発表した。後発ゆえに機能や価格面を練り上げている。

「HP Oracle Database Machine」は、8台のデータ処理サーバーと、14台のストレージシステム「HP Oracle Exadata StorageServer」で構成する(図1)。基本コンセプトやソフトウェアをオラクルが、ハードウェアはヒューレット・パッカードが担っている。

図1 HP Oracle Database Machineの構成
図1 HP Oracle Database Machineの構成

Exadata Storage Serverはそれぞれ12基のディスク (1台の容量は最大1TB)を内蔵するので、Database Machineのディスク容量はシリアルSCSI型が75TB、シリアルATA型では168TBに達する。ただしユーザー・データ量はそれぞれ21TB、46TBである。

外部のサーバーとは高速性が特徴のネットワーク「InfiniBand Switch」で接続。サーバーとストレージシステム間のデータ転送ボトルネックを低減する。

製品の特徴

画像:Oracle Exadataの外観
写真 Oracle Exadataの外観

一般的なサーバー機とストレージ装置で構成するデータウエアハウス(DWH)では、検索時には、ストレージからは問合せの結果ではなく、データが格納されているブロックをサーバーに返す。ブロックから検索対象の行と列を特定するのはサーバー側の役割である。結果として、大規模DWHになればなるほど検索要求を処理する際にブロックごと、つまり無駄なデータの転送によるボトルネックが発生する。

これに対しDatabase Machineでは、1ストレージ側にプロセサを搭載して検索を実行することで転送データ量を最少化する、2検索処理を並列で行う、3サーバーとストレージ間通信の帯域を広げる、という3つのアプローチでボトルネックを減らしている。

1については、HP Oracle Exadata Storage Serverのソフトウエアに「Smart Scan」と呼ぶ機能を実装。ブロックではなく、対象データだけを転送できるようにした。2は「Oracle Database 11g」の標準機能である「Automatic Storage Management」を利用して、データをハードディスクに分散配置することで並列化する。

3については、「HP Oracle Exadata Storage Server」1筐体あたり1GB/秒のデータ転送帯域を確保。14台の筐体を合わせて14GB/秒の広帯域を利用できるようにした。

販売価格

価格は、HP Oracle Database Machineが7065万2200円(税別、以下同、Real Application Clustersなどのソフトは別売)。同Machineに14台内蔵されるHP Oracle Exadata Storage Serverは単体で販売され、価格は260万8700円。Oracle Exadata Storage Server Softwareが108万7000円。ハードウェアとソフトウェアを別々に販売することで、データが増えて拡張する際、ハードウェアの追加費用だけで済むようにしたという。実際、HP Oracle Database Machineはラックの追加でスケールアウトできる。

今後の方向性

データウェアハウス専用ハードとしては、日本テラデータや日本ネティーザがすでに製品化している。

日本テラデータのエントリー向けDWHアプライアンス「Teradata Data Warehouse Appliance 2550」は、異なるインデックスタイプを用意することで検索を高速化した製品。例えば、インデックスそのものをパーティションで区切り、検索データの範囲を絞り込める。限定した範囲だけを検索対象とするので高速に結果を返せる。

日本ネティーザのDWHアプライアンス「Netezza Performance Serverシステム」は汎用プロセサではなく、専用ユニット「SPU」により、ストレージ側で必要なデータ抽出を行う。さらに抽出したバラバラのデータをプロセサで集計してサーバーへ転送する。これによりサーバーの負荷を軽減する。

HP Oracle Database Machineをこれらと比べたとき、「オープンな技術を全面採用した。技術進化が専用品より早いメリットがある」(日本オラクル)。後発だけに、データ容量当たりの価格が安いのも特徴だ。加えてNTTデータとオラクルは2月に協業を発表。販売力が大幅に強化される。

ただ競合他社が、価格訴求力のある新製品を投入してくるのは確実。またオープンな技術を使っている以上、専用ハードを使わなくてもよくなる可能性もある。専用機は常に汎用サーバーに市場を奪われるのが、IT分野の常だったからである。

なお日本オラクルは今回の製品を「オラクル初のハードウェア製品」とするが、1996年にシン・クライアントの走りである「ネットワーク・コンピュータ」を提唱したことがある。今回同様にオラクルが基本コンセプトとソフトを、コンピュータ・メーカーがハードを受け持った。この点で、今回の製品は「オラクル第2のハード」という方が正しい。

表1 主要DWH向け製品の比較
ベンダー名 日本オラクル 日本ネティーザ 日本テラデータ
製品名 HP Oracle Database Machine Netezza Performance Server 5200 Teradata Data Warehouse Appliance 2550
概要 ハードウェアをHP、ソフトウェアをオラクルが担当して開発。ハード、ソフトともに汎用の技術、製品で構成するのが特徴。システム価格にソフトウェアは一切含まれない クエリーを処理する専用ユニット(SPU)を、ディスクの隣接に配置する独自の機構を採用。必要なレコードのみを抽出する方法で高速化 インデックス処理に工夫を凝らして高速化。大規模向けの5500シリーズもある。専業ベンダーとして長年の実績を持ち、金融、流通、通信などの大規模ユーザーを抱える
ソフトウェア Oracle Database 11g Enterprise Edition NPS Release 4.5 Teradata Database
ユーザー・データ容量 21TB(SAS)、46TB(SATA) 3TB 6.3TB
サーバー/ストレージ間のネットワーク帯域 InfiniBand(最大14Gbps) ギガビットイーサネット(1Gbps) イーサネット・ファイバチャネル・アダプタ(最大24Gbps)
価格 7065万2200円(税別) 4000万円~(税別) 8000万円~(税別)
関連記事

“情報爆発”の時代に向け、大規模データ検索のボトルネック解消へデータウェアハウス用システム HP Oracle Database Machine/日本オラクル “情報爆発”という言葉があるほど、大規模化する一方のデータ容量。それゆえ特にハイエンドの領域では、蓄積したデータの検索や分析は容易ではない。結果が戻るまでに数分、数十分以上の待ちが生じかねないからだ。この解決策として、日本オラクルは2009年1月20日、「HP Oracle Database Machine」など一連の製品を発表した。後発ゆえに機能や価格面を練り上げている。

PAGE TOP