[海外動向]

【PARTNERS 2014報告】「Data Lakeに対応せよ」米テラデータの新製品と新技術の面白味

2014年10月30日(木)田口 潤(IT Leaders編集部)

ビッグデータからData Lake(データの湖)へ、そしてAnalytics3.0へ−−。こんなデータアナリティクスのこれからが、米テラデータ(Teradata)のユーザー企業組織が主催するカンファレンス「PARTNERS 2014」で明らかにされた。同カンファレンスで紹介されたテラデータの最新ソリューションを紹介する。Data Lakeに挑むITの姿を象徴しているからだ。

図3:Teradata Loomの「Lineage(家柄、系統)」機能の処理例図3:Teradata Loomの「Lineage(家柄、系統)」機能の処理例
拡大画像表示

 Teradata Loomは、ファイルの履歴を管理できるようにする「Lineage(家柄、系統)」機能を備える。あるファイルの元ファイルは何か、何で加工されたかなどを把握できるようにする。図3は「Books」というファイルが「Books_clean」という処理でどう生変われているかを示した画面である。何らかのシステムエラーに備えて2重3重のコピーが生成されるクラウド環境では、なくてはならない機能かも知れない。

図4:「Connection Analytics」による可視化の例図4:「Connection Analytics」による可視化の例
拡大画像表示

 「膨大なデータをどんなふうに活用すればいいのか。何らかの具体例がないと、着手できない」−−。こんな声があったのかどうかは分からないが、Teradata Asterの拡張機能として発表した「Connection Analytics」は、そうした声に応えるためのものだ。人やマシン、製品、プロセスなどに関する大量のデータから、内在する隠れた関係性や相互の影響度合いを分析し、例えば図4のように視覚化する。このグラフからドリルダウンすることも可能だ。

図5:「Connection Analytics」のアルゴリズム図5:「Connection Analytics」のアルゴリズム
拡大画像表示

 Connection Analyticsは、「機械学習や自然言語処理など100以上のアルゴリズムを用いて開発した」(同社)仕組みで、大量の生データを分析するための手がかりを提供する(図5)。想定する用途を聞くと、「様々あるが、例えば通信履歴や電子メールの履歴から人や組織の関係を発見できる。大量の銀行口座と振り込み人のデータを分析すれば不正の兆候を発見できる」という回答だった。

 Teradataの性能チューニングについても発表された。まず次期Teradataに「Intelligent Memory」と呼ぶメモリー管理の仕組みを実装する。データのアクセス頻度を把握し、頻繁にアクセスされるデータを、主メモリー上に留めるのが役割だ。

 一見、キャッシュメモリーに似ているが、キャッシュは直近にアクセスされたデータを残すのに対し、Intelligent Memoryはアクセス頻度を軸にデータを残す点が異なる。テラデータは「データの温度管理」と称し、SSDやHDDに配置するデータを、この方法で管理する仕組みを提供してきた。これをメモリーにも適用する。

図6:「Intelligent Memory」では、CPU側でもデータを処理することでも高速化を図る図6:「Intelligent Memory」では、CPU側でもデータを処理することでも高速化を図る
拡大画像表示

 加えて最も高速なCPU内でデータを処理する(図6)。同社CTO(Chief Technology Officer:最高技術責任者)のStephen Brobst氏によれば「米IntelとCPUの最適化を図っている。データ操作専用の命令セットを組み込む」 。データ量の級数的に増加に伴いData Lakeも大きくなる。それに対処するため、「CPU、メモリー、ディスクの間のI/O(Input/Output)を減らす技術を開発していく」という。

「Analytics 3.0」に向けた技術の方向を示す

 いかがだろうか?1つひとつの技術や製品は「あれば便利」とか「ちょっとした新機能」に留まるものに見えるかも知れない。それでも、漠とした印象のビッグデータという言葉をData Lakeという表現で現実に近づけ、そこにあるデータを高度な知識や技術なしで分析可能にする−−。そんなデータ分析技術の方向性を示す発表だと筆者は感じた。

 もっとも、ここまでの技術をユーザー企業が必要としているのかという疑問もあるかも知れない。

 この点については「Analytics 3.0」というキーワードを付記しておきたい。ビッグデータと構造化データを分けることなく分析し、顧客対応やマーケティングなど日常の業務プロセスに活かしたり、製品やサービスの開発、経営上の意思決定をサポートしたりすることを、そう呼ぶ。

 Analytics 3.0は、今はまだ現実的ではないにせよ、IoTの時代が進めば進むほど多くの企業が実践を迫られるはずだ。であるなら、テラデータの技術や製品を採用するかどうかはともかく、同社の技術や製品はウォッチしておくべきだと考える。

関連記事

Special

-PR-

【PARTNERS 2014報告】「Data Lakeに対応せよ」米テラデータの新製品と新技術の面白味 [ 3/3 ] ビッグデータからData Lake(データの湖)へ、そしてAnalytics3.0へ−−。こんなデータアナリティクスのこれからが、米テラデータ(Teradata)のユーザー企業組織が主催するカンファレンス「PARTNERS 2014」で明らかにされた。同カンファレンスで紹介されたテラデータの最新ソリューションを紹介する。Data Lakeに挑むITの姿を象徴しているからだ。

PAGE TOP