データマネジメント データマネジメント記事一覧へ

[データマネジメント2018]

データがもたらす、破壊的パワーをその手に──デジタル変革時代のデータプラットフォームとは

2018年4月5日(木)

デジタルトランスフォーメーションの鍵を握るデータ活用。ビジネスにおける新たな付加価値を生み出すためのデータ活用を実現していくためには、社内外に散在する複数のアプリケーションから生成されるデータを統合的に収集、管理するともに、ユーザーに対してタイムリーに配信、分析に利用してもらえるような基盤の整備が急務だ。「データマネジメント2018」のセッションでは、インフォマティカ・ジャパンの久國淳氏により、MDMやデータ統合ハブ(Data Integration Hub)、そしてデータレイクを含めた包括的なデータプラットフォームの最新像が語られた。

データ3.0時代を迎え、データハブの役割がますます重要に

インフォマティカ・ジャパン株式会社 セールスコンサルティング部 ソリューションアーキテクト エバンジェリスト 久國淳氏

 「データ3.0」の時代を迎え、企業はビジネスモデルを変革するデジタルトランスフォーメーションのためのデータ活用が急務となっている。その一方で、ビッグデータやIoT、クラウドの浸透に伴い、データ活用のための基盤も肥大化と複雑化の一途を辿っており、今、改めてデータマネジメントの重要性がクローズアップされている。

 異なるシステム上に散在するデータを一元的に収集、タイムリーなユーザーへの配信はもちろん、データ品質の担保と粒度の均一化、さらには信頼性、安全性の担保など、データ活用のための課題は山積みだ。

 そうした問題の解決策として注目を集めているのが、データハブである。多種多様なシステム間のデータ連携を一元化、適切なデータを収集、配信するとともに、その品質やセキュリティも担保することで、企業のデータ活用を支援するものだ。

Data 3.0:デジタル変革時代のデータアーキテクチャー
拡大画像表示

 しかし、マスターデータの中央管理をはじめ、ODS(Operational Data Store)やDWH(Data Warehouse)も包含したデータストアの実現、さらにはBIやAIを用いたアナリティクスも可能な、データ活用に関するすべての要件を満たす“夢のドラム缶”とも言えるようなデータハブを実現することは、ほぼ不可能であるのも事実。

 インフォマティカ・ジャパン セールスコンサルティング部 ソリューションアーキテクト エバンジェリストの久國淳氏は、「したがって、データハブの構築にあたっては、機能配置を分けて考えることが必要だ。データハブは大きく、データ統合ハブ(Data Integration Hub)、マスターデータ管理(MDM)、データレイク管理の3つの機能に分けられる。インフォマティカもこれらのコンポーネントを製品別に提供している」と強調する。

データハブの役割と機能配置
拡大画像表示

データハブを構成する3つの機能

 データハブを構成する3つの機能と、求められる要件について説明していこう。

①データ統合ハブ(Data Integration Hub)

 はじめに、データ統合ハブにはクラウド、パッケージソフトウェア、ホストアプリケーション、アナリティクスを問わず、データを収集し配信する接続性が求められる。また、従来のファイル連携やETLのようにデータを直接に個々のシステムに渡すのではなく、ハブを介してデータを入手する「ハブ&スポーク」を実現するための、Publish/Subscribeモデルによるデータ集配信機能が必要だ。

 このほか、ニアリアルタイムから定常バッチまで、データの受け渡しに関わるタイミングや頻度の要件を吸収する機能や、データのライフサイクルの自動管理、モニタリングのための運用管理機能も求められる。

②マスターデータ管理(MDM)

 マスターデータ管理の主たる役割は、アプリケーションに依存することなく、データレイヤにおいて、すべからく拠り所になることにある。

 「データはアプリケーションごとにコード体系も粒度も名称も違う。それらのデータを収集、必要なら名寄せをして紐づけながら、どのマスターが自社にとって一番正しく、最新で、かつ信頼できるのかMDMで担保していく。アプリケーションに依存しない形でマスターデータを管理するのが役割を担っており、そのためにもマスターメンテナンス、登録・更新・削除機能、そのためのワークフローも必要となる。加えて、名寄せやレポートの生成、異なる仕様のデータをお互いに翻訳できる変換テーブル、そして履歴やリレーション機能も求められる」(久國氏)。

③データレイク管理

 そして、3つ目のデータレイク管理は、データ、バイナリオブジェクトファイル、非構造化ファイル等を蓄積し、データサイエンティストが活用したいタイミングで利用できる状態に維持する役割を担う。

 「ここで重要な機能がデータカタログだ。これは、データレイクを含めた複数のシステムを横断しデータをカタログ化して、“どこにどんなデータがあるのか”ユーザーが自分で探せるようにするものだ」と久國氏は説明する。さらには見つけ出したデータを加工したり、ビッグデータに対応した大規模データ統合処理を行ったり、リアルタイムでのストリーム処理を行うといった機能を提供するものだ。

 「これだけの機能を1つのドラム缶に詰め込むのは至難の業。しかし、これらの機能配置をしっかり分けて、必要なタイミングで連動させることで、夢のドラム缶を実現できる」(久國氏)。

データハブは小さく始めて、大きく素早く育てる

 久國氏によれば、今、もっとも企業からの引き合いが多いのはデータレイク管理だという。

 「中でも、デジタルトランスフォーメーションが大きなドライバとなり、データカタログがデータマネジメントとアナリティクスの新潮流として、全世界的で注目を集めている。ユーザーがデータを活用していくためには、データ資産管理や分析機能、データガバナンスが求められるが、データカタログはそうした様々な要件に対応することができるからだ」(久國氏)。

データレイク整備の目的と、実現のための3つの柱
拡大画像表示

 セッションを総括して、久國氏はデータハブ構築のポイント次のようにまとめた。

  1. データハブは詰め込み過ぎないよう、機能と要件に分けて考える。そして、本当に何が必要なのか優先順位を設定し、どこから着手するのかしっかり整理する。
  2. データカタログは世界的なトレンドとなっており、投資判断の面からも今こそが整備するための絶好のタイミング。上層部に対して、ビジネス変革に向けた攻めのデータ活用を行うにあたってデータカタログは必要不可欠という提言がしやすい。
  3. データハブの構築は大きく考える一方、小さく始めて早く育てていくことが重要。素早い展開と将来的な拡張性を担保するためのテクノロジーとして、インフォマティカではクラウドベースのサービスも提供している。

 「まずはクラウド上にデータレイク基盤を用意してスモールスタートし、成果が出たならば、順次拡張していけばよい。拡張性のある基盤上でデータ活用を進めながら、将来的な自社が理想とするデータアーキテクチャについても構想して頂きたい」と久國氏は強調し、セッションを締めくくった。


●お問い合わせ先

インフォマティカ・ジャパン株式会社
URL: http://www.informatica.com/jp/
TEL:03-6403-7600
E-mail:info-jp@informatica.com

バックナンバー
データマネジメント2018一覧へ
関連記事

Special

-PR-

データがもたらす、破壊的パワーをその手に──デジタル変革時代のデータプラットフォームとはデジタルトランスフォーメーションの鍵を握るデータ活用。ビジネスにおける新たな付加価値を生み出すためのデータ活用を実現していくためには、社内外に散在する複数のアプリケーションから生成されるデータを統合的に収集、管理するともに、ユーザーに対してタイムリーに配信、分析に利用してもらえるような基盤の整備が急務だ。「データマネジメント2018」のセッションでは、インフォマティカ・ジャパンの久國淳氏により、MDMやデータ統合ハブ(Data Integration Hub)、そしてデータレイクを含めた包括的なデータプラットフォームの最新像が語られた。

PAGE TOP