データマネジメント データマネジメント記事一覧へ

[技術解説]

充実するデータマネジメントツールとサービス Part05

2010年11月16日(火)

現状把握や名寄せなどを効率化 ツールとサービスの選択肢広がる データマネジメントで必要となる作業や検討すべき項目は多岐にわたるが、特に注目すべきはデータの品質の維持管理だ。データの現状を把握したり、保有するデータをきれいにする際の作業負荷軽減を目的に、各ベンダーは支援ツールを充実させている。品質管理に関するコンサルティングやアウトソーシングサービスと併せ、現状をまとめる。

データ品質維持に有効なツールのうち代表なものは、(1)「データプロファイリング」、(2)「データクレンジング・名寄せ」、(3)「マスターデータ統合」、(4)「データモデリング」の4つだ。「データ品質の維持管理にかかる時間やコストの削減を目的に、ツールを利用するユーザー企業は確実に増えてきている」(日本IBMの中林 紀彦テクノロジー・エバンジェリスト)。以下、それぞれの製品について見ていこう。

1. データプロファイリング
分散データの現状を把握
メタデータ管理の統合進む

データプロファイリングツールは、データの現状把握を支援するツールである。オープン化の進展でシステムが企業内に分散した結果、全体像が見えにくくなったデータの現状を可視化し、効率的に把握するのに役立つ。データベース管理システムなどからデータを取り込み、データに含まれる値の最大値・最小値や、値が存在しないことを示す「NULL値」の存在率などを集計する。分析結果はグラフや表で視覚的に把握できる(図5-1)。

図5-1 データプロファイリングツールは、データに含まれる不適切な値の含有率などの分析を効率化できる
(写真はアグレックスの「TS Discovery」)
図5-1 データプロファイリングツールは、データに含まれる不適切な値の含有率などの分析を効率化できる

最近では、データの各項目の意味や、どのシステムで生成されたか、どのシステムで加工されたかなど、データに関する情報を管理する「メタデータ管理」機能を統合させる動きが活発だ。SAPジャパンは2011年初頭に、同社のデータプロファイリングツール「SAP BusinessObjects Data Insight」とメタデータ管理製品を統合した「Information Steward(仮称)」という製品を出荷予定だ。「変更履歴まで含めて、データの現状を把握したいというユーザー企業の声の高まりに応えた」(山澤 雅史グループリーダー)。日本IBMやTalendのツールもメタデータ管理機能を含む。

2. データクレンジング・名寄せ
標準化や同一データの特定
辞書内容や手法に個性

データクレンジング・名寄せツールは、データの表記の統一や標準化、類似データの突き合わせなどを自動実行する。「2100年1月1日生まれ」といった未来日付の生年月日や、存在しない会社名など明らかに間違ったデータを除いたり、同じ人物と見られる複数の顧客データに同一のIDを付与したりといった機能を持つ。

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
登録済みの方はこちら

IT Leaders 雑誌版、電子版をご購読の方、会員登録済みの方は下記ボタンよりログインして続きをお読みください

初めての方はこちら

IT Leaders 会員になると
会員限定公開の記事を読むことができます
IT Leadersのメルマガを購読できます

関連記事

充実するデータマネジメントツールとサービス Part05現状把握や名寄せなどを効率化 ツールとサービスの選択肢広がる データマネジメントで必要となる作業や検討すべき項目は多岐にわたるが、特に注目すべきはデータの品質の維持管理だ。データの現状を把握したり、保有するデータをきれいにする際の作業負荷軽減を目的に、各ベンダーは支援ツールを充実させている。品質管理に関するコンサルティングやアウトソーシングサービスと併せ、現状をまとめる。

PAGE TOP