[新製品・サービス]

分析に必要なデータをセルフで調達できる“データカタログ”を構築せよ、日本IBMがアピール

2018年10月9日(火)日川 佳三(IT Leaders編集部)

日本IBMは2018年10月9日、会見を開き、分析用のデータを整備することの重要性を説くとともに、データの整備を支援する同社製品やサービスについて紹介した。データ分析者がセルフサービス型で分析用データを調達できる基盤として“データカタログ”の構築が重要だとした。

 データを分析して活用する上での最大の課題として日本IBMは、分析対象のデータの品質と整合性に問題があることを挙げる。日本IBMが手がけたIBM Watsonの導入プロジェクトのケースでも、そのまま利用できたデータは30%以下だったという。例えば、ある金融機関では、支店ごとにデータの形式が異なっており、これらを合わせる必要があった。

図1:分析可能な状態へとデータを整備する作業の負荷が大きい(出典:日本IBM)図1:分析可能な状態へとデータを整備する作業の負荷が大きい(出典:日本IBM)
拡大画像表示

 分析用データを整備することが何よりも重要だ、と日本IBMは説く。このための基盤として日本IBMは、“データカタログ”と呼ぶ概念を紹介する。「データの所在が分からない。データが不正確。データの加工に時間がかかる。こうした課題をデータカタログによって解決できる」(日本IBMのIBMクラウド事業本部アナリティクス事業部第二テクニカルセールスでシニアITスペシャリストを務める高田和広氏)という。

写真1:日本IBMのIBMクラウド事業本部アナリティクス事業部第二テクニカルセールスでシニアITスペシャリストを務める高田和広氏写真1:日本IBMのIBMクラウド事業本部アナリティクス事業部第二テクニカルセールスでシニアITスペシャリストを務める高田和広氏
拡大画像表示

 データの利用者は、データカタログを利用することによって、必要なデータを入手できる。ビジネス用語で検索するだけで、必要としているデータのありかや、そのデータの品質などが分かる。メタデータ同士の関連図から関連キーワードへの気付きも得られる。

 データカタログを実現し、データの前準備にかかる負荷を減らす製品として、日本IBMは、「IBM InfoSphere Information Server」と呼ぶパッケージソフトを提供している。ETL(抽出/変換/加工)やクレンジング(名寄せなど)といった基本的なデータ処理機能に加えて、ビジネス用語で検索可能なデータカタログ、データ品質の監視、データの来歴や影響分析、といった機能群を提供する。

 2018年10月9日からは、IBM InfoSphere Information Serverとは別の製品で、データの収集、整備、分析の機能を包括的に支援するソフト「IBM CloudPrivate for Data」(ICP Data)の試用版を、ホスティングサービスの形態で提供開始した。試用版では、ICP Dataを7日間、無償で利用できる。ICP Dataにもデータカタログを作成/運用する機能が含まれる。ICP Dataの価格(8%消費税込み)は、1仮想プロセッサあたり212万4000円。

 日本IBMはまた、データの活用を支援するコンサルティングサービス「」(DFM)も提供している。ユーザーにあらかじめ100項目程度の質問に答えてもらい、数度のワークショップを介して、ロードマップを提示する。日本IBMでは、100人のデータサイエンティスト集団「Data Science Elite Team」を組織しており、130社のユーザーのプロジェクトを支援している。

関連記事

Special

-PR-

分析に必要なデータをセルフで調達できる“データカタログ”を構築せよ、日本IBMがアピール日本IBMは2018年10月9日、会見を開き、分析用のデータを整備することの重要性を説くとともに、データの整備を支援する同社製品やサービスについて紹介した。データ分析者がセルフサービス型で分析用データを調達できる基盤として“データカタログ”の構築が重要だとした。

PAGE TOP