データマネジメント データマネジメント記事一覧へ

【Special】

データ活用高度化に向け、「品質」と「費用」の最適バランスを考える

2016年4月13日(水)

データを積極的に経営に活かすのに重要となるのがデータの「品質」だ。ここで欠かせないのが、「ビジネス上の目的に応じて品質が定まるという」という視点だ。品質改善に向けてどのような現実的アクションを起こすべきなのか。創業以来、データマネジメントの領域に力を注ぐリアライズのキーパーソンが「データマネジメント2016」のセッションでポイントを解説した。

データ品質は目的によって定まる

 データ品質が高いとは、「オペレーション、意思決定、計画などの目的にかなっていること」を指し示す。品質の定義においては、製品でもデータでも違いはない。目的に応じて品質が定まるのであって、「目的がなければ品質は定められない」、あるいは「目的が異なれば同じデータの品質も変化する」ことを意味しているのである。

株式会社リアライズ データマネジメント事業統括部 マネージャ 田畑 賢一 氏

 リアライズの田畑賢一氏(データマネジメント事業統括部 マネージャ)は「今までオペレーションで使っていたデータを分析に使おうとすると、うまく使えないことが多々あります。これは、オペレーションのためのデータ品質と、データ分析のためのデータ品質が異なることに原因があるのです」と指摘する。

 データ品質の改善には「データ生成プロセス改善」もあるが、ここでは「データの値と一意性の改善」をテーマとする。つまり、データのクレンジングと名寄せについてである。プロセスは「定義」→「測定」→「改善」→「適用」の4つ。「定義」→「測定」→「改善」はPDCAサイクルを回して結果を得るもの、「適用」は結果を反映して実利を得るものだ。

図1 データ品質改善プロセスのポイント
拡大画像表示

データ品質改善プロセスのポイント

 それぞれのプロセスについて、プロジェクトの概要とポイントを以下に解説する。

(1) データ品質基準を定義する

 データを何の目的で使うのかを確認し、その目的に合致するデータ品質について決定する。適切な基準が決められない場合の理由は、大きく分けて2つある。

・改善の目的、ひいてはビジネス上の目的が不明瞭
「品質をよくすれば、何かいいことがあるだろう」「ライバルより品質が悪いらしい、なんとかしなければ」といったあいまいな目的では定義できない。何のためにデータ品質を改善するのかを明確にする必要がある。

・対象となるデータをそもそも把握できていない
例えば、顧客データの何が悪くてクレームになっているのか、テーブル定義書を見てもわからないという場合は、そのデータと関連する業務に詳しい専門家を探し出して情報を入手する必要がある。

(2) データ品質測定

 定義した品質基準に対して、実データがどうなっているのか確認する。具体的には、以下のように進める。

・作業コスト算出のため、実際のデータ品質を測定
・改善に必要となる処理、プロセスを定義
・処理に必要となるコストを算出
・改善対象範囲を決定(メリットに対してコストがかかりすぎる場合は範囲を狭める)

 測定および改善操作のコスト増減要因は調査データ件数、対象となるデータの集合数、測定あるいは操作にかかる時間だが、測定自体はツール利用で時間短縮が可能。一方、ツールでは判別が難しく、人間の目で確かめる必要がある種類のデータもある。

図2 測定により抽出された問題のあるデータ
拡大画像表示

(3) データ品質改善

 データ品質の改善とは、データの作り直しである。一部分だけ品質が悪くても、その行を全部作り直すのと同様のコストがかかる。対象データに対して、品質改善処理を実施する場合、「改善プロセスの適用」→「適用後のデータ品質測定」を繰り返し、想定の結果が得られた時点で完了となる。一回でうまくいかないケースが多く、「想定外」を想定しておくことも必要だ。

 「ポイントは、後戻り可能なプロセスを視野に入れること。ステップごとにデータをバックアップし、処理は自動化・再現可能にしておく。また、上司に説明できないような複雑な手法は、やめておいた方が賢明です」(田畑氏)。

(4) 適用

 結果を確認し、成果を適用する。具体的には、運用データの書き換えなどを行う。ポイントは、影響範囲が明確でないと意思決定できないため、影響範囲自体の調査が必要になる可能性がある。さらに、リカバリ計画を作っておく必要もある。その他、以下の点に注意が必要。

・意思決定は例外なく大変なので、そのための時間をとる
・組織自身の課題なので、コンサルタントに丸投げできない

 これらをクリアすることで初めてデータ品質改善のメリットが享受できる。また、「データ戦略は、入れ物であるITの戦略と、中身であるデータの戦略を同列に考える必要があります。データは、システムよりもずっとビジネスに近いテーマなのです」と田畑氏は説明する。

 データ品質を改善する理由はビジネス上の課題解決で、ビジネス目的が明確ならば、やるべき事は定められる。データに詳しいのは、ビジネスの人たちであり、情報システム部門などが単独で取り組んでも効果は低い。ビジネス部門の人を巻き込むことこそが重要だ。「データ品質向上自体は目的ではないので、ビジネスメリットと費用のバランスを考えることが重要なポイントです」とし、田畑氏はセッションを締めくくった。


●お問い合わせ先

株式会社リアライズ

マーケティング・営業部
sales@realize-corp.jp
03-6734-9888
http://www.realize-corp.jp/

関連記事

データ活用高度化に向け、「品質」と「費用」の最適バランスを考えるデータを積極的に経営に活かすのに重要となるのがデータの「品質」だ。ここで欠かせないのが、「ビジネス上の目的に応じて品質が定まるという」という視点だ。品質改善に向けてどのような現実的アクションを起こすべきなのか。創業以来、データマネジメントの領域に力を注ぐリアライズのキーパーソンが「データマネジメント2016」のセッションでポイントを解説した。

PAGE TOP