[新製品・サービス]

暗黙知をグラフデータベースで見える化するシステム、KPMGコンサルティングが提供

2018年12月10日(月)日川 佳三(IT Leaders編集部)

KPMGコンサルティングは2018年12月10日、日報や技術報告書などの非構造化データを自然言語処理技術によって分析し、トピック同士の相関をグラフデータベース化するパッケージシステム「KNIGHT(Knowledgeable Integrated Graphic Transformation、ナイト)」を発表、同日提供を開始した。企業に眠る暗黙知を形式知にできるとしている。コンサルティングサービスの一環として提供する。

 KPMGコンサルティングの「KNIGHT」は、日報や技術報告書などの自然言語で書かれた非構造化データを自然言語処理技術によって解析し、重要な単語(トピック)同士の相関関係をグラフデータベース化するデータ解析システムである(図1)。グラフデータベースを作成した後は、「テレビ」などの調べたい単語を入力すると、「4K」や「大型」などの、その単語を中心とした単語同士のつながりをグラフ形式で表示する。これにより、単語を取り巻く知見に気付くことができる。

図1:KNIGHTがアウトプットするグラフ表示の例。「テレビ」というトピックに関連するトピックのつながりをグラフ形式で見える化する(出典:KPMGコンサルティング)図1:KNIGHTがアウトプットするグラフ表示の例。「テレビ」というトピックに関連するトピックのつながりをグラフ形式で見える化する(出典:KPMGコンサルティング)

 例として同社は、2017年1月の自動車関連のニュース記事(量にして1Mバイト程度の少量)をグラフデータベースに取り込んだ。トピックとして「人工知能」を検索したところ、グラフ構造のつながりから、「自動運転」、「SAE」、「ギルプラット」、「関与」、「TRI(Toyota Research Institute)」を辿ることができた。人は自分の関心ごとの外側の情報をつかむことは難しいが、情報は依存関係を持っており、こうした依存関係を辿ることで新たな知見を得られるとしている。

写真1:KPMGコンサルティングでAdvanced Innovative Technologyディレクターを務める山本直人氏写真1:KPMGコンサルティングでAdvanced Innovative Technologyディレクターを務める山本直人氏
拡大画像表示

 KNIGHTを提供する背景について同社は、非構造化データの活用が進んでいないことを挙げる。「例えば、製造業では図面ではなく試行錯誤の過程を記した報告書に知見があるが、報告書はERP(基幹業務システム)に登録していないため、活用されない。非構造化データを活用できない理由は単純で、SQLで検索できないから」(KPMGコンサルティングでAdvanced Innovative Technologyディレクターを務める山本直人氏、写真1)。

 KNIGHTでは、グラフデータベースを作成するためのインプットとして、テキストファイルのほか、Power Pointなどテキストが含まれる任意の文書ファイルを利用できる。グラフデータベースの作成に要する時間は、例えば100GBのデータを解析する場合、GPUを搭載したPCで6時間程度かかるという。こうして作成したグラフデータベースに対して、Webインタフェースで検索・操作できる。

 グラフデータベースへの検索は、大きく2つのやり方がある。1つは、トピックを指定して検索し、そのトピックを中心に据えたトピック同士のつながりをグラフ表示する使い方である。もう1つの使い方は、つながりのスタート地点となるトピックAと、ゴール地点となるトピックBを指定し、トピックAからトピックBへとどのようにトピック群がつながっているのかをグラフ表示する使い方である。

 検索後のグラフ表示画面も操作できる。標準で重要なトピックほど大きく表示する仕様になっているが、ユーザーは個々のトピックの位置をマウスで動かすことができる。関連するトピックを1つのエリアにまとめたりすることで、より分かりやすいグラフに整形できる。また、個々のトピックをクリックすると、そのトピックが含まれる原文のテキストを参照できる。

 KNIGHTは、コンサルティングサービスの一環として提供する。費用はケースバイケースだが、100Gバイトを超える程度のデータを解析する場合、コンサルティング費用は1カ月あたり1000万円弱程度になる。

関連キーワード

KPMG / 自然言語処理 / ナレッジマネジメント

関連記事

トピックス

[Sponsored]

暗黙知をグラフデータベースで見える化するシステム、KPMGコンサルティングが提供KPMGコンサルティングは2018年12月10日、日報や技術報告書などの非構造化データを自然言語処理技術によって分析し、トピック同士の相関をグラフデータベース化するパッケージシステム「KNIGHT(Knowledgeable Integrated Graphic Transformation、ナイト)」を発表、同日提供を開始した。企業に眠る暗黙知を形式知にできるとしている。コンサルティングサービスの一環として提供する。

PAGE TOP