[新製品・サービス]

NRI、文章から意味のあるデータを抽出して項目を推定するソフト「Shingan」を販売

2019年2月28日(木)日川 佳三(IT Leaders編集部)

野村総合研究所(NRI)は2019年2月28日、文章から意味のあるデータを抽出して項目を推定するソフトウェア「Shingan」を発表、同日販売を開始した。フォーマットが異なる複数の文書から、AIを活用して自動的にデータを抽出し、後続のシステムへと連携させられるようにする。価格(税別)は、導入と稼働までのコンサルティング費用が100万円からで、月額利用料が30万円から。販売目標は、今後3年間で約20社。

 NRIが開発したShinganは、文章から意味のあるデータを抽出し、データの項目を推定するソフトである(図1)。非定型データをシステムで取り扱えるデータに整え、後続のシステムへと連携させられるようにする。形態素解析や構文解析などの日本語処理技術と、マシンラーニング(機械学習)/ディープラーニング(深層学習)技術を組み合わせた。読み込む文書の特性に応じて事前に学習させたAIと辞書を抽出に利用する。

図1:Shinganを利用した、非定型データを抽出する流れ(出典:野村総合研究所)図1:Shinganを利用した、非定型データを抽出する流れ(出典:野村総合研究所)
拡大画像表示

 フォーマットが異なる複数の文書からExcelの形式でデータを抽出し、結果を出力する。抽出したデータと、抽出したデータの確度を、ダッシュボード画面で確認できる(画面1)。ダッシュボード上では、抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する。「後続のシステムに連携すべき抽出結果として正しい可能性が高い」と判断したデータほど値が大きい。

画面1:Shinganで文書からデータを抽出した画面(出典:野村総合研究所)画面1:Shinganで文書からデータを抽出した画面(出典:野村総合研究所)
拡大画像表示

 NRIは、販売開始前に、投資信託における各種業務を対象に実証実験を実施した。野村アセットマネジメントとは、運用報告書に記載されている各種文章の整合性チェックについて実証実験を実施した。NRIプロセスイノベーションとは、項目の抽出と他システムへのデータ連携について検証した。

 なお、Shinganは、「crossnote」(アップデイティット製)などの文書管理システム上で稼働する。

関連キーワード

野村総合研究所 / テキストマイニング / ディープラーニング / マシンラーニング

関連記事

Special

-PR-

NRI、文章から意味のあるデータを抽出して項目を推定するソフト「Shingan」を販売野村総合研究所(NRI)は2019年2月28日、文章から意味のあるデータを抽出して項目を推定するソフトウェア「Shingan」を発表、同日販売を開始した。フォーマットが異なる複数の文書から、AIを活用して自動的にデータを抽出し、後続のシステムへと連携させられるようにする。価格(税別)は、導入と稼働までのコンサルティング費用が100万円からで、月額利用料が30万円から。販売目標は、今後3年間で約20社。

PAGE TOP