データマネジメント データマネジメント記事一覧へ

[新製品・サービス]

データ統合ツール新版「Insight Governor 1.1」、大規模言語モデルで名寄せの精度を向上

2023年7月4日(火)日川 佳三(IT Leaders編集部)

インサイトテクノロジーは2023年7月4日、データ統合ツールの新版「Insight Governor Ver.1.1」を発表した。同年7月から提供している。各部署に分散しているデータを統合して活用するために必要な機能群を一通り提供するツールである。具体的には、データのカタログ化、名寄せ、データの匿名化といった機能群を提供する。新版では、既存の大規模言語モデル(LLM)をファインチューニングしたAIを活用し、名寄せ機能の精度を高めた。

 インサイトテクノロジーのデータ統合ツール「Insight Governor」は、データは、企業の各部署に散在しているデータを統合して活用するために必要な機能群(データのカタログ化、名寄せ、データの匿名化など)を提供する(関連記事社内に散在するデータを統合/名寄せ/匿名化─インサイトテクノロジーの「Insight Governor」)。

 今回の新版では、既存の大規模言語モデル(LLM)を基にインサイトテクノロジーがファインチューニングしたAIを活用し、名寄せ機能の精度を高めた(画面1)。あらかじめ名寄せのルールを登録することなく、氏名などの新字体/旧字体や表記ゆれ、製品名などの表記のばらつきを自動で検知できるようになった。

画面1:名寄せ機能を利用している様子(出典:インサイトテクノロジー)
拡大画像表示

 異なるテーブルやデータソースのデータを組み合わせて名寄せに活用する。例えば、顧客データの「氏名」「社名」「住所」「電話番号」などを参照することで、同性同名の別人を正しく区別できるようになった。既存の方法(名寄せルールの参照)では難しかった、初出の「氏名」「社名」「製品名」などの名寄せが可能になった。

 新版では、異なるデータソース同士が共通して持っている関連データを検知する機能も追加した(画面2)。例えば、販売管理システムの「部品データ」と、在庫管理システムの「部品データ」を、各部署で別のデータ項目名で管理しているケースにおいて、これらを類似データとしてひもつけられる。これにより、データの可視化、統合、分析が可能になる。

画面2:関連データ検知機能を利用している様子(出典:インサイトテクノロジー)
拡大画像表示
関連キーワード

インサイトテクノロジー / データ統合 / 名寄せ / 大規模言語モデル / 生成AI

関連記事

トピックス

[Sponsored]

データ統合ツール新版「Insight Governor 1.1」、大規模言語モデルで名寄せの精度を向上インサイトテクノロジーは2023年7月4日、データ統合ツールの新版「Insight Governor Ver.1.1」を発表した。同年7月から提供している。各部署に分散しているデータを統合して活用するために必要な機能群を一通り提供するツールである。具体的には、データのカタログ化、名寄せ、データの匿名化といった機能群を提供する。新版では、既存の大規模言語モデル(LLM)をファインチューニングしたAIを活用し、名寄せ機能の精度を高めた。

PAGE TOP