データマネジメント データマネジメント記事一覧へ

[新製品・サービス]

データの責任者/担当者に朗報、データ連携/流通に向けた「共通語彙基盤(IMI)」が誕生

2015年2月5日(木)田口 潤(IT Leaders編集部)

「データの共通化はみんなが幸せ」「データ設計の時間を価値の創出に使って欲しい」−−。内閣官房政府CIO補佐官 兼 経済産業省CIO補佐官の平本健二氏は、こう表現した。このコメントだけを聞いても何のことか分かりにくいだろうが、そうした可能性を持った「共通語彙基盤(IMI:Infrastructure for Multi-layer Interoperability)」が公開された。

 共通語彙基盤とはどんなものか?例えば、人を表すデータは「氏名や性別、年齢、住所、勤務先」などで構成される。しかし、それを「名前、男女、歳、現住所、所属」とする場合もある。こうした共通性のなさがデータの連携や流通を阻害しているのは、システム担当者や責任者なら周知の通りだ。人間が見れば分かることでも、コンピュータは理解できないからだ。

 このように、同じことを表す言葉を概念のレベルで共通化したのが共通語彙基盤である。それが一体、それがどう便利なのか?

 勘のいい人、あるいはデータ設計やメンテナンスで苦労している人は想像がつくはずだ。まず、データ設計に余計な頭を使う必要がなくなる。

図1:共通語彙基盤の利用イメージ図1:共通語彙基盤の利用イメージ
拡大画像表示

 図1はイベントを表すデータの定義例だ。ここで語彙基盤がなければ、「イベントを表すにはどんなデータ項目が必要か、場所や住所は必要だが、それ以外に何が必要か」といったことを考える必要がある。逆に語彙基盤があれば、基本的な項目は網羅されているので、追加情報だけを考えればいい。内閣官房政府CIO補佐官 兼 経済産業省CIO補佐官の平本健二氏が「データ設計の時間を価値の創出に使って欲しい」というゆえんだ。

 また、緊急時に使う「AED(自動体外式除細動器)」に関する情報を例に挙げると、多くの自治体がAEDに関する情報をWebサイトで公開している。しかし共通するのは設置場所だけだったりする。

 実際のAEDは、公共施設やビル内に設置されるケースが多いだけに、いざというときには利用可能な時間に関する情報や、ビル内であれば何階の、どのあたりにあるかといった情報も必要になる。AEDのデータ項目が、どうあるべきかが定義されていないから生じる問題だ。

 これが共通語彙基盤で定義され、自治体が準拠すれば、いざというときにAEDを探しやすくなるし、例えばAEDを探すためにスマートフォン用アプリケーションも1つで済むようになる。

 データ連携や流通に及ぼす効果については、言うまでもないだろう。1つの企業内でも、システムの構築時期や、構築担当者、あるいはベンダーによって、同じことを表すデータ項目が異なっているのが通常だ。データ連携や分析/活用は必ずしも容易ではない。EAIツールが必要なゆえんだが、リファレンスとなる共通語彙基盤があれば、中長期的に統一しやすくなる。

 当然、オープンデータの利用にも必須だ。欧米など海外でも共通語彙基盤の策定が進んでいる。「2014年には欧州委員会主催のワークショップが開催され、国を超えた語彙の対応付けに向けた組織となるCommunity of Practice of Core Data Modelの設置が決まり、現在準備が進んでいる」(情報処理推進機構の田代秀一技術本部国際標準推進センター長)という。

図2:共通語彙基盤のクラス用語図2:共通語彙基盤のクラス用語
拡大画像表示

 共通語彙基盤には、「クラス用語」と「プロパティ用語」がある。クラス用語は図2のようなものが定義されている。合計48個と少ないように見えるが、それぞれにプロパティ用語がある(図3)。これが普及すれば、かなりのデータ項目の共通化が図れるはずだ。

図3:共通語彙基盤のプロパティ用語図3:共通語彙基盤のプロパティ用語
拡大画像表示
図4:共通語彙基盤のカバー範囲と業界用語などとの関係図4:共通語彙基盤のカバー範囲と業界用語などとの関係
拡大画像表示

 もちろん「コア語彙」というだけあって、汎用性の高い文字通りのコアの語彙であり、分野や業種、業界固有のドメイン共通語彙やドメイン固有語彙まではカバーしない(図4)。それは業界団体など各分野の関係者の役割である。

 自治体関連ではすでに浦安市が「道路」、松江市や島根大学が「観光」、千葉市が「イベント」、神戸市と千葉市、川口市が「制度」、横浜市が「施設サービス」の共通語彙を、それぞれ民間企業と組むなどして策定しているという。

 共通語彙基盤は、2013年6月に政府が出した「世界最先端IT国家宣言」を受けて、経産省傘下の情報処理推進機構(IPA)が策定してきたもの。数度のレビュー、パブリックコメントを経て「コア語彙2.2(正式版)」の公開にこぎ着けた。詳細を是非、参照して欲しい。

関連記事

データの責任者/担当者に朗報、データ連携/流通に向けた「共通語彙基盤(IMI)」が誕生「データの共通化はみんなが幸せ」「データ設計の時間を価値の創出に使って欲しい」−−。内閣官房政府CIO補佐官 兼 経済産業省CIO補佐官の平本健二氏は、こう表現した。このコメントだけを聞いても何のことか分かりにくいだろうが、そうした可能性を持った「共通語彙基盤(IMI:Infrastructure for Multi-layer Interoperability)」が公開された。

PAGE TOP