東芝は2016年10月31日、高次元ベクトルデータを高速照合するデータベース「GridDB Vector Edition」を発売した。2016年5月に発表した「ビッグデータや大規模メディアデータを高速照合する技術」を搭載し、大量の顔写真から特定の人物を見つけ照合する「大規模顔認証」システムに適用できる。
「GridDB」は、社会インフラシステムやIoT(Internet of Things)で取り扱われるビッグデータを高速処理する用途向けに、東芝が開発したスケールアウト型データベースである。データをサーバーのメインメモリーに配置するインメモリー型アーキテクチャーにより、ペタバイト級のビッグデータでも高速にデータベース処理できる。
「GridDB Vector Edition」では、従来技術と比較してベクトルデータの照合を約50倍の速度(東芝発表)で処理可能だ。このため、空港の入国審査などで利用されている「大規模顔認証」システムの、特定人物のベクトルデータとの照合を高速化できる。
データを高次元ベクトルで表現し、あらかじめ類似のベクトル群を索引化しておくことで高速照合を可能にしている。
パターン照合機能を組み込んだ拡張SQLにより、任意のパターン分析を簡単かつ自在に組み合わせられる。
容量や性能に応じて、システムを止めずに簡単に拡張(スケールアウト)できる。障害発生時にも無停止運用が可能な高い可用性も備えている。
東芝は今後、同データベースの適用範囲を拡大し、特徴的な株価の動きなどを照合する金融データマイニングシステムなどに向けても提案していくとしている。