[調査・レポート]

時系列データからAI学習用の教師データを簡単に作成、富士通研究所と熊本大学が開発

2019年5月10日(金)日川 佳三(IT Leaders編集部)

富士通研究所と熊本大学は2019年5月10日、センサーデータなどの時系列データからAI学習用の教師データを簡単に作成できる技術を開発したと発表した。長区間(例えば1時間)に対して、主に「何を」していたか1つだけラベルを付けていくだけで、高精度な教師データを自動で作成できるとしている。時系列データ向け前処理技術として、2019年度中の実用化を目指す。

 富士通研究所と熊本大学は、ある時点での数値を記録した時系列データからAI学習用の教師データを簡単に作成する技術を開発した。時系列データを意味のあるブロックに区切り、それぞれにラベルを付けるアノテーションの作業を自動化する技術である。

 学習データの作成者は、長時間の区間(例えば1時間)に対して、その時間帯に主に何をしていたかを、1つだけラベル付けする。これだけで、精度の高い教師データ、つまり、それぞれの動作ごとに適切なラベルを付与した教師データを自動で作成できる。

 同技術の効果として、工場における研磨などの作業を模した動作からなる加速度センサーの時系列データに対して、ラベルを付与する実験を実施した。結果、92%の時間帯で、正しくラベル付けができたことを確認した。これは、人手でラベルを細かく付与したデータを教師データとした時と同等の精度だとしている。

 背景には、時系列データのAI活用が進んでいないという状況がある。時系列データから教師データを作るためには、手動で「いつ」、「何を」したかといったラベルを、数値の変化に応じてデータに付与しなければならない。この作業の工数が膨大となる。

 例えば、ランニングの際の加速度センサーのデータでは、走っている状態、歩いている状態、止まっている状態などが混在している。これらのデータをAIに学習させるには、データをそれぞれの区間に切り分けて、「走っている」、「歩いている」、「止まっている」といったラベルを付けた教師データを作成する必要がある。

 今回開発した技術の特徴の1つは、時系列データから、同じ特徴を持つ動作の時間帯を、AIを用いて自動抽出することである。時系列データの中で、同じ動作が継続している時の特徴と、動作が変化する時の特徴を学習することによって実現している。熊本大学が所有する技術を活用している。

 今回開発した技術のもう1つの特徴は、ラベル付けの精度をAIによって高めていることである(図1)。長区間のデータに大雑把なラベルを手動で付与した後、ラベルを予測するモデルをディープラーニングで作成し、予測結果として出てきた推定ラベルから、時系列データのどの区間が最も予測に寄与したかを計算する。この寄与度が高い時間帯をラベル候補として集計していくことで、高度な予測が可能な教師データを作成する。

図1:時系列データ向け前処理技術の全体像(出典:富士通研究所、熊本大学)図1:時系列データ向け前処理技術の全体像(出典:富士通研究所、熊本大学)
拡大画像表示
関連キーワード

富士通研究所 / 熊本大学

関連記事

Special

-PR-

時系列データからAI学習用の教師データを簡単に作成、富士通研究所と熊本大学が開発富士通研究所と熊本大学は2019年5月10日、センサーデータなどの時系列データからAI学習用の教師データを簡単に作成できる技術を開発したと発表した。長区間(例えば1時間)に対して、主に「何を」していたか1つだけラベルを付けていくだけで、高精度な教師データを自動で作成できるとしている。時系列データ向け前処理技術として、2019年度中の実用化を目指す。

PAGE TOP