[市場動向]

NEC、熟練者の意図を学習し意思決定を模倣するAI技術を開発

2019年7月18日(木)IT Leaders編集部

NECは2019年7月17日、熟練者の過去の行動履歴データから、その認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルが要求される業務を効率化するAI技術を開発したと発表した。属人的な業務の意思決定プロセスに適用することにより、業務負荷を軽減し、業務スピードの向上を支援する。高度なスキルが必要な実業務で、10倍以上の効率化を確認したとしている。

 逆強化学習(最適行動から報酬を推定する学習)のフレームワークを、NEC独自のアルゴリズムで拡張した。従来であれば技術者が行っていた意思決定モデルの構築を自動化する。人手では定式化が困難な意思決定問題に対し、熟練者の過去の行動履歴データから意思決定モデルを作成することで、熟練者と同等の判断を迅速かつ自律的に導き出す。

 同技術は、主に以下の領域に対して適用できる。

  1. RPA(ロボットによる業務自動化の取り組み)を適用できない、複雑な意思決定を必要とする業務領域(例:営業活動やプラント運転など)
  2. 人の判断・動作を物理的に再現する領域(例:自動運転やロボット制御など)

 NECは実際に、TV放送局の広告スケジューリング業務(広告宣伝の効果やスポンサーの好みを考慮しながら、TVコマーシャルを番組時間枠に割当てる業務)に適用し、実データを使った性能評価を実施した(図1)。

図1:TV放送局の広告スケジューリング業務での適用内容(出典:NEC)図1:TV放送局の広告スケジューリング業務での適用内容(出典:NEC)
拡大画像表示

 TV放送局の広告スケジューリング業務では、各CMにおける要件・制限事項と、放送枠の活用方法など放送局側の要件の両方を考慮しなければならず、高度なスキルやノウハウが要求される。今回の技術を活用した結果、経験豊富な熟練者と同等レベルの意思決定を10倍以上のスピードで行えることを確認した。

 従来の逆強化学習の場合、熟練者の一連の行動を単一の意思決定モデルとして学習するため、状況に応じた複雑なモデルを構築することは困難だった。

 これに対して、今回開発した技術は、複雑な意思決定を、複数の意図に分解して学習する。異種混合学習(ビッグデータに混在するデータ同士の関連性から多数の規則性を自動で発見し、分析するデータに応じて参照する規則を自動で切り替える技術)を拡張し、行動履歴データから複数の意思決定モデルと、これらの切り替えルールを学習する。

 これにより、熟練者が時と場合より柔軟に使い分ける判断基準を、非熟練者でも理解しやすいロジックで説明でき、熟練者と同等レベルの意思決定を行うことができる。例えば、営業販売に適用した場合、成約率の高い営業の行動履歴を学習し、顧客(見込み客、常連客など)ごとに異なる最適な対処を学習して、経験の浅い営業担当に活動指針を出すことが可能になる。

 また、熟練者の過去の行動履歴から、制約も同時に学習する。熟練者が選択しない行動はリスクがあるため、避ける制約と見なす。一方、常に行っている行動は、守るべき制約と見なす。意思決定モデルと制約を同時に学習することで、熟練者が無意識に行っている、安全で信頼性の高い判断と同等の意思決定が可能になる。

 学習環境の簡略化も図った。一般に、逆強化学習を実行するためは、行動履歴データ、行動により最適化対象の状態がどう変化するかを模擬する状態遷移モデル、学習した結果の正誤を確認するための実験機やシミュレータが必要になるが、現実世界を精巧に模擬できる状態遷移モデルの作成は困難となる。

 これを解決するため、熟練者・非熟練者の行動履歴データからのサンプリングにより意思決定モデルを評価できるモデルフリー方式(環境のダイナミクスが既知でない場合でも、強化学習・逆強化学習が適用できる方式)を新たに開発した。この方式を採用することで、コストのかかる精緻な状態遷移モデルの準備が不要になり、学習環境を簡略化できる。また、学習途中の意思決定モデル評価をシミュレータなどで実行する必要もないため、学習を既存の逆強化学習の100倍(NEC調べ)の効率で行える。

関連記事

Special

-PR-

NEC、熟練者の意図を学習し意思決定を模倣するAI技術を開発NECは2019年7月17日、熟練者の過去の行動履歴データから、その認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルが要求される業務を効率化するAI技術を開発したと発表した。属人的な業務の意思決定プロセスに適用することにより、業務負荷を軽減し、業務スピードの向上を支援する。高度なスキルが必要な実業務で、10倍以上の効率化を確認したとしている。

PAGE TOP