[クラウド分解辞典−Microsoft Azureの実像に迫る]

Microsoft Cognitive Servicesの概要【第10回】

2017年3月27日(月)萩原 正義

米Microsoftが開発し提供するクラウドサービスである「Microsoft Azure」(以下、Azure)の全体像に迫る本連載。前回はクラウドならではのサービスの代表格である機械学習(Machine Learning:ML)について解説した。今回は、音声認識などのユーザーエクスペリエンスを提供する「Microsoft Cognitive Services」と、深層学習(ディープラーニング)のフレームワークである「The Microsoft Cognitive Toolkit」について、その位置づけと利用方法を解説したい。

 企業にとってデジタルトランスフォーメーション(DX)は大きな課題になっている。そのDXにおいて、対顧客、対消費者の観点で話題になっているのが、新たなユーザーエクスペリエンス(UX)の提供である。例えば、音声を言葉に変換したり、写真に写っている情報を認識して言葉で説明したり、あるいは写真をテーマ別に分類したりである。これらにより、コンピューターの操作は容易になるほか、利用者のやりたいことをコンピューターが予測し、煩雑な作業を自動化するなどが可能になる。

これからのUXを実現するMicrosoft Cognitive Services

 上記のようなインテリジェンスを持つUXを提供するためのサービス群が、「Microsoft Cognitive Service」である。各種のAI(人工知能)アルゴリズムを使って実現する。ただし多くの一般の人にとって、AIを活用するために、計算リソース(計算、記憶、ネットワーク)を用意しアルゴリズムを開発することは困難だ。技術は日進月歩で進歩しており、優れたアルゴリズムを適切に使うことは困難さを増す一方である。

 これに対しMicrosoft Cognitive Servicesは、最先端の深層学習(ディープラーニング)のアルゴリズムを用いた評価済みの学習結果をAPIとして提供することで、AIの活用を容易にする。利用者は、アルゴリズムを開発することも、学習のための大量のデータセットを用意する必要もない。AIを意識することなくAPIを呼び出すだけで、サービスを利用できる。既に「Skype」のリアルタイム翻訳や、「Cortana」「Bing」「Xbox」などのサービスに利用されている。

 Microsoft Cognitive Servicesのサービス群は大きく、視覚認識、音声認識、言語理解、知識、検索に分類される(表1)。例えば視覚認識には「Face」による顔検出、音声認識には「Bing Speech」による音声から文書へ、文書から音声への変換、言語理解には「Language Understanding」による自然言語からの文意、キーワード抽出といった機能が提供される。

表1:Microsoft Cognitive Servicesのサービス群とその機能表1:Microsoft Cognitive Servicesのサービス群とその機能
拡大画像表示

 これらの基本的なAIのアルゴリズムは、上述したようにAPIの呼び出しだけで利用できる。より高度な深層学習を使ったアルゴリズムの利用の場合は、後述する「The Microsoft Cognitive Toolkit」などのフレームワークを利用して開発することになる。

 図1に、Microsoft Cognitive Servicesを利用したコールセンターシステムの構築例を挙げる。フロントエンドには、テキストによる対話が可能なソーシャルアプリケーションやSkypeなどのインスタントメッセージングを使う。これらのアプリケーションは「Bot Framework」と呼ばれるデジタルアシスタントにテキストを入力する。Botは、複数のWebサイトにまたがった操作を実行することで、レストランや航空機の予約、質問への回答などを代行する支援機能を提供する。

図1:Bot Framework によるMicrosoft Cognitive Servicesの利用の例図1:Bot Framework によるMicrosoft Cognitive Servicesの利用の例
拡大画像表示

 このBotにMicrosoft Cognitive Servicesの言語理解を使えば、テキストの自然言語を理解する機能が実現できる。テキストを理解できれば、そこから質問内容を示す単語や、予約対象、日時などを切り出すことで、適切なWebサイトに要求を送信したり各種データベースを検索したりが可能になる。それらの結果をBotから再びフロントエンドに返すことで、あたかもフロントエンドがインテリジェンスを持つかのように振る舞うUXを提供できる。

バックナンバー
クラウド分解辞典−Microsoft Azureの実像に迫る一覧へ
関連記事

Microsoft Cognitive Servicesの概要【第10回】米Microsoftが開発し提供するクラウドサービスである「Microsoft Azure」(以下、Azure)の全体像に迫る本連載。前回はクラウドならではのサービスの代表格である機械学習(Machine Learning:ML)について解説した。今回は、音声認識などのユーザーエクスペリエンスを提供する「Microsoft Cognitive Services」と、深層学習(ディープラーニング)のフレームワークである「The Microsoft Cognitive Toolkit」について、その位置づけと利用方法を解説したい。

PAGE TOP