[新製品・サービス]

NTT Com、自然言語解析の「COTOHA API」に音声認識APIを追加

2019年3月26日(火)IT Leaders編集部

NTTコミュニケーションズ(NTT Com)は2019年3月25日、NTTグループの自然言語解析技術の研究成果を利用できるAPIサービス「Communication Engine “COTOHA API”」において「音声認識」APIを2019年3月26日から提供すると発表した。自動応答などに活用可能な音声認識技術をAPIを介して利用できる。

 音声認識APIは、日本語の発話内容(音声データ)を高精度で認識し、日本語のテキストデータに置き換えることができる。人間が話した内容を、コンピューターが処理しやすいテキストデータに変換することによって、AIを利用した様々なサービスにおける音声入力インターフェースとして利用することが可能だ。

 NTTグループのAI関連技術「corevo」の研究成果を活用しており、人間の声を深層学習によって精緻に分析できる。雑音に強い独自の音響モデルと発話区間検出技術により、世界最高水準の認識率(国際技術評価イベント「CHiME-3」で世界1位の精度を達成した技術を利用している)を備えている。

 同APIが処理した音声データ、および認識結果のテキストデータは、サーバー上に一切残らないため、個人情報を含む通話記録や、社内会議の音声など機密性の高い情報も安心して取り扱うことができる。

 ユーザーの用途に合わせ、よく使う業界用語、専門用語、また自社の商品やサービス名を登録することが可能だ。これにより、ユーザー自身で即時に認識精度を高めることができる。

 価格(税別)は、初期費用が無料で、月額費用が基本料金13万円+APIコール数に応じた従量課金(音声認識の場合は月約5万分まで基本料金のみで利用可能)。なお、利用開始月を含む3カ月間の料金は無料。

 NTT Comは今後、同APIの提供以外に、同APIを活用したサービスの開発や提供も行っていく。具体的には、コンタクトセンターの通話録音データをテキスト化し、応対内容や顧客の声の可視化を安価で安全に提供するクラウドサービス「COTOHA Voice Insight」(2019年4月提供予定)と、リモート会議サービスの付加機能として、会話の内容を同APIによってテキスト化し、リアルタイムで画面に表示するサービス「Arcstar Conferencing TV Conferencing字幕翻訳機能(仮称)」(2019年4月PoC受付開始)がある。また、翻訳APIと組み合わせることによって、海外との会議などで会話内容をリアルタイムで翻訳することも可能にする(2019年度提供予定)。

関連記事

Special

-PR-

NTT Com、自然言語解析の「COTOHA API」に音声認識APIを追加NTTコミュニケーションズ(NTT Com)は2019年3月25日、NTTグループの自然言語解析技術の研究成果を利用できるAPIサービス「Communication Engine “COTOHA API”」において「音声認識」APIを2019年3月26日から提供すると発表した。自動応答などに活用可能な音声認識技術をAPIを介して利用できる。

PAGE TOP