[事例ニュース]

特許庁、「機械翻訳システム」の日英翻訳機能が稼動

2019年6月3日(月)IT Leaders編集部

特許庁は、「機械翻訳システム」の日英翻訳機能を稼動させた。2020年4月には、中日翻訳機能と韓日翻訳機能をリリースする。2018年4月にシステムを受注した東芝デジタルソリューションズが2019年5月31日に発表した。

 特許戦略のグローバル化にともない、特許文献を翻訳する頻度・件数は急増している。しかし、従来の人手による翻訳作業では、「時間がかかる」、「コストが高い」、「大量の翻訳が難しい」などの課題があった。

 これらの課題を解決する手段として、機械翻訳の活用が進んでいるが、従来のルールベース機械翻訳エンジン(RBMT)や統計的機械翻訳エンジン(SMT)では、正確さや自然さに欠けるなどの問題があった。近年になり、AIを活用したニューラル機械翻訳エンジン(NMT)の登場で、翻訳品質は向上したが、原文のパターンによっては誤訳(訳抜け・湧き出しなど)が生じやすいなどの欠点がある。

 また、特許文献では、内容を長文で記載する明細書部分・請求項部分と、句で構成する「発明の名称」、「出願番号」、「出願人」の定型部分が、同一文書内に混在している。明細書部分・請求項部分にはNMTが適する一方で、定型部分はRBMTやSMTが適する。このように、翻訳エンジンの向き・不向きがある。

 今回稼働を開始した機械翻訳システムは、東芝デジタルソリューションズの自然言語処理技術に、情報通信研究機構(NICT)の先進的音声翻訳研究開発推進センターが開発した最新のNMTを組み合わせた。これにより、従来の機械翻訳では難しかった、正確で自然な機械翻訳を可能にしたとしている。

 自然言語処理技術で、特許文献の明細書部分・請求項部分や定型部分を自動で切り分け、NMT・RBMT・SMTに適宜振り分ける。加えて、NMTの弱点とされる誤訳が生じにくいように、入力文を整形する処理技術を実装する。これらにより、NMTの翻訳性能を活かした翻訳を可能にした。

 さらに、日本マイクロソフトのクラウド基盤「Microsoft Azure」を採用することで、大量の特許文献に対して高速の翻訳処理を可能にした。

 2019年5月にリリースしたバージョンでは、日本語から英語への書類・日本特許公報の翻訳機能を搭載した。海外庁審査官が日本での審査結果を参照する際や、日本の出願人が海外庁への特許出願時に必要な提出書類を翻訳する際に利用する。

 2020年4月にリリース予定のバージョンでは、中国特許公報・韓国特許公報翻訳機能として、中国語から日本語、韓国語から日本語への翻訳を可能にする。日本の審査官や、国内企業、研究機関が中国・韓国で出願された特許を検索し、内容を把握するために利用する。

関連記事

Special

-PR-

特許庁、「機械翻訳システム」の日英翻訳機能が稼動特許庁は、「機械翻訳システム」の日英翻訳機能を稼動させた。2020年4月には、中日翻訳機能と韓日翻訳機能をリリースする。2018年4月にシステムを受注した東芝デジタルソリューションズが2019年5月31日に発表した。

PAGE TOP