Technologies

 情報通信研究機構(NICT)は我が国唯一の情報通信分野の公的研究機関である。NICTにおいては人工知能分野は知能科学融合研究開発推進センター(AIS)、ユニバーサルコミュニケーション研究所(UCRI)、先進的音声翻訳研究開発推進センター(ASTREC)、脳情報通信融合研究センター(CiNet)で主に研究開発が進められている。今回はその中の1つであるASTRECについて紹介する。

ASTRECは2014年に総務省から発表されたグローバルコミュニケーション計画(GCP)による多言語音声翻訳技術の研究開発を加速するために設立された研究センターである。ASTRECでは2020年までに外国人観光客が言葉の壁を感じない社会を作ることを目的として多言語音声翻訳技術の研究開発及び社会実装を進めてきた。

社会実装を進めるためには多言語音声翻訳技術の有効性を社会に広く知らしめる必要があり一般の人々を対象とした大規模な実証実験が不可欠であった。そのため、最新の多言語音声翻訳技術を広く紹介することを目的に一般の人々が自由にダウンロードして無料で使えるスマートフォンアプリVoiceTraを開発し、実証実験として公開している。公開時にはVoiceTraは最先端の統計翻訳技術を組み込んだ実証実験システムとして好評を博した。しかしながら、多言語音声翻訳技術は2016年頃にニューラル翻訳(NMT)技術が生み出され、それまでの統計翻訳技術から深層学習を用いたニューラル翻訳(NMT)技術に主流が移り一気に翻訳精度が向上した。ASTRECにおいても基礎研究として蓄積していたNMT技術をいち早く実用化レベルに発展させ、2017年に日本語・英語間の翻訳エンジンに組み込んだ。その後、主要10言語間の多言語翻訳をNMT化してVoiceTraへと組み込んでいる。VoiceTraは常に最新鋭の技術を組み込んだ誰でも活用できる実証システムとなっている。その結果、VoiceTraは現在(1/31)までに累計約550万ダウンロードされており(Fig.1)、社会で広く利用されている実証実験システムとなっている。NICT多言語音声翻訳技術、汎用テキスト翻訳技術の技術を活用した多言語音声翻訳システムや、多言語テキスト翻訳サービスが商用化されており社会の隅々にNICTの技術が広がっている(Fig.2)。

2020年3月には新たな多言語翻訳技術に関する国のプロジェクトが発表された。グローバルコミュニケーション計画2025(GCP2025)である。GCP2025では2025年までに同時通訳技術の実用化と社会実装を行うことが目標として定められており、同年に大阪で開催される大阪・関西万博等での利用が期待されている(Fig.3)。同時通訳技術の実用化を実現するためには入力分割・要約・翻訳出力最適化技術、文脈処理技術、マルチモーダル技術等の研究開発を行っていく必要がある。このような同時通訳技術はxR技術等と組み合わされ、ニューノーマル時代のグローバルなコミュニケーション技術への発展なども期待されている(Fig.4)。

このようにASTRECでは、先進的な学術研究のみならず社会を変革する実用的な技術開発を行っており、さらにその成果をオープンイノベーションで社会に広めることを目的として研究開発を行っている。このような実績が認められ、2020年にASTRECとUCRIが設置されているNICTのけいはんな拠点を我が国のAI拠点としてさらに強化する施策が打ち出されており、更なる研究開発成果が期待されている。今後も多くの皆様のご協力の下でさらなる言葉の壁のない社会の実現に向けたオープンイノベーションを推進します。

2021年2月22日
国立研究開発法人情報通信研究機構
ソーシャルイノベーションユニット長
知能科学融合研究開発推進センター長
先進的音声翻訳研究開発推進センター長
木俵 豊

Fig1.png
Fig.1 VoiceTraの紹介
Fig2.png
Fig.2 NICT多言語音声翻訳技術の社会展開例(一部)
Fig3.png
Fig.3 大阪・関西万博を想定した同時通訳技術の利活用例
Fig4.png
Fig.4 AR技術と同時通訳技術を融合させたコミュニケーションイメージ jp
Technologies
0