総務省は、民間企業による、AIでの同時通訳システムを活用した製品開発を後押しする意向を示しています。
この一環として、同省所管の情報通信研究機構(NICT)が研究を進める、同時通訳の基幹技術を一般に開放する方針です。
試作製品との間で音声データをやり取りするサーバーには、上記の通訳技術を搭載し、試作段階ではライセンスも不要で民間企業が使えるようにするとのこと。
初期投資費用の高さやライセンス契約の手間といったハードルを下げることで、民間企業の開発を促すのが狙いです。
また、こうして製品化した企業から蓄積データを集めて、翻訳精度の向上を図る目的もあります。
翻訳精度を高めるには、様々な翻訳データを学習することが不可欠であるため、様々な業界から集めた専門用語の翻訳データなどを学習させれば、幅広い用途に対応できるようになります。
米グーグルや米マイクロソフトといった海外企業に比べ、日本はデータの蓄積で遅れをとっています。そこで、官民がオープンな形で協力し開発を進めることで、これらに対抗できるAI通訳技術を育てる計画です。
さらには、2020年の東京五輪・パラリンピックに向け、同時通訳システムの普及によって、訪日外国人との言葉の壁を取り払えるようになる事も期待されています。
NICTの翻訳技術は観光に重点を置いているのが特徴だ。17年6月から深層学習(ディープラーニング)を活用して改善し、防災や買い物などの特定分野では9割前後の精度を誇る。グーグル翻訳よりも自然な表現になることも多い。
すでに実用化したアプリ「ボイストラ」では31言語の文字の翻訳に対応し、英語や中国語など16言語では音声の出入力の両方ができる。同時通訳は、話しているスピーチの文の切れ目などを自動で判断し、1つの文を話し終えてから数単語後には通訳を始める技術を開発済みだ。画像認識を使って表情から適切な文字データに変える技術開発も進めている。