AIに詳しい作家でジャーナリストの小林雅一さんによると、Google翻訳は長く、対訳文を収集しデータベース化することで、統計学的に翻訳文を導き出すという手法を採用してきた。2016年11月、ここにディープラーニングという最先端のAI技術を導入して大幅リニューアルを実施。ウェブ上の対訳文を基にAI自らが学習し、翻訳機能を高められるようになったという。
対訳文が蓄積され、翻訳機能が高まり続ければ、人間が英語を学ばなくてもすべてを翻訳してくれるようになるのか。
小林さんの答えは、
「いまより機能が高まる可能性はありますが、私はある程度のところで限界がくると予想しています」
Google翻訳はあくまでもパターン認識で、AI自身が言葉の意味を理解しているわけではないからだ。報道記事や論文など、複雑な文章になると、やはり誤訳は避けられない。
しかし、翻訳前の日本語にある工夫をほどこすことで、誤訳を劇的に減らすことはできる。『英文“秒速”ライティング』(日本実業出版社)の著書がある平田周さんが、その方法を教えてくれた。
「一言でいえば、日本語を英語っぽくしてから翻訳ソフトを使うという方法です」
平田さんによると、和文を英文に自動翻訳する場合の誤訳は、日本語と英語の文章の構造が根本的に異なるために起こる。このため、翻訳したい日本語を、英語の「基本5文型」に沿った構造に変えることで、誤訳を大幅に減らせるのだという。主語(S)、動詞(V)、目的語(O)、補語(C)を組み合わせた五つのことだ。
●誤訳は「時制」で起こる
これに沿って日本語を組み立て直したものを、平田さんは「中間日本語」と呼んでいる。具体的なポイントは上のチャートに示した。なかでも平田さんが特に重要だと語るのが、「時制」(図1を参照)。日本語は「明日、学校に行く」のように未来を現在形で表すが、
「英語は過去、現在、未来を明確に区別します。未来形にすべきところ、それをしないために起きる誤訳が一番多いですね」