隅田英一郎 (すみた・えいいちろう)/国立研究開発法人情報通信研究機構フェロー。一般社団法人アジア太平洋機械翻訳協会会長
隅田英一郎 (すみた・えいいちろう)/国立研究開発法人情報通信研究機構フェロー。一般社団法人アジア太平洋機械翻訳協会会長

AI翻訳は真っ当な翻訳ができないことがある

「Xの間に~」を英語にするときの訳し分け方は、Xが二つの場合には「between X」、三つ以上の場合には、「among X」と学校で習った。簡単な例文で自動翻訳が訳し分けできるか試してみた。

「X の間に」は「between X」と「among X」の2択
「X の間に」は「between X」と「among X」の2択

 Xが二つの場合には「between X」、三つ以上の場合には、「among X」という区別は、日本語の「学生」だけではわからないし、ニューラル翻訳では原理的に訳せない。少しだけ敷衍すると、ニューラル翻訳は原文の文字列と訳文の文字列の対のみから構成される対訳データに基づいて学習しているので、文字列以外の情報が必要な翻訳はできない。上のXが二つか三つかは文字列に必ずしもない情報なので翻訳できない。他に二つの異なる自動翻訳も試したところ、誤訳のパターンは三者三様であった。一見できているように見えるので、こういう問題は人間が正誤を判断するしかない。

「鏡の前で彼女は椅子に座っていた」はどうか?「She was sitting in the chair in front of the mirror.」と三つの自動翻訳は訳した。背もたれのない「stool」の可能性ははなから考えていないようだ。画像がないと人間にも訳し分けできないけれど。

 同様に、日本語では明示的に表現されないが英語では区別が必要な、文法の教科書に出てくるような事柄、例えば、単数形と複数形の区別、「a/an」と「the」の区別などは翻訳できない。ニューラル翻訳にはできないことがたくさんある。一方で、このような区別が高頻度に起こり、かつ、誤ると決定的に困る、とは限らないこともあって、ニューラル翻訳は総合的には使える場面が多い高精度を実現している。

○隅田英一郎 (すみた・えいいちろう)/国立研究開発法人情報通信研究機構フェロー。一般社団法人アジア太平洋機械翻訳協会会長

暮らしとモノ班 for promotion
台風シーズン目前、水害・地震など天災に備えよう!仮設・簡易トイレのおすすめ14選