【機械翻訳（自動翻訳）の問題点】インターネットにあふれる情報にはご用心

集合知の伝道師でありジャーナリストのJames Surowiecki（ジェームズ・スロヴィッキ）によれば、「集団は、その集団に属する個人（初心者であれ一流の専門家であれ）よりもはるかに優れた予測を行うことができる」そうです。この理論を説明するために、スロヴィッキーは2004年の著書「The Wisdom of Crowds」の中で「イギリスの統計学者Sir Francis Galton（フランシス・ガルトン卿）が20世紀初頭の田舎の品評会に参加した際に驚くべき発見をした」という次のようなエピソードを紹介しています。

“ある品評会で「牛の体重」を当てるコンテストがあった。787名の応募があり、帰宅したガルトンはその結果を分析したところ、「肉屋や農家などその道のプロで鋭い目を持つはずの人たちが推定した体重」よりも「全応募者による予想の中央値」の方が正確だっただけでなく、それが正解とたった1ポンドしか違わなかったことに驚いた。”

ガルトンはこの研究成果を「ネイチャー誌」に発表し、「最良の決定はしばしば大きな集団によってなされる」という「vox populi（ウォクス・ポプリー）」の考え方を説明することになります。
※本コラムはThe Conversationのコラムを元にお届けしています。

数の力

Francis Galton（フランシス・ガルトン卿）の逸話を「プロの翻訳者を対象とした大学の講座」にたとえてみましょう。講座では、参加者は自分の洞察力や巧妙な発見を共有し、それをグループで分解し、議論し、批評する機会があるとしましょう。そしてその中からベストな解決策を最終バージョンとしてアレンジし、そこに参加者すべての、最もインスピレーションに満ちたアイデアを集結させるのです。

このチームワークによる翻訳結果が、どんなに優秀であっても個人の翻訳者によるものよりも必ず質の高いものになるのです。そして、その中からベストな解決策を選び、最終的なバージョンに仕上げるのです。このチームワークによる翻訳は、どんなに才能のある参加者であっても、個人の作品よりも必ずや質の高いものになるはずです。

その延長線上で考えると、私たちは次のように思うかもしれません。「集合知が優れた結果を導くのであれば、それを多かれ少なかれ模倣した統計モデルを持つ機械翻訳（自動翻訳）が、現実の人間の翻訳者に取って代わるのではないか？」と。

人工知能の時代にはインターネットが巨大な教室であり、巨大なグループプロジェクトであり、何百万人ものメンバーを抱える独自のドリームチームであり、翻訳されたテキストがインスピレーションとして機能する場所であるかのように、数の力を活用して翻訳を行うことができるのではないか？と。

これは一見素晴らしいようですが、残念ながら私は機械翻訳（自動翻訳）信者を失望させなければなりません。たしかに、インターネットには多くの専門家がいますが、彼らは「あるテキストをどのように翻訳すべきか」について、ただ言いたいことのある一般人のひとりにすぎません。

AIはこれら多くの「言いたいこと」のなかから、信頼できると判断した情報源（例えば、主要な組織や評判の良い企業）を上位に配置するよう最善を尽くしています。しかしその結果が真実というわけでなく、それはただ地球全体、つまりオンラインで何かを書き、発表した人たちの意見を求めている行為にすぎません。

先ほどの品評会の例で言えば、これは良くも悪くもただ地球上のすべての人に意見を求めているだけでなく、見ている生き物が何であるかも特定せずに皆で推測し合っているようなものです。なぜならコンピュータは見つけた解に意味を与えることができないからです。

だから機械が弾き出した特徴から統計的にその生き物が何であるかはわかるかもしれませんが、完全に一致することはないでしょう。つまり、牛の品種に関する推測だけでなく、ノミからシロナガスクジラまで、地球上のあらゆる動物に関しての推測が可能があり、その際に生じるすべての矛盾を誤って解決できてしまうということです。

最後に、最も重要なことですが人間による共同翻訳は、教授であれ発表者であれグループを導き、最終判断を下す、ある種の羊飼いのような存在が必要になるのです。つまり、大勢の翻訳者の解答を選別し、プロセスを軌道に載せるためのガードレールを提供する、より高い権力が存在する必要があるのですが、人間が介在しない機械翻訳（自動翻訳）の場合、このガードレールがないのです。

ミスター・シットホールからジャンプスーツまで

もちろん、機械翻訳（自動翻訳）をチェックするためのセーフガードもいくつかあり、通常は単語そのものが文の意味を判断する良い指標となります。次に文脈ですが、ニューラル技術はこれを考慮し、可能性のある単語の範囲を特定の言語族に絞り込むことができます

牛の例で言えば、最も基本的な機械翻訳（自動翻訳）エンジンなら「大型の家畜」程度、最も洗練された機械翻訳（自動翻訳）エンジンなら「牛の品種」に絞って検索することになりますが、それでも「小型のアンガス牛」と「大型のシャロレー牛」の違いを考えるとその誤差は大きくなってしまいます。そのため一見流暢に見える文章でも、意味のある情報が省略されていたり、不快なエラーや唐突感のある言葉、性差別的な表現が散見されたりするのは当然のことです。

また、機械翻訳（自動翻訳）エンジンは文の意味を「理解」することができないため、統計的に最も可能性の高い解を選びますが、それが原文の意味とは正反対になる場合もあり得ます。たとえばこの調査では、”UK car industry in brace position ahead of Brexit deadline（ブレグジット期限を前に、英国自動車産業は窮地に立たされている）” という英語の見出しを “L’industrie automobile britannique en position de force avant l’échéance du Brexit（ブレグジット期限を前に、強い立場にある英国の自動車産業）” とフランス語で翻訳してしまっています。

原文の英文は、英国の自動車産業が最悪の事態を恐れている（そして、墜落前の飛行機の乗客のように防御態勢を敷いている）ことを意味していますが、逆にフランス語訳では、英国車が力のある立場にある（en position de force）となっているのです。つまり機械翻訳（自動翻訳）の出力には、どんなに流暢に見える翻訳でもこのようなエラー（用語の間違い、訳抜け、誤訳）が多く存在するため注意が必要なのです。

私の同僚Ben Karl（ベン・カール氏）は自身のウェブサイトでいくつかの例を紹介していますが、たとえばメキシコの公式観光サイトが高級ビーチリゾート地Tulum（トゥルム）の名称を「jumpsuit（ジャンプスーツ、つなぎ）」と自動的に機械翻訳（自動翻訳）してしまった例などがあります。また、ほかにも中華人民共和国の国家主席の名前をビルマ語から英語に機械翻訳（自動翻訳）した結果「Mr.Shithole（和訳自粛）」になってしまったという残念な例もあります。

正規化と平準化

機械翻訳（自動翻訳）のもうひとつの問題点は、「正規化」と呼ばれるプロセスですが、これはあまり意識されていないかもしれません。過去に翻訳した結果だけを用いて翻訳が行われた場合、その過程で発明性、創造性、独創性が損なわれることはいくつかの科学的研究によって証明されています。

また、学者たちは「アルゴリズムの偏り」についても言及しています。これは機械翻訳（自動翻訳）が「ある単語が翻訳に使われれば使われるほど、それを提案する可能性が高くなる」というものですが、その結果頻度の低い（つまりより創造的な）翻訳が除外されてしまうというものです。

機械翻訳（自動翻訳）は文章の響きを美しくしたり、詩的な表現を駆使したりせず、ただ意味が伝えるだけのものですが、このような平準化、ある種の均質化は、その内容が文化的、文体的、あるいはイデオロギー的であれ文学的な文章に対しては特に問題となり得ます。なぜなら、文学的な文章はその性質上、標準的なものから逸脱し、独特の言語的風味をまとうものだからです。

ニューラル機械翻訳（自動翻訳）が登場する10年以上前に書かれた、翻訳者Françoise Wuilmart（フランソワーズ・ウィルマート）の平準化に関する優れた論文が今だからこそ特に響きます。

“「平準化」が文芸翻訳を難しくしている。テキストを平らにする、あるいは「正規化」することは、テキストを鈍らせる、あるいは湿らせる、自然な浮き彫りを平らにする、尖った部分を削る、溝を埋める、そもそもテキストを文学的にするあらゆる皺をアイロンで伸ばす、ということだ。”

意図的かどうかは別として、これがまさに機械翻訳（自動翻訳）が行っていることなのです。機械翻訳（自動翻訳）によって標準化された文章が作られ、それが他の機械翻訳（自動翻訳）エンジンに入力、使用され、さらに標準化され…といった具合に、時間が経つにつれて言語の貧困化が進むという悪循環に陥ってしまうのです。

「機械翻訳（自動翻訳）された文章は語彙が少ない」という研究結果もあります。ますます均質な言語にさらされることは、自分自身を表現する能力、つまり自分の考えを表現する能力を奪うことになるのです。

人間の専門性が不可欠

翻訳業界が今、技術的な転換期を迎えていることは誰もが認めるところです。機械翻訳（自動翻訳）の利用機会は明らかに増えており、その出力結果はますます利用しやすくなっています。しかし機械翻訳（自動翻訳）されたコンテンツにはあらゆる種類の誤りがある可能性があること、一見流暢で首尾一貫した文章の中にも誤りが潜んでいる可能性があることを忘れているユーザーがあまりに多いのです。

このような機械翻訳（自動翻訳）の品質を見極めることができるのは、翻訳の専門家だけです。機械翻訳（自動翻訳）を使うかどうかは、写真家が撮影条件に最適なカメラを選ぶように、会計士が自分の仕事に最適なデータ入力方法を選ぶように、現実の人間だけが決めることができるのです。翻訳も他の職業と同様、ある程度自動化からは逃れることができません。

プロフェッショナルが自分の専門性を発揮し、反復作業を避け、最も付加価値の高い分野に集中できるようになることにつながるこの変化に、私たちはむしろ期待することができます。しかし機械翻訳（自動翻訳）の使用にあたっては、これまで以上に注意が必要であり、無差別に使用することは避けるべきです。

真のプロフェッショナルとは、お客様が求める優先順位に基づいて、代表的な三つの要素「時間」「予算」「品質」から最適な方法を選択するものであり、言語と文化に精通したコンサルタントとして、完璧な多言語コミュニケーションを確保する鍵となるものです。1906年にPlymouth（プリマス、英都市）で開催された品評会で優勝した肉屋が言ったように、人間の専門知識こそが、毎回確実に的中させることができる唯一の方法なのです。