MT利用ガイドラインの必要性
山田優
立教大学・AAMT
1. MT利用ガイドラインの必要性
「自転車進入禁止」が「No Entrance Bicycles」、「授乳室」が「Suckle room」。千葉県浦安市で機械翻訳による誤訳が発覚した。その後、浦安市は検証委員会を設置。2021年3月に同委員会は、誤訳の理由と対策を『浦安市多言語表記検証報告書』[1]にまとめた。必要だったのは翻訳確認体制の整備である[2]。
最近話題の「日本の英語を考える会」[3]は、日本国内に溢れる「変な英語」に関しての情報共有や意見交換を行っている。扱う事例は、機械翻訳による誤訳だけではないが、2020年には同グループが目黒区のホームページに「Dark Procedure」という意味不明の表記を見つけ、それが「くらし手続き」の誤訳であることを確認。目黒区に連絡をして修正してもらった事が話題になった。機械翻訳の誤訳であった。上で挙げた例以外にも、数多くのMT過誤の問題を、読者も知るところであろう。
さて、ここでのポイントはMTの実力不足では当然ない。考えてもらいたい。上述した問題はすべて人災ではないだろうか。具体的には、翻訳確認体制の整備の不足によるものかもしれない。そして、その根本原因は、人々の「翻訳」に対する不理解である。MTを使うのは人であり、MTユーザへの啓蒙は、まさに喫緊の課題となっている。
上の状況に鑑み、AAMTでは委員会を発足させ、健全かつ正しいMT(および翻訳・通訳)の利用を推進すべく「MT利用ガイドライン(仮名)」を作成することを決定した。本稿では、その経緯と概要を示す[4]。
2. MTとは何か
ニューラル機械翻訳は、これまで越えることができなかった翻訳品質の天井を突き破る技術的な快挙を成し遂げた。それに伴い、MTユーザ数は増え続け、MT利用の場は拡大している。公共機関、ビジネスの利用にとどまらず、産業翻訳におけるMT+PEも、もはや当たり前になった。最近では、外国語教育の現場で、英語を学ぶためにMTを活用するという議論もなされている。
この状況は、MT利用を推進するAAMTにとっては喜ばしいことであるが、上述したようなMT過誤と誤訳による事故は社会問題に発展してきている。同協会は、健全かつ正しいMT利用方法をユーザに啓蒙しなければならない立場にもある。
大切なのは、ユーザに「MTとは何か」を理解してもらうためには、「翻訳とは何か」を知ってもらう必要があるということだ。ユーザは、これまで翻訳自体についても、十分な説明を受けてこなかった。今のMTの勃興は、ユーザに「翻訳とは何か」を知る機会を与えてくれたとも言える。
ニューラル機械翻訳の勃興とAAMTの創立30周年との同期により「時は来たり」と喝破した隅田会長の言葉は正しく[5]、いま、このタイミングで「MT利用ガイドライン」を作成することは理に適っているのである。
3. ガイドラインの内容
では、「MT利用ガイドライン」の中身はどうなっているのか。実際には、AAMT会員の志望者で構成する委員会で検討中であり、詳細はまだ決まっていない。以下では、「MT利用ガイドライン」のイメージを理解してもらえるような参照冊子と、検討事項の概要を示す。
1つ目。『翻訳で失敗しないために(Translation Getting it Right: A guide to buying translation)』[6]。2011年にATA(アメリカ翻訳協会)が作成し、JTF(日本翻訳連盟)の協賛で日本語版も発行された翻訳会社に(人手)翻訳を発注するユーザが翻訳で失敗しないための要点をまとめたガイドラインである。徹底的に翻訳ユーザの視点から書かれているのが良い。30ページに満たない冊子で、内容も簡明である。「本当に翻訳する必要があるのか」、「言葉でなく絵や図で伝えたほうがよいのでは」、といった助言から始まり、原文の意味が伝わるだけでは駄目で、珍訳は笑いものにされ、ブランドや会社のイメージダウンになること等が書かれている。原文さえ用意すれば、翻訳者が適当に訳してくれるだろうという思い込みを変えるべく、ユーザ啓蒙に励む書である。「翻訳とは何か」をユーザ側の立場に立って、様々な視点とレベルで説明する。これを真似て「MTで失敗しないために」のような冊子を作れると良い。
2つ目。『特許ライティングマニュアル』[7]。2013年に産業日本語研究会が初版を発行した。特許文書を例に挙げつつ、人や機械にとって明瞭で翻訳もしやすい日本語文の書き方を紹介する。いわゆるプリエディット(前編集)のコツに似ている。文章の誤解防止が期待でき、翻訳者が翻訳しやすくなるのみならず、機械翻訳も容易になるので、高精度な機械翻訳文の低コストでの作成が狙える。大きな7つの基本ルールが明確に示されている。「短文にする」や、節・句レベルでは「省略しない」「読点を工夫する」などシンプルで具体的な説明がある。言語的な説明に限られるが、MTを使うという視点から参考になる情報が多い。
上記以外にも、現在、我々はあらゆる資料を参照し、ガイドラインに含めるべく情報と詳細化のレベルを検討している。例えば、JTF品質ガイドラインにあるようなエラーカテゴリと対応づけて、「正確性」「流暢性」「用語」「スタイル適合」の観点からMTの実力を説明する方法もある。上述したプリエディットの要素と対応づければ、「短文にする」ことで「正確性」が向上するし、そうしないと正確性が低下するという説明ができる。
言語要素ではなく、利用状況に関する要素も重要だ。例えば、日本語(母語)と英語の組合せにMTを使う場合は、ユーザの英語力と訳出の方向性が重要な要素になる。英語力の高い人と、英語ができない人がMTを使う場合では、問題は異なるかもしれない。日本語への翻訳と英語への翻訳も、使い方やリスクの重篤度が異なるだろう。
他にも、オンラインMTを使うことに伴う、セキュリティ、倫理、人権、責任の所在などの諸問題を、ガイドラインにどこまで含めるのかも検討している。
4. 今後の予定
「MT利用ガイドライン」は2022年5月末の完成を目指している。段階的に内容を充実化させていくこともあるが、その場合でも第1段階の内容を、その時までに発行する。