« 【訃報】-山岡洋一さん | トップページ | スティーブ・ジョブズ、アップルCEOを辞任 »

2011年8月22日 (月)

『アインシュタイン その生涯と宇宙』と機械翻訳とモラルハザード

『アインシュタイン その生涯と宇宙』下巻が機械翻訳ですごいことになっている件、翻訳者仲間でもあちこちで話題になっています。その議論で気になったことを少し書いてみたいと思います。

ちなみに、出版関係者の意見については(↓)の一読をお勧めします。私程度の関わりでも知っているような話が大半ですが(知らなかったのは武田ランダムハウス・ジャパン固有の事情くらい)、おそらく、一般的にはあまり知られていない話であり、読んでおいて損はないと思います。

機械翻訳をそのまま出版?トンデモ本の裏にあるもの

意見は大別すると(↓)のように3種類でしょうか。

  1. ほらみろ、機械翻訳ソフトなんて使い物にならない
  2. 機械翻訳ソフトの問題点が浮き彫りになった事件で、機械翻訳ソフトを使うべきでないことが改めて示された。
  3. 機械翻訳ソフトのようなツールは使い方次第。今回の事件はモラルハザードが起こしたものであり、得失を理解してうまく使えばいいだけの話。今回の件で機械翻訳はダメとなってほしくない。

ちなみに私は2番の立場です。なので、その他の立場についてコメントしたいと思います。また、1番は横に置いておきましょう。そう思う人は機械翻訳ソフトに手を出さないでしょうし、3番の人が「機械翻訳ソフトなんて使い物にならない」と言われて考えを変えることもないと思いますから。

「使い方次第で機械翻訳が役(訳?)に立つ」という意見を聞くと、最近は、「使い方次第で原子力は安全だ」という議論を思いだします。どちらも正しいんです。「使い方次第」という条件がついているわけで、つまり、「その条件を外せば危険」と言っているわけで。

問題は、「条件を外したとき、どこまで危険なことになるのか」と、「危険性の低い代替案はないのか」なんですよね。

原発の場合、最悪は今回の福島原発事故みたいなことが起きるわけです。いや、最悪という意味では日本に人が住めなくなるという可能性だってあるのかもしれないわけですが、まあ、「現実的な最悪」という意味で。

機械翻訳の場合、最悪は今回のアインシュタイン本のようなことがおきるわけです。いや、こちらも最悪は、機械翻訳の出力そのままという可能性もあるわけですが、福島原発事故と同じで「現実的な最悪」という意味ではこれが最悪でしょう。

原発の場合、火力その他、代替案はあるわけです(火力は事故が起きたら火が消えて停止する、そういう意味で本質的に安全な技術)。地球温暖化なども含めて考えるとどれがいいとは一概に言えないところはありますが、少なくとも省エネルギーがプラスであることは確かでしょう。

機械翻訳の場合、よく言われるメリットは(↓)です。

  1. 用語のデータベース化などに使えば質の向上も見込める
  2. リーダビリティがある程度下がってもコストダウンが実現できる。内容が知りたいという程度の必要性なら低コストで満たせる

1番の「用語のデータベース化」ならならほかにいくらでもやりようがあります。そういうことができる「翻訳支援のソフトウェア」なら、いろいろなものが公開されていますから(私もひとつ、SimplyTermsというものを公開しているくらいです)。そういう意味で、機械翻訳に原発ほどの存在意義はないと言えます。

危険性の低い代替案があるのに、「この方法でもできるから」と余計なリスクのあるものを(消極的でさえ)推奨・推進するのは、少なくともその道の専門家としてすべきではないと私は考えます。

2番は、「そう思うのは幻想にすぎない」です。

2番については、「機械翻訳ポストエディットのガイドライン」という記事が詳しく、また、よくまとまっていると思います。機械翻訳ソフトの使い方としてよく推奨されるやり方については(↓)のように書かれています。

「十分な水準」の品質を実現するためのガイドライン

「十 分な水準」とは、理解可能で(すなわち、主な伝達内容が理解でき)、正確である(すなわち、原文と同じ意味を伝えている)が、必ずしも文体は準拠していない水 準として定義されます。 文章はコンピュータによって生成されたもののように聞こえ、構文にはどことなく不自然さがあり、文法的にも完璧ではないかもしれませんが、伝達される内容 は正確です。

  • 意味的に正しい翻訳を目標とします。
  • 間違って追加されたり、欠落している情報がないことを確認します。
  • 不快感を与える内容や、不適切あるいは文化的に受け入れられない内容を編集します。
  • 可能な限り機械翻訳の生出力データを使用します。
  • 綴りに関しては基本的な規則を適用します。
  • 単なる文体上の修正は、行う必要はありません。
  • より自然な流れの文章にすることのみを目的として、文の構造を変更する必要はありません。

問題は、「意味的に正しい翻訳」が実現できない点です。理由は、翻訳作業というのは原文→訳文という一方通行ではなく、循環的だからです。

機械翻訳に関する天動説と地動説、そして解釈学的循環」では単語の意味や文章の意味といった話の部分を引用していますが、この循環は翻訳という作業全体においても成立します。原文を読んで理解した内容を訳文として書く。その訳文を読み、原文を見直してズレを発見する。そのズレを修正して……と言う具合にです。ループが小さいものから大きいものまでたくさん重なって回っているイメージです。

可能な限り機械翻訳の生出力データを使用」しつつ、「間違って追加されたり、欠落している情報がないことを確認」し、「意味的に正しい翻訳」を実現するのは、だから不可能なのです。「構文にはどことなく不自然さがあり、文法的にも完璧ではない」状態では上述のループが途中で止まってしまうからです。

それがどういう結果を生むのかは、「機械翻訳ソフト利用による翻訳の実例」を読んでいただければわかるはずです。契約を専門とする翻訳者が機械翻訳ソフトを使い、ここまでできるのだと提示されたものに対し、専門外の私が上述のループを回して構文の不自然さや文法的な不備をなくそうという方法でどこまでまちがいを指摘できるかトライした例ですから。

もちろん、もっと簡単なものなら機械翻訳+ポストエディットでも大きなまちがいが入ることはないでしょう。でも、そういう文章だけの案件ってまずありませんよね。必ずといっていいほど、両者が混在している。

そういうときは使えるところだけ使えばいい。そういうことを言う人もいます。でも、その状態で、この文は機械翻訳の出力が使える、この文は使えないとどうやって判断するのでしょうか。そういう判断をしている時間があったら、最初から訳していったほうが速いと思うのですが。特に、機械翻訳の出力が使えないと判断したら最初から訳し直しになるわけで、完全に二度手間です。

結局、「機械翻訳ソフト利用による翻訳の実例」のように使えないケースまで機械翻訳ソフトでやってしまうことになります。結果、誤訳が混入する。

言い換えれば、「多少のまちがいがあってもいい」なら機械翻訳+ポストエディットもアリでしょう。

まあ、上述の「機械翻訳ポストエディットのガイドライン」でも「意味的に正しい翻訳を目標とします」とあくまで目標であって実現するわけではないと取れる書き方になっているのは、まちがいが避けられないと言いたいからなのかもしれません(←皮肉です)。

それはともかく、現実問題として、「多少のまちがいがあってもいい」というのは、機械翻訳ソフトを使う人たちの心に多少なりともわだかまっている思いでしょう。だって、安いんだから。だって、納期がないんだから。機械翻訳ソフトでも使わなければやってられない。高い料金、十分な納期をもらえればちゃんとできるけど、それができないなら仕方がない。まちがいだって、ちゃんとやるより増えるかもしれないけど、料金と納期を考えれば仕方がない。そういう思いが一度もよぎることなく機械翻訳ソフトを使っている人は、いないだろうと思います。なにしろ、機械翻訳ソフトを使ったら翻訳の質が落ちるのみならず誤訳がたくさんはいってしまうから使わない、翻訳メモリーさえも翻訳の質が落ちかねないから使わないとしている私だって、あまりに短い納期のときには、そういう思いがよぎるのですから。

仮に、「多少のまちがいがあってもいい」と認めたらどうなるのでしょうか。

「多少」というのはどのくらいでしょう。1ページにひとつくらい? 段落に1つくらい? それとも今回のアインシュタイン本(「悲惨すぎる翻訳-『アインシュタイン その生涯と宇宙』」「悲惨すぎる翻訳-続報」)くらいいたるところに? アインシュタイン本は多すぎるとして、じゃあ、どこで線を引きます? ある線を引いてそこで踏みとどまっていたとして、さらに安い料金あるいはさらに短い納期で仕事が来たとき、その線をちょっとずらすのは仕方なくないのでしょうか? ずらしても仕方ないのなら、料金や納期が極端なら結果も極端でアインシュタイン本でも出してしまう?

アインシュタイン本はモラルハザードだという意見をよく見ますが、「多少の」程度の違いこそあれ、同じモラルハザードはあちこちで起きている。そう私は思います。

|

« 【訃報】-山岡洋一さん | トップページ | スティーブ・ジョブズ、アップルCEOを辞任 »

翻訳-ツール」カテゴリの記事

翻訳-業界」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/111098/52542957

この記事へのトラックバック一覧です: 『アインシュタイン その生涯と宇宙』と機械翻訳とモラルハザード:

« 【訃報】-山岡洋一さん | トップページ | スティーブ・ジョブズ、アップルCEOを辞任 »