機械翻訳の懐疑論者は大きな見落としをしているのか~見落としの見落とし~
1年ほども前のことですが、知り合いのブログに「機械翻訳の懐疑論者は大きな見落としをしていないだろうか」という記事が投稿されました。この記事に対する反論を書いてみたいと思います。
半年ほども前に書いたのにアップロードを忘れていました。
この話、特に後半は、機械翻訳を使う人たちに共通する論理で、いろいろなところで陰に陽によく言われます(前半は後述するように、このページを書かれた人のうっかりまちがいです)。このようにはっきりとウェブ上に書かれているのをほかに見た記憶がないので、ここへの反論という形で書きますが、一般論として理解すべき内容だと思います。
取りあげるポイントは2点。「スピード」と「質」です。
■スピードについて
上記ブログにおいて前半に書かれているスピードの話は論理自体が破綻しているので、こちらは取りあげなくてもいいかなと思うのですが、一応、論理の矛盾点だけ指摘しておくことにします。
ellersleyさん(上記ブログの筆者)は、(↓)のように書かれています。
「機械翻訳+ポストエディット(+翻訳メモリ)」という作業プロセスによる翻訳スループットは1日当たり4000ワードくらいというお話に、質問された井口さんを含め、会場全体が「あんまり大したことないな」という空気に包まれたのですが、その雰囲気に、私は大きな違和感を覚えました。
そして、これに対する反論として(↓)のように書かれています。
当たり前のことですが、「100%マッチを除くファジー部分で1日4000ワードくらい」なのですから、1日のスループットは、4000ワードに100%マッチ分を上乗せした値です。100%マッチ部分が6000ワードなら、その翻訳者の1日のスループットは10000ワードです。ローカライズの場合、100%マッチ分は課金されないため、計算から漏れてしまいがちですが、蓄積されたTMが生み出した成果なのですから、それもスループットであることには変わりありません。オール手動翻訳者は、TMを使わない以上、この100%マッチ部分も自分の手で訳すわけです。しかもTMがないわけですから、過去の訳文との不整合が発生します。ローカライズという土俵において、これは許されません。
「機械翻訳」を略すならMTであり、TMというのは「翻訳メモリー」ですよね? ここに書かれている内容も機械翻訳ではなく翻訳メモリーの特徴ですから、MTをTMと書きまちがえたという話でもなさそうです。つまり、「翻訳メモリーにAというメリットがあるから機械翻訳にAというメリットがある」となっているわけで……論理的に破綻していますよね。
念のため書いておくと……JTF翻訳祭で4000ワードというスループットを聞いて「たいしたことないな」と私は思いましたし、会場もそういう雰囲気に包まれたと感じました。その理由は、「(既存の翻訳メモリに対する) 100%マッチを除くファジー部分で1日4000ワードくらい」なら、ちょっと手の速い翻訳者が翻訳メモリー(TM)を使うだけでいい、なにも機械翻訳(MT)を使う必要もそのメリットもないってことになるからだと思います。
ちなみに、マニュアルの翻訳なら、手の速い翻訳者が入力軽減の工夫をすれば新規翻訳で1万ワード/日くらい十分にいけます(100%マッチを除くファジー部分なら1万何千ワードか進められることになります。100%マッチとファジー部分の比率がellersleyさんの書かれているくらいだったとしたら、1日のスループットは2.5万ワードくらいに達します)。そのペースをずっと続けられるのかと言われると、いくら入力軽減の工夫をしても何年かで手が死ぬので(腱鞘炎になるでしょうね)無理となるのですが、それは、MTを使うなどの場合でも同じです。
■質について
ellersleyさんは、(↓)のように書かれています。
マーケティングコンテンツのような散文であっても、頻繁に訳していると、
「この文はこの単語を主語にするのが良いな」とか、
「この名詞は動詞化して訳すのが良いな」とか、
「前の分とのつながりを考えると、この情報を強く打ち出すのが良いな」
といった具合に、思考プロセスの自動化が徐々に進行してきます。そしてそのプロセスは、マニュアルのような定型文にも応用されるようになってきます。逆に、用語や表現に一貫性を持たせることは、散文を訳すときでもある程度必要な要素であり、特許などの翻訳で培ったスキルが散文にも応用されます。自身のスタイルを肯定するためのバイアスが多少入っているかもしれませんが、このような相乗効果が生まれているような気がするのです。
私をはじめとするTM・MT懐疑論者に対し、「そういう相乗効果に気づいていない」という反論は、陰に陽によく出てきます。
でも、ですね、私たちは、そういう相乗効果があることはわかった上で言ってるんです。少なくとも私の場合、そういう(ellersleyさんが言われるような相乗効果がない)ことを問題だとしているわけではなく、TM・MTを使った場合と使わなかった場合を比較し、どちらがいいのか、どちらにどういうメリットがあり、どちらにどういうデメリットがあるのかと考えたとき、TM・MTの使用には大きなデメリットがあると言っているわけで。
もう少し詳しく説明しましょう。
まず、「逆に、用語や表現に一貫性を持たせることは、散文を訳すときでもある程度必要な要素であり、特許などの翻訳で培ったスキルが散文にも応用されます」とのことですが、「特許などの翻訳で培ったスキル」は、「(TM・MTを使った)特許などの翻訳」以外では身につかないスキルなのでしょうか? そんなことはないですよね。用語や表現に一貫性を持たせるというのは、どのような翻訳であっても基本中の基本ですから。それこそ文芸作品の翻訳であっても必要なスキルです。どこまで一貫性を持たせるのかは分野や案件によって大きくことなりますが、一貫性を持たせるべきところに持たせるスキルはどのような翻訳をしていても必要なものであり、どのような翻訳をしていても身につくというか、身につかなければそもそも翻訳の世界にいられない話です。
いじわるな言い方をすれば、一貫性、統一性を強く求めるTM・MT使いの世界で生きていると、分野や案件によって一貫性、統一性のレベルを調節しなければならないという意識がなくなったり、意識はあってもどのくらい調節すればいいのかのスキルが身につかなかったりするわけで、散文の翻訳に悪影響が出る恐れがあります。逆に、一貫性、統一性のレベルを調節しなければならないマーケティングコンテンツなどをずっとやっていれば、「ローカリでは一貫性、統一性を高く」と言われただけでかなりのところまで対応できるはずです(対応したい、あるいは、そういう仕事をしたいと思うかどうかは別の問題)。
というわけで、ellersleyさんの主張のうち、「マーケティングコンテンツのようなものを訳しているときに気づいたことがマニュアルに応用されるようになる」が残ることになります。
この主張、TM・MT推進派の人からよく言われます。ellersleyさんのように、「だから、機械翻訳の懐疑論者は大きな見落としをしていると思う」という部分も含めて。こう言われるたび、私は思うんです。どうしてみなさん、ご自分の論に大きな穴があるのを見落とされるのだろう、と。
もちろん、マーケティングコンテンツのようなものを訳しているときにこう訳せば質が高くなると気づき、そういうスキルを身につければ、TM・MTを使ったマニュアル翻訳の質も高くなっていきます。当たり前です。でも、だから、TM・MTを使ったマニュアル翻訳のほうがマーケティングコンテンツや散文の翻訳などより翻訳者にとってプラスになるとはなりませんよね。それどころか、この主張、翻訳者にとってプラスとなるのは、あるいは、翻訳スキルにとってプラスとなるのは、「少なくとも主には」マーケティングコンテンツなどの散文を訳すときだと、TM・MT推進者自身が言われているわけです。逆に言えば、TM・MTを使って訳していると、スキルの伸びは遅くなる、と。
「翻訳スキルの伸びはTM・MTを使った翻訳作業より散文を訳すプロセスのほうが大きい」という点については、TM・MT推進派と私のようなTM・MT否定派の意見が一致したわけですが、ついでに、どのくらい違うのかも考えておきましょうか。
たとえば、自分の仕事のうち、散文の占める割合が5割の人と10割の人を比べたとき、スキルの伸びが速いのはどちらでしょうか。その答えは、誰が考えても10割の人でしょう。意識その他がすべて同一だと仮定するなら、両者の差は、少なくとも、倍半分になります。おそらくはそれだけですまず、10割の人は5割の人の3倍とかのスピードで伸びていくんじゃないでしょうか。どう訳したらいい訳文が生まれるのか、倍の時間考えていれば、気づくことは少なくとも倍、たいがいは倍以上になるものですから。それこそ、さまざまなポイントについての考察が相乗効果を生むのですから。
ちなみに、だから翻訳者全員がTM・MTを否定すべきだとも私は考えていません。TM・MTの世界で生きていくと選ぶ翻訳者がいてもいいと思うし、そういう人が、ときどきマーケティングコンテンツなどの散文を訳したりして、そこで得たものをTM・MTを使う翻訳に活用していくというのはいい形だとも思います。ただ、その選択がなにを意味するのかをきちんとわかった上で選ぶべきだと思っているだけのことです。
(2014年6月20日追記)
ellersleyさんが、最後に、「『現状維持は緩やかな下降に等しい』というフレーズが誰の言葉かは忘れてしまいましたが、名言だと思います」と書かれています。彼がどこで見かけたのかは知りませんが、同じことは、私もこのブログに書いています(↓)。
「人は下りのエスカレーターに乗っている」
上記ページでも書いていますが、進んでいるのは技術だけでなく、言葉も進んでいます。その部分についても、少しでも速く前に進めるように気をつけなければ、相対的に遅れていくことも十分にありえると私は思います。
| 固定リンク
「翻訳-スキルアップ(各論-品質)」カテゴリの記事
- テトリス(2018.06.08)
- 翻訳フォーラムシンポジウム2018――アンケートから(2018.06.06)
- 翻訳フォーラムシンポジウム2018の矢印図――話の流れ、文脈について(2018.05.31)
- 翻訳フォーラムシンポジウム&大オフ2018(2018.05.30)
- 翻訳メモリー環境を利用している側からの考察について(2018.05.09)
「翻訳-ツール」カテゴリの記事
- 翻訳者視点で機械翻訳を語る会(2019.01.23)
- アルク『翻訳事典2019-2020』(2019.01.31)
- 翻訳メモリー環境を利用している側からの考察について(2018.05.09)
- 機械翻訳+PE vs. 人間翻訳(2017.02.24)
- 翻訳者が持つ最大のツールは「自分の頭」(2017.02.02)
「翻訳-スキルアップ(総論)」カテゴリの記事
- 翻訳の方向性について(2018.06.07)
- 機械翻訳の懐疑論者は大きな見落としをしているのか~見落としの見落とし~(2014.06.19)
- 不実な美女か貞淑な醜女か(2012.10.05)
- 翻訳作業時間モデル(2009.11.07)
- 翻訳は何から学ぶべきか(2011.06.29)
コメント
「特許などの翻訳で培ったスキルが散文にも応用されます。」の部分で、椅子からころげおちました。……翻訳、いや文章を学ぶうえで、どっちが基礎なのかがまったくわかっていらっしゃらない。
「普通の文章を書けない人が、特許明細書を書いてはならない」は、翻訳以前に特定言語(日本語)内での文章(含:明細書)の常識。
これを逆に論じるあたりで、もう、その「特許」に関して生産される訳文の質が見えてしまいます。
えっと、ワタクシ、一応、特許翻訳者で、明細書も書いておりました。
つけくわえておくと、特許の「従来技術」の部分は、「散文」の領域に入ると思います。この部分で論じられる技術は、それ以外の部分で論じられる技術とは、当然(←従来なんですから)異なります。それこそ、同じ「◎◎(漢字二文字)」であっても、同じ用語を使わない方がデフォです(←だって、原則、違う時期の違う明細書に出てくる用語なんですから)。
そういうことが、何もわかってないんだなぁ、と思いました。
投稿: Sakino | 2014年6月20日 (金) 06時53分
(少々脇が甘くて、誤読される余地があるかもしれないので、付言しておきますと、従来技術で、同じ用語が出てきたときには、「疑え」というはなしです。
日本語で同じ用語の範囲にギリギリおさまっても、明細書の他の部分で使っている英語の用語で大丈夫かどうかなんて、賭けみたいなものですから。
……テクニカルタームというのは、そういうものなわけで、「用語を一致させるスキル」というときには、「危ないときには、同じ用語は使わない」というスキルがあって、はじめてスキルたりえるわけなんですけれども……以下略。)
投稿: Sakino | 2014年6月20日 (金) 06時59分
> 「用語を一致させるスキル」というときには、
> 「危ないときには、同じ用語は使わない」というスキルがあって、
> はじめてスキルたりえるわけなんですけれども
言えてますね。用語統一、用語統一って話にいつも違和感を覚えていたのですが、その正体はコレだったんだと思いました。「危ないときには、同じ用語は使わない」というスキルの議論が抜け落ち、なんか変な方に行ってると感じていたようです。
投稿: Buckeye | 2014年6月20日 (金) 08時12分