« 人は下りのエスカレーターに乗っている | トップページ | スキルダウンは速く、スキルアップは遅い »

2008年5月28日 (水)

翻訳ツール-人間とパソコンの役割分担

■翻訳作業とツール

翻訳作業は、大きく二分することができる。

  1. 人間よりもコンピュータにやらせたほうがいい部分
  2. 人間がやらなければならない部分

この切り分け方と処理の仕方によって、大きな違いが出る。

20080525__44

人間よりコンピューターにやらせたほうがいい部分 人間がやらなければならない部分
頭よりも手が意味を持つ部分 手よりも頭が意味を持つ部分
(判断が必要な部分)
  • 入力
  • 辞書・用語集の検索
  • 機械的な統一
  • 訳文の案出
  • 訳語適否の判断
  • 訳語を統一すべきかどうかの判断

もう少し具体的に考えると、以下のようになる。

翻訳作業の流れ ポイント 担当 効率アップのポイント
1. 原文を読む
  • 英文をふつうに読むスピードは50~250ワード/分と言われる
  • 翻訳のために精読するときは、この半分くらいか?
人間 実力アップ
2. 辞書引きや用語確認
(用語集に登録されている
用語の確認を含む)
  • 辞書ソフトに単語を入力して検索ボタンをクリックするなどの手を動かす作業(辞書引き)
  • クライアント支給の用語集を検索して訳語を見つける
  • クライアント支給の表記に合致した訳語で統一する
コンピュータ ツール活用
  • 適切な訳語を探したり、辞書にない訳語を案出したりする頭を使う作業
人間 実力アップ
3. 訳文を考える
  • 訳文の入力と一体化していることが多く分けて考えるのは難しいが、イメージとして分けて考える。
  • ポイントのひとつとして、入力しながら考えると、思考のスピードが入力スピードまでしか上がらないという点があげられる
人間 実力アップ
4. 訳文の入力
  • 日本語の入力速度=50~100文字/分くらい
  • 訳文を考えつつ入力→遅くなる
コンピュータ+人間 ツール活用
+実力アップ

このように考えてくると、エディタやWordのマクロを使って多数のCD-ROM辞書を一気に引くといったツールが翻訳者に必須だということがよくわかる。

■TM(翻訳メモリ)/機械翻訳 vs. 手作業による翻訳

辞書引きツールの先にあるのは何だろうか。

辞書引きツールまでしか使わない状態だと、翻訳作業中、無駄が多いと感じる部分がある。以下のようなことは、翻訳者なら誰でも感じたことがあるだろう。

  • 訳を覚えていられず、同じ用語を何度も辞書で引いてしまう。
  • 長い翻訳で、前のほうで同じ用語をどのように訳したか、どのように表記したか、思い出せない。訳語や表記をばらけさせるわけにはいかないが、いちいち戻って確認するのは労力の無駄づかい。
  • クライアントによって表記が異なり、"interface"が「インターフェース」「インタフェース」「インターフェイス」「インタフェイス」のどれだったか思い出せない。はずすわけにいかない基本的な部分だが、本質的ではなく、そのようなところに労力をとられるのは大きなマイナス。
  • クライアント指定の用語を使わなければならないが、用語集は辞書と別個に検索しなければならず面倒。かといって、検索しないと基本的なこともできない翻訳者になってしまう。
  • 何度も何度もほとんど同じ表現が出てくると、いちいち入力するのがばからしく感じる。

要するに、2の上半分と4の部分、コンピュータにやらせたほうがいいとしている部分だ。このような手間を省きたいと思う翻訳者は多いらしく(誰でも似たようなことを考えるのだろう)、いろいろなソフトを翻訳の支援に使う人が増えている。

翻訳の支援という意味では、現在、TRADOSなどの翻訳メモリ型ツールがよく使われている。また、機械翻訳ソフトを下訳的に利用し、プリエディットとポストエディットによって最終的な訳文を作っている人もいる。

◎翻訳メモリ型ツールの欠点

翻訳メモリ型ツールは、繰り返しの多い案件や改版時にはかなりの効果が期待できる。しかし、くり返しが少ない案件では、ツールとしての効果はごく限られたものになってしまう。ツール自体がとても高価であるため(初期費用やバージョンアップの費用が高い)、マニュアルなどの翻訳を定常的に行う翻訳者でないと導入しても引き合わない可能性が高いという問題もある。

このあたりまではよく言われること。しかし翻訳メモリ型ツール最大の欠点は、実は翻訳メモリを有効とする根本的な考え方そのものにあると私は思う。

翻訳メモリ型ツールの根本は、原文が同じであれば訳文も同じである(少なくとも、ほぼ同じ訳文が使える)と考え、文単位で再利用しようというアイデアである。

文単位で再利用しようということは、前後の文脈がどうであってもそれなりになんとかなる訳文を作ることが求められる。そして、前後の文脈がどうであってもそれなりになんとかはまる訳文というのは、どのような文脈にはめてもそれなりにしかならず、決して、ベストなものにはなり得ない。「原文は親切に読む。訳文はいじわるに読む」が翻訳の基本だと私は思っているが、訳文をいじわるに読めば読むほど(そして修正すればするほど)、目の前の文脈にしか合わない訳文になっていく。これはつまり、再利用性が下がることに等しい。

それでも、マニュアルなど旧版を流用しつつ大部の改版をくり返し行うようなケースでは、翻訳メモリなしの翻訳は考えられない状況になっている。コスト削減という利益を得るのはソースクライアントだが、末端の翻訳者としては、自分の力ではどうにもならないところで流れが決まっており、その分野の仕事をするかしないかという選択肢しかないのだから、ある意味、どうしようもない。

◎機械翻訳ソフトの欠点

一方、機械翻訳ソフトは、翻訳者にとっては利益よりも不利益が大きいソフトだと言える。理由は、機械翻訳ソフトが出力するおかしな訳文を大量に読む結果、翻訳者として必要な基礎力の一つである言語感覚が狂うからだ。用語統一をしてくれるのはいいが、そこに留まらず、訳文の生成という翻訳者がやらなければならない部分まで処理してくれるのが最大の欠点というわけだ。

なお、「用語統一をしてくれる」とは言うが、ユーザー辞書に登録してもそれが100%、訳文に反映されるわけではない。ユーザー辞書の優先順位は高いが、それでも翻訳システム側の訳語が使われてしまい、ユーザー辞書に登録した訳語が使われないケースがまれにあるそうだ(機械翻訳ソフトを強力に推進している人に確認した話なので信憑性は高い)。

また、ユーザー辞書に複数の訳語を登録した場合、「システムがそのどれかを選んで」使うことになる。これが、登録訳語の中でその文脈に一番適したものだという保証はない。

機械翻訳ソフトを推進する人は、別訳語を選択すればいいという。たしかにそのような機能はある。しかし、別訳語を選択するためには、(↓)を翻訳者が認識できなければならない。

  • それがユーザー辞書に登録した用語であること
  • 不適切な用語が選択されていること
  • 別の用語がユーザー辞書に登録されていること

これは矛盾だと思う。

用語統一をパソコンにやらせようという考え方の背景にあるのは、前述のリストに書いたようにたくさんの用語を覚えたりする「無駄」をなくすためだ。そのためのツールを使いこなすには、用語を覚えていなければならないというのだから。 

■用語集による一括置換

もう一つ、比較的よく使われているのが、「用語集による一括置換」という方法。

これは、用意した用語集の内容で原文を一括置換してしまうことにより、用語の統一や入力の手間などを削減する方法である。訳文自体は、1文、1文、翻訳者が自分で考えて訳す。前述の翻訳作業時に感じる問題や無駄のほとんどすべてに対応できるにもかかわらず、機械翻訳と異なり、ソフトウェアが余分なことまですることはなく、作業上のデメリットが小さいという特長がある。最大の欠点は、必要なソフトウェアが市販されておらず、ツールを自作するしかなかったという点。

なお、一括置換というやり方にも、もちろん、限界と副作用がある。

◎手法の限界

一番大きな限界は(↓)。

  • 文脈によって大きく変化する用語を用語集に登録しておくと、誤訳につながる

機械翻訳ソフトが勝手な訳語を当てはめて訳文を作ってくれてしまうケースと同じことが起きてしまう、とも言える。

このような副作用を避けるためには、基本的に、以下のような用語だけを登録するようにすべきだ。

  • 専門用語
  • 固有名詞
  • クライアント固有の用語

これ以外の用語は慎重に取り扱うこと。また、訳していてどうも文脈に合わないと思ったら、必ず、原文に戻って考えること。

もうひとつの限界は(↓)

  • 登録用語を増やしすぎるとかえって効率が落ちる

一括置換の手法を導入し、登録用語が増えていくと、次第に効率が高くなる。そうなると、増えれば増えるほど効率が上がりそうな気がしてどんどん増やしてしまいがちだが、増やしすぎると文脈で変化する訳語が増えてゆき、適切な訳語の判断に時間がかかるようになる。そのような訳語は、むしろ原文ママで読んだ方がすばやく判断できたりするのだ。

◎処理の限界

一括置換処理時に、重複による問題がなるべく少ない順番に並べ替えてから置換したとしても、以下のようなケースは、正しく置換されない。

英語 (tab) 日本語
aaa bbb あいうえお
bbb ccc かきくけこ

このような登録があった場合、一方だけが置換され、もう一方は置換できずに残ってしまう。どちらが置換されるかは、一括置換ソフトウェアのアルゴリズム次第。私が作って公開しているSimplyTermsでは、AtoZソートで上に来るほうだけが置換される(このケースでは「aaa bbb」→「あいうえお」)。

◎自作ソフトウェアの紹介

このような形式では動作の重いワープロソフトよりも軽いエディタが便利なので、エディタによる翻訳作業を中心として、SimplyTermsというソフトウェアを作って公開している。組み合わせて使うと便利な秀丸用マクロ(秀丸はエディタソフト)も一緒に公開しており、これを導入すれば、私自身が毎日の仕事で使っている環境と同じものができあがる。興味のある人は自由に使ってみて欲しい。

|

« 人は下りのエスカレーターに乗っている | トップページ | スキルダウンは速く、スキルアップは遅い »

翻訳-ツール」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/111098/41350714

この記事へのトラックバック一覧です: 翻訳ツール-人間とパソコンの役割分担:

« 人は下りのエスカレーターに乗っている | トップページ | スキルダウンは速く、スキルアップは遅い »