翻訳-ツール

2017年2月24日 (金)

機械翻訳+PE vs. 人間翻訳

「人間対人工知能の翻訳対決」なるものが韓国で行われたそうです。

■人間、人工知能と「翻訳対決」で24.5対10の圧勝

「人間対人工知能の翻訳対決」世宗大学で開催

人間4人と人工知能翻訳ソフト3つが同じ課題を翻訳し、それを専門家3人が採点という形で、結果は、30点満点で人間が平均24.5点、機械翻訳が10点と人間の圧勝だったとのこと。

正確性なども含めて採点するなら、まだまだ人間が圧勝するのは当然で、予想どおりの結果だと言えるでしょう。ですから、そのあたりについては特にコメントしません。

着目したのは記事の末尾、「機械翻訳を活用する翻訳家」うんぬんのくだりです。

機械翻訳を活用した翻訳、機械翻訳を下訳に使う翻訳、機械翻訳+ポストエディットなど、言い方はいろいろとありますが、やり方自体は20年も前から話題になっていますし、実際、そういうやり方をしている人もそのころからいます。

正直、ああまたかと思う話なのですが、今回は、個人が言うのではなく、こうして報道までされるくらいに世の中がなっているわけで、それだけ注目度も高い、つまり、広がる可能性も高いのだろうなと思うわけです。

続きを読む "機械翻訳+PE vs. 人間翻訳"

| | コメント (1) | トラックバック (0)

2017年2月 2日 (木)

翻訳者が持つ最大のツールは「自分の頭」

JTF翻訳祭の前日、その前夜祭という形で十人十色が行った勉強会に参加しました。翻訳をする際、ツールについてどう考え、なにをどう使うべきか、どういうツールにはどういうメリットとどういうデメリットがあるのか、などの話です。講師は、しんハムさん

このブログではよくぶつぶつ言っているのですが、ツールはメリットが(誰にとってのものか混同した形で)喧伝されるばかりでデメリットが紹介されることはあまりありません。ですが、しんハムさんの話は、両方がバランスよく取りあげられていたと思います。

さて、プレゼン最後のほうで出てきたのが以下のスライド。

20161128_193520_canon_ixy_610f_img_

「うん、そうなんだよ。そのとおりだよ。うまいこと言うじゃないか」と思ったら、なんと、1年か1年半くらい前、しんハムさんが募集されたアンケートに私が書いた言葉だそうです(^^;) 本人、すっかり忘れてました。特に2番目。

忘れていたことは横に置いておいて。

「翻訳者にとっては自分の頭が最大のツールである」というのは、ツールというものを考える際にとても大事なポイントだと思います。つまり、いわゆるツールを選ぶとき、最大のツール(=自分の頭)の働きを妨げないことを最低基準として考える必要があるわけです。いくら便利そうに思えても、自分の頭という一番大事なツールが多少でも損なわれてしまうのでは本末転倒です。

続きを読む "翻訳者が持つ最大のツールは「自分の頭」"

| | コメント (0) | トラックバック (0)

2017年1月25日 (水)

トリプルモニター

モニター環境はなにかでちらっと触れると必ず詳しく聞きたいと言われるので、まとめておきます。

■基本的な考え方

モニターはなるべく大型、高解像度のものを選びます。物理的に同じサイズの文字を比べると、高解像度のほうがなめらかで読みやすく、目への負担が小さくなるからです。濁点・半濁点の読み間違いなども減ります。「濁点で入力したのに日本語IMEが半濁点にしてしまった」などの場合も、気づきやすくなります。

モニターが大型、高解像度になると縦方向の表示範囲が広がるのもメリットです。原文・訳文については、私の使い方だと(フォントサイズ14pt)、縦方向が1080ドットではちょっと狭い、1200ドットでぎりぎり、1440ドットくらいあれば十分だと感じています。目がよくてもっと小さなフォントが使える人なら縦1080ドットでも大丈夫かもしれません。辞書については、縦のドット数が多ければ多いほど、さぁ~っと確認していくとき便利です(スピードが上がります)。

まあ、大型、高解像度になると値段がはね上がるので、懐事情が許すかぎりということになるわけですが。

大型、高解像度のモニターとした上で、もっと広い作業スペースが欲しければ、デュアル化なりトリプル化なりすることになります。


■現在の構成

5年以上も前から、私の作業環境はトリプルモニターになっています(↓)。

 
(30インチ)
  (2560×1600)  
(横置き)
 
 
(21インチ)
(1200×1600)
(縦置き)
 
 
(30インチ)
  (2560×1600)  
(横置き)
 

PC側から見ると全体がひとつのモニターであるかのようになっています。つまり、6320×1600という横に細長いサイズです。

■仕事画面のスクリーンショット

Photo_2

3枚とも縦が1600ドットと同じ解像度なので、画面全体がきれいな長方形になっています。画面の縦サイズが違うと、段差になった部分にマウスが引っかかったりしますが、そうならないようにしてあるわけです。ちなみに、物理的な高さもほぼ同じなので(真ん中が1~2センチほど大きいだけ)、モニター間でフォントの表示サイズが違うといった違和感はありません。

続きを読む "トリプルモニター"

| | コメント (0) | トラックバック (0)

2016年12月15日 (木)

翻訳支援ツールを使うと翻訳の品質は上がるのか

baldhatterさんが書かれた「緊急提言 --- Tradosで一人前の翻訳者???」に関連してとあるところで行われたやりとりで、(↓)のようなことを書かれた人がいます。

ツール使えなくてもすごい翻訳者がたくさんいる。使ったらきっともっとすごいんだろう。

おもわず「それはない」と突っ込んでしまいました。

翻訳支援ツールは、翻訳の品質があがるってうたい文句に入っていたりしますけど、ツール使ったら翻訳の品質は上がるなんてこと、ありません。少なくとも、上手な人の場合、それはない。統一すべき用語や表記の統一さえもおぼつかないとか最低限のこともできていないレベルなら、ツールに助けてもらって質が高まるということもありますが。でも、上手な人は、ツールを使っても使わなくても上手。なにをしなければならないのかわかっていて、どういう環境でもなにがしかの方法でやるべきことをきちんとやるからです。というか、上手な人の場合、そういう基本はできていて当然の話にすぎません。

質は人間が作り込むものです。ツールは、作り込む手間を省けるなら使えばいいし、そうでなければ使う必要がないという程度のものにすぎません。だから、ツールを使ったら質が上がるなんてことはありません。

逆に、ツールの特質に足を引っぱられて質が下がることなら、場合によってありえますが。

| | コメント (3) | トラックバック (0)

2014年6月19日 (木)

機械翻訳の懐疑論者は大きな見落としをしているのか~見落としの見落とし~

1年ほども前のことですが、知り合いのブログに「機械翻訳の懐疑論者は大きな見落としをしていないだろうか」という記事が投稿されました。この記事に対する反論を書いてみたいと思います。

半年ほども前に書いたのにアップロードを忘れていました。

この話、特に後半は、機械翻訳を使う人たちに共通する論理で、いろいろなところで陰に陽によく言われます(前半は後述するように、このページを書かれた人のうっかりまちがいです)。このようにはっきりとウェブ上に書かれているのをほかに見た記憶がないので、ここへの反論という形で書きますが、一般論として理解すべき内容だと思います。

取りあげるポイントは2点。「スピード」と「質」です。

続きを読む "機械翻訳の懐疑論者は大きな見落としをしているのか~見落としの見落とし~"

| | コメント (3) | トラックバック (0)

2012年5月 8日 (火)

Googleが訳語・表現のコーパスとして使えなくなる?

翻訳者にとってGoogleは訳語を探すほか、どういう表現がよく使われているのか、AとBのどちらが広く使われているのかなどを探す、いわばコーパスとして広く利用されています。でも、もうしばらくすると、そういう使い方ができなくなるのかもしれません。

少し前、(↓)のような記事が出ました。

これの日本語版(↓)もしばらくは公開されていましたが、いまは有料会員にならないと読めない状態になっています。この記事、もっと早くに書けばよかったんですが……
グーグル、検索システムを改良へ 市場シェアの維持目指し過去最大の変更か

続きを読む "Googleが訳語・表現のコーパスとして使えなくなる?"

| | コメント (7) | トラックバック (0)

2011年8月22日 (月)

『アインシュタイン その生涯と宇宙』と機械翻訳とモラルハザード

『アインシュタイン その生涯と宇宙』下巻が機械翻訳ですごいことになっている件、翻訳者仲間でもあちこちで話題になっています。その議論で気になったことを少し書いてみたいと思います。

ちなみに、出版関係者の意見については(↓)の一読をお勧めします。私程度の関わりでも知っているような話が大半ですが(知らなかったのは武田ランダムハウス・ジャパン固有の事情くらい)、おそらく、一般的にはあまり知られていない話であり、読んでおいて損はないと思います。

機械翻訳をそのまま出版?トンデモ本の裏にあるもの

意見は大別すると(↓)のように3種類でしょうか。

  1. ほらみろ、機械翻訳ソフトなんて使い物にならない
  2. 機械翻訳ソフトの問題点が浮き彫りになった事件で、機械翻訳ソフトを使うべきでないことが改めて示された。
  3. 機械翻訳ソフトのようなツールは使い方次第。今回の事件はモラルハザードが起こしたものであり、得失を理解してうまく使えばいいだけの話。今回の件で機械翻訳はダメとなってほしくない。

ちなみに私は2番の立場です。なので、その他の立場についてコメントしたいと思います。また、1番は横に置いておきましょう。そう思う人は機械翻訳ソフトに手を出さないでしょうし、3番の人が「機械翻訳ソフトなんて使い物にならない」と言われて考えを変えることもないと思いますから。

続きを読む "『アインシュタイン その生涯と宇宙』と機械翻訳とモラルハザード"

| | コメント (0) | トラックバック (0)

2011年7月 1日 (金)

カタカナ正規化ツールのデモ

JTF標準スタイルガイド検討委員会が開催したカタカナ正規化ツールのデモを見てきました。カタカナ正規化というのは、複数の異表記をひとつに変換することを言います。たとえば、インターフェイスを正規形とした場合、異表記となるインタフェースやインターフェースなどをすべてインターフェイスに置換してくれるわけです。

標準スタイルガイド検討委員会の委員長をしている田中さんがこの春、言語処理学会の年次大会で講演を行い、その際、「こんなものがあったらいい」と希望をいくつか並べていたら、東芝の方がおひとり、おもしろそうなので簡単なものを作ってしまったのだそうです。

正直、特に期待もせずに聞きに行ったのですが……これがなかなか。できていたのは基本的な部分だけですが、考えるべきところはきちんと考えて作られており、機能的にはかなりの実用性が期待できます。カタカナ表記のゆらぎに困っているところ(主に翻訳会社でしょうか)にとっては有用でしょう。

続きを読む "カタカナ正規化ツールのデモ"

| | コメント (0) | トラックバック (0)

2010年12月15日 (水)

「機械翻訳時代に翻訳者の生きる道」@20周年記念JTF翻訳祭

20周年記念JTF翻訳祭で話した自分のセッションについて、補足その他、まとめておこうと思います。

翻訳祭全体というか、他のセッションについてのレポートは、「20周年記念JTF翻訳祭」のほうをご覧ください。

■「機械翻訳時代に翻訳者の生きる道」(井口耕二、技術・実務翻訳者、JTF常務理事)

懇親会準備でメイン会場が閉鎖される最終セッションだったこともあり、かなりの人数、入場をお断りしたとあとで聞きました。会場内は後ろの空いている部分に20~30人くらい立ち見の人がいる満杯状態でした。

内容は、一言にまとめれば、「一人ひとりがよく考え、自分にとって幸せな道を選びましょう」ということです。それが機械翻訳を使うという道ならそれもアリだし、翻訳メモリーにゆくもよし。もちろん、機械翻訳も翻訳メモリーも使わない道もあります(←冒頭、話したように私はこの道)。どの道を選んでも楽ではないし、先行き、必ず安泰ということもありません。どの道を選んでもリスクがあるし、かといって選ばずに流されても結果的に選ぶことになってリスクがあります。だったら、ツールの特性などのいい面・悪い面、両方を勘案し、よく考えて選んだほうがいいはずだと思うのです。自分が考えて選んだ道なら、失敗しても納得はできるでしょう。でも、流されて進んだ道だったら? 悔やんでも悔やみきれない思いをするのではないでしょうか。

というわけで、「こうすべき」という話をするのではなく、「一人ひとりが自分にとってはどうなのか」を考える時間にしたいと思いました。そのために配布資料はなし。話の先が読めてしまうと、ポイントごとに揺れ動く自分を感じてもらえなくなると思ったので。

話が終わってしまえばかまわないので、セッションで使ったスライドは公開しておきます。スライドだけを見ても何がなにやらわからないかもしれないとは思うのですが、欲しい方はどうぞ。

続きを読む "「機械翻訳時代に翻訳者の生きる道」@20周年記念JTF翻訳祭"

| | コメント (7) | トラックバック (1)

2010年8月27日 (金)

統計ベースの機械翻訳

テクニカルコミュニケーションシンポジウム2010」でも書いたように、パネルで統計ベースの機械翻訳が紹介されました。

河野さんが使われたスライドは公開されています。

統計ベースの機械翻訳とは、ごくごく乱暴にまとめると、言葉のつながりを解析し、「Aという単語が出てくると、その後ろ(あるいは前)にはBという単語が出てくることが多い」といった統計情報として活用する、ということのようです。

これをさらに乱暴にまとめると、ターゲット原語側のコロケーション情報を用意して活用すると言えるのかもしれません。

今回の話を聞いた印象では、語順が比較的かっちりしている英語などとの相性がよさそうに思いました。これに対して相性が悪そうなのは、語順が融通無碍の日本語。語順は融通無碍でも、ある言葉が前か後ろに「出てくる」というレベルでは同じなので、あまり違いはないのかもしれませんが。

なお、統計ベースだけだと、それなりにターゲット言語らしい文章にはなるけど、極端なことを言えば語順だけそれらしくしてあるものなので、意味のある文章になるとはかぎりません。それでも構造が似ている言語同士ならそれなりになるようですけど。ともかく、そのあたりを補うため、文法的な解析などを行うルールベースを組み合わせるといった工夫も始まっています。

さて、統計ベースの機械翻訳、質はどんな感じでしょうか。

続きを読む "統計ベースの機械翻訳"

| | コメント (5) | トラックバック (1)

より以前の記事一覧