2011/3/7 月曜日

ネット翻訳の盲点(7)

Filed under: WEB翻訳 — mizusawa @ 18:50:09

日英翻訳をするとき、マニュアルは単純で分かりやすい文章を羅列するので、機械翻訳が比較的容易と考えられる。
今回の例文:「最初にVBソフトを起動します。システムタブを選択します。そのタブから、環境変数をクリックします。Pathリストを選択します。そこで変数値”***”を入力してください。プログラムを終了するために、OKボタンを押してください。」
本格結果
Google:日英翻訳
First start the VB software. Select the System tab. From that tab, click Environment Variables. Choose the Path list. Please enter the “***” Then the variable. To end the program, OK please press the button.
Excite:日英翻訳
The VB software is started first. The system tab is selecetd. The environment variable is clicked from the tab. The Path list is selected. Then, please input the value of a variable “***”. Please push the OK button to end the program.
Systran:日英翻訳
First the VB software is started. The system tub is selected. From that tub, environment variable is clicked. The Path list is selected. Strange numerical value “***” please input then. In order to end the program, please push the OK button.
考察:Googleは命令形、ExciteとSystranは受動形で訳している。日本語例文は「説明者」がYou「読者」に操作を説明しているが、「説明者」も「読者」も略されている。機械翻訳ではアルゴリズムが主語を探し、人が主語ではないことからExciteとSystranは操作の対象物を主語とする受動形の文型を採用したのだろう。個人的にはマニュアルを前提にテキパキとした命令口調が好きだ。ExciteとSystranに「命令形で訳せ」と指示できると使い勝手が良くなろう。
最後の2文はGoogleもSystranも混乱した翻訳結果を出している。Exciteは理解できる英文だ。
今回の判定:Exciteの勝ち!

2011/2/21 月曜日

ネット翻訳の盲点(6)

Filed under: WEB翻訳 — mizusawa @ 20:41:16

GoogleのWeb翻訳でコンマ「、」の役割りを見てみよう。
例題:
彼が食事をしていた時に(、)彼の父親が帰宅したが、彼の父親はまだ夕食を済ませていなかった。
例題のカッコの位置にコンマを入れるか入れないかでGoogleは和文英訳が異なる。
・コンマの有る場合:
When he was eating, but his father came home, his father still not finished the dinner.
・コンマの無い場合:
His father was home when he was eating, his father still had not finished the dinner.
以下の比較サイトの翻訳はコンマの有無にかかわらず同一の和文英訳であった。
Excite:
His father had not finished supper yet though his father came when he was eating.
Systran:
When he has done the meal, that father returned home, but that father still did not complete dinner.
今回の判定:Googleの勝ち。

2011/1/23 日曜日

ネット翻訳の盲点(5)

Filed under: WEB翻訳 — mizusawa @ 12:44:32

WEB翻訳の実力を比較するため、前回に引き続いて少し難解と思われる例文で調べてみる。
例文2(難解な文章)
形態素解析は日本語解析の重要な基本技術の一つとして認識されており、近年、様々な解析手法が開発されている。本稿では新技術に基づいた新しい形態素解析の手法を提案する。

Google
日英翻訳:Morphological analysis has been recognized as one of the fundamental techniques of Japanese analysis, have recently been developed a variety of analysis techniques. This paper proposes a new approach based on morphological analysis of new technology.
翻訳結果を英日翻訳:形態素解析は、最近の分析の様々な技術を開発されている、日本語解析の基本的な手法の一つとして認識されている。本稿では、新技術の形態素解析に基づいた新しいアプローチを提案する。
寸評:日英・英日とも意味が十分通じる翻訳となっている。この翻訳結果を導き出した技術を推測すると、Googleが得意とする検索を適用している可能性が高い。即ち逐次的に辞書を引いて翻訳するのでなく、類似の文章が使われている既存の論文を利用したのではないか。

Excite
日英翻訳:As for the morphological analysis, it is recognized as one of the important basic techniques of a Japanese analysis, and various method for analyzings are developed in recent years. It proposes the technique of the new morphological analysis based on a new technology in this text.
翻訳結果を英日翻訳:形態素解析に関して、それは日本の分析の重要な基本技術の一つとして認識されます、そしてanalyzingsに、様々な方法は近年開発されています。それは本稿の新技術に基づく新しい形態素解析のテクニックを提案します。
寸評:訳文は少々不自然だ。ライティングの得意でない日本人が書く英文にどことなく通じるものがある。意味は(ある程度)通じるのだが、英語としてはどうなの、というレベルの訳文だ。「本稿では・・」を「It…in this text.」と英語の構文に置き換える翻訳アルゴリズムを適用している。

Systran
日英翻訳:Morpheme analysis is recognized, as one of important basic technology of Japanese analysis recently, various analytical techniques are developed. Technique of the new morpheme analysis where with this manuscript it was based on new technology is proposed.
翻訳結果を英日翻訳:形態素の分析は日本の分析の重要な基礎技術の一つとして、様々な解析技法成長します最近確認されます。この原稿と新技術に基づいていた新しい形態素の分析の技術は提案されます。
寸評:第一文は比較的理解できるというレベルであるが、文の構造を正確に把握することができていない。「where with this manuscript it was…」という文章に翻訳の解析に苦労した様子がうかがえるが、「本稿では」を「本稿は」と主語であることを明示すればこのようなややこしい翻訳をしないかも知れない。
対応する英日翻訳はこの混乱の影響でおかしくなっている。

今回の判定:Googleの勝ち。ただし、他の文例でも同じようにGoogleが勝つかどうかは疑問が残る。

2011/1/22 土曜日

ネット翻訳の盲点(4)

Filed under: WEB翻訳 — mizusawa @ 20:48:06

WEB翻訳の能力を調べるため、二つの文章からなる構文を準備した。今回は比較的簡単なもの(機械翻訳させやすそうな文章)、次回はやや難解(論文のようなアカデミックなもの)なものと、二種類の例文を使用する。
使用する機械翻訳サイトはGoogleとExcite, 海外サイトとして今回はSystranで検証してみることにした。前回のFreelancetranslation.comの再翻訳結果が非常に厳しいものであったので、別のサイトに切り替えた。Systranは翻訳ソフトの開発会社であり、最近ではiPhoneやiPadといったモバイル端末にも翻訳系アプリを提供している。

 Google: http://translate.google.co.jp/#
 Excite: http://www.excite.co.jp/world/
 Systran: http://www.systransoft.com/

例文1(比較的簡単な文章)
私は学校に行くために毎朝電車に乗ります。最寄り駅から学校まではバスで行きますが、いつも道路が混んでいるので遅刻することもよくあります。

Google:
日英翻訳:I ride the train to go to school every morning. Nearest to school by bus is often late because you can always crowded roads.
翻訳結果を英日翻訳:私は電車が毎朝学校に行くに乗っている。バスで学校に近いがよく遅くまでですが、いつも混雑道路をできるからです。
寸評:第一文の翻訳は短文のため訳せている。第二文は「駅」を英文に置き換えることなく、日本語特有の主語を明示しない文章に翻訳ソフトが大混乱をきたしたようだ。翻訳した第一文の英語は我々日本人には理解できるが、それを元の英文に再翻訳した結果は、日本語の体をなしていないお粗末な結果だ。第二文は議論するに値しない日英翻訳となった。
Google翻訳の特徴として、各和文単語にマウスオーバーすると、対応する英単語がハイライトされる機能がある。逆の操作、つまり訳文の各英単語にマウスオーバーすると、対応する和文単語がハイライトされる。今回の例文ではGoogle翻訳は文章の翻訳に使えない。単語翻訳だけにした方が無難だ。

Excite:
英訳:I take a streetcar to go to school every morning. There is often late what though it buses from the closest station to the school because the road is always crowded, too.
翻訳結果を英日翻訳:私は、毎朝学校へいくために電車に乗ります。遅く、それがしばしばそれがどうしたあります。道路がいつもまた、混雑しているので、最寄りの駅から学校までバスで行きます。
寸評:電車がstreetcarと訳されているのが興味深い。streetcarは路面電車という意味だから、日本では鉄道網が発達していることを知らないプログラマが翻訳ソフトを作成したと推測できる。Exciteの第一文の翻訳はGoogleより優れていると思う。二番目の文章は長いので翻訳が難しが、これもGoogleより優れた翻訳結果となったと言ってもよいが、翻訳とは言えないレベルである。翻訳結果の英日翻訳は第一文はOKだが、第二文は評価に値しない。

Systran:
日英翻訳:I ride in every morning streetcar in order to go to the school. From the neighboring station it goes to the school by the bus, but because always the road has been packed, also it is good to be late.
翻訳結果を英日翻訳:私は毎朝の市街電車で学校に行くために乗ります。近隣の場所からそれはバスによって学校に行きますが、ずっと道は常に詰まっているのでまた遅いよいです。
寸評:第一文は翻訳したと言えよう。第二文もbecause文まではまあまあ理解できる。主語がitになっているが、これは原文の日本語に「私」を補えばより正確に訳す可能性がある。日本語の性質を理解している人が翻訳ソフトをプログラムしたと思われる。it is good to be lateという部分は誤訳である。

今回の判定:Systranの勝ち。

2011/1/19 水曜日

ネット翻訳の盲点(3)

Filed under: WEB翻訳 — mizusawa @ 14:31:23

ニュースをWEB翻訳するとどうなるか、前2回につづく検討事例を紹介します。

日英翻訳例文3(ニュース系):首相は12日、官房長官の辞任を発表した。

Google:12th Prime Minister, announced the resignation of Chief Cabinet Secretary.
翻訳結果を日英翻訳:12内閣総理大臣は、官房長官の辞任を発表した。
寸評:訳文では「12代総理大臣」となっている。日付が翻訳できないのはGoogleが利用する辞書が日付に対応していないためと思われる。また、不必要に思えるコンマも挿入。それ以外は自然な訳文。再翻訳も12以外は自然。

Excite:The Prime Minister announced the Chief Cabinet Secretary’s resignation on the 12th.
翻訳結果を日英翻訳:首相は、12日に内閣官房長官の辞職を発表しました。
寸評:普通に読める自然な訳文となっている。再翻訳の和文も自然。

Freetranslation:The Prime Minister announced the resignation of the Chief Secretary of the Cabinet on 12th.
翻訳結果を日英翻訳:首相が続けてキャビネットの最高位の長官の辞意を表明した 第12に。
寸評:Exciteに引き続き自然な訳文となっている(the resignation of the Chief Secretary of the Cabinetのあたりが少し冗長な気もするが)。しかし再翻訳では不自然な結果となった。

ネット翻訳(1)から(3)の全体的な感想
総じて、Google翻訳はかなり不自然な印象だが、翻訳スピードは断トツの一位。自然な訳文はExciteである。再翻訳に関しては、直訳調でもさっさと翻訳してスピードで稼ぐGoogle,自然な訳文を心がけるExcite,そして英和翻訳は苦手ですと言わんばかりのFreetranslation、という印象が残った。訳出にかかる時間としては、Googleが最速、その次がExcite、そしてFreetranslationという順だった。
今回の例文は、三つとも短い短文だったが、次回は複数の文章で試してみようと思う。

2011/1/17 月曜日

ネット翻訳の盲点(2)

Filed under: WEB翻訳 — mizusawa @ 20:59:19

ネット翻訳の盲点(1)では、翻訳サイトが参照している日本語辞書が貧弱なことが分かった。翻訳した日本語をGoogleに読ませてみると、日本語の単語を間違って読むことが分かった。今回は別の例文を試してみよう。

日英翻訳例文2(マニュアル系):このダイヤルを回して温度を調節してください。

Google:Please dial to adjust the temperature of this.
翻訳結果を英日翻訳:この温度を調整するためにダイヤルしてください。
寸評:不自然ではあるものの、例文1の結果と比べると良い結果が表示されたと思われる。マニュアル等の英文は基本的にPleaseなどを使用せず命令文になっている。訳文の英文への再翻訳では、例文から少々ずれた印象を受ける。「温度を調節する」が「ダイヤルする」というように置き換わった。

Excite:Please turn this dial and adjust the temperature.
翻訳結果を英日翻訳:この温度を調整するために、ダイヤルしてください。
寸評:訳文としては自然ではあるものの、この訳文だと「ダイヤルしつつ温度調整も行う」というふうにも読めてしまう。Andではなくtoであれば非常に自然な訳文となった。訳文の英文への再翻訳がGoogleのものと同じ結果というのが興味深い。

Freetranslation: < 主語なし> It turns this dial and please adjust temperature.
翻訳結果を英日翻訳:それがこのダイヤルを回すので温度を調整してください。
寸評:訳文は不自然だが、<主語なし>という断り書きが興味深い。英語と日本語の言語構造の違いをこの断り書きであらかじめユーザーに断る、という雰囲気がする。再翻訳は普通に直訳調。

今回のまとめ:Exiteの勝ち

ネット翻訳の盲点(1)

Filed under: WEB翻訳 — mizusawa @ 9:47:26

インターネットには便利に翻訳してくれるサイトがある。学生はしばしば翻訳サイトを利用しているようだ。英文を日本語に翻訳した時、学生は意味の通じない翻訳だと理解できるし、不完全な翻訳でも意味を推測することができる。学生が自分の論文に英語の抄訳を作ることが必要になると、日本語の抄訳をWEB翻訳し、そのまま英文として論文に挿入する。英文がおかしいかどうかを判断することができないので、ほとんどの場合WEB翻訳の結果そのままである。その英文をネーティブチェックにかけると、ネーティブが添削できない、つまり全く意味がつかめない場合がほとんどだ。その理由は多くの場合、原文の日本語が論理的に記述されていないことに原因があると思われる。日本語ではしばしば主語と述語の関係を明示しないまま文章が成り立ってしまうが、英文ではその関係を明確に記述しようとする。従ってWEB翻訳で日本語から英語を得る場合、日本語の文章を注意深くチェックする必要がある。試しに、WEB翻訳にどのような落とし穴があるかチェックしてみる。翻訳は人類のもっとも知能的な活動なので、できるだけ数多くの事例を試すつもりである。
今日の事例。

 使用する機械翻訳サイトはGoogle, Excite, Freetranslationである。三つの選出理由は、GoogleはWeb上で広く知られている、ExciteはExcite翻訳プロなどのサービスにより翻訳に力をいれているように思われる、Freetranslation.comは海外の多言語翻訳サイトでなかなか精度が高いとされている、という理由。
 Google: http://translate.google.co.jp/#
 Excite: http://www.excite.co.jp/world/
 Freetranslation: http://www.freetranslation.com/

日英翻訳例文1(ビジネス系):私は先輩の話を聞き、御社の仕事に興味をもちました。
以下に3サイトの翻訳を紹介する。
Google:I listen to seniors, lasted an interest in your work.
翻訳結果を英日翻訳:私は先輩に聞いて、あなたの仕事に興味が続いた。
寸評:訳文としては不完全に思える。最初の文章の時制は現在形、コンマ後の文章は過去形になっている。また、「続く」等の意味であるlastがなぜ訳文に使われているという点が興味深い。再翻訳は直訳調。ただし、原文を入力するそばから訳文を表示していくため、翻訳時間は非常に短い。
Excite:I heard senior’s story, and was interested in your work.
翻訳結果を英日翻訳:私は、シニアの話を聞いて、あなたの仕事に興味を持っていました。
寸評:機械翻訳にしてはそこそこ読める訳文になっている。逆再翻訳文も普通に読める文章。翻訳時間はGoogleに比べると若干長め。原文をコピーして翻訳ボタンを押せば訳文表示。
Freetranslation: I heard the conversation of a/the senior and had an/the interest in the job of your company.
翻訳結果を日英翻訳:私 会話を聞いた a/the 年長者 そして 持った an/the あなたの会社の仕事に対する興味。
寸評:訳文としては一番自然に読めるかもしれない。冠詞を両方提示しているところが興味深い。利用者の判断にゆだねる、というところか。また、「御社の仕事」をきちんと訳しているのも興味深い。反面、再翻訳では非常に対照的な結果となっている。翻訳時間は一番長め。原文をコピーして翻訳ボタンを押せば訳文表示。比較のためか、Google翻訳の結果も表示できるようになっている。
今回のまとめ:ネット翻訳の翻訳結果はバラエティに富んでいる。

HTML convert time: 1.933 sec. Powered by WordPress ME