デプロのMachine Translation(機械翻訳)への取り組み

デプロではお客様のニーズに沿った機械翻訳(以下MT)への取り組みを行っております。
その取り組みの歴史は長く、2011年に弊社のクライアントの1つであるマルチリンガル・サービス・プロバイダー様からMTについてのトレーニングを受けたのが最初です。その時はまだ日本語に適用できるレベルではなかったのですが、Distanceという概念を教えていただきました。つまりMTでサジェストされた結果と最終のエディットの結果を比較し、そのDistanceを独自のアルゴリズムで計算して、あるしきい値以上であればそのプロジェクトはMTには向かない、という判定を行うということでした。同じアルゴリズムは使用できませんが、デプロでもクライアント様のほうで機械翻訳エンジンの適用を行った場合、差分を取って、どの程度の変更があったのかを確認し、あまりにもひどい場合は翻訳者にCompensationを行い、クライアント様へもクレームを出しています。

もう一つ、MTを使ったPremium(高)品質の翻訳案件とMTを使って早く、安く翻訳を行う案件では、初期工程は同じでもプロジェクトとしての質が全く異なるということです。この点をお客様ときちんと交渉することが大切ということでした。

2015年には、当時SDLで提供していたBeGlobalのサブスクリプションを開始しました。長年の友人であり、協力会社であるドイツのTranscript社からエンジニアを招き、実際のワークフローを確立するためのアドバイスをもらいました。
2016年、GoogleがNMTサービスを開始。機械翻訳の品質が一気に上がり、通常使用する分には、遜色のないくらいの品質が提供されるようになりました。

これを踏まえて2017年、実際にお客様に機械翻訳のサービスを提供し始めました。

2018年、プロの翻訳者を介さない「MT Adjusted」というサービスの提供を開始しました。
MT Adjustedサービスは通常のMT案件とは異なる考え方からはじまっています。多くの方はどのエンジンを使えば品質の良いサジェッションが出るのだろう、ということを気にされると思いますが、弊社では、サジェストされた翻訳そのものを評価するのではなく、サジェストされた翻訳をいかに各プロジェクトに合わせて置き換えることができるか、というところに重きを置きました。つまり出力品質自体は徐々に良くなっていくだろうから、出力されたものを加工する方に注力しよう、ということです。

翻訳をするときにスタイルや用語集を確認することが大変です。この部分を先にMTの出力に対し、処理してしまうんです。また、日本語の場合、タグによる分断のために訳語がおかしくなってしまいます。
以下の例をご覧ください。
Raw Output (MTエンジンから吐き出されたそのままの翻訳)

この1文が左のように2文に分かれてしまっています。

 

 

これをMT Adjustedで処理すると

 

ちゃんと1文で処理されます。この場合は”check”が「確認」でいいかどうか判断するだけです。OKな場合、Distanceはゼロです。

すべてを後処理で行うというわけではなく、先に用語集がある場合は、MTエンジンに登録してしまいます。たとえば、日本語の場合、User interfaceという言葉だけでもいく通りものいい方があります。ユーザ・インタフェース、ユーザ・インターフェイス、ユーザーインターフェイス、ユーザー インターフェイスなど。
MT処理のみでは、これらの用語は適当に出てきますが、スタイルはクライアント別に決まっているはずなので、MT Adjustedではこれを事前に入れ込んでしまうか、MTの出力後、パターン別に一気に置き換えます。
翻訳済みのUser Interfaceについては、UIのファイルとCATツールのタグ番号を照合して正しいUIに置き換えます。UIにすでに複数訳がある場合やタグでマーキングされていない場合などは、完璧に置き換え可能というわけにはいきませんが、上手くいかないところはその後のファイル処理担当者(翻訳者、またはMT処理担当者)が修正を行います。

同じエラーが頻出している場合は、そのエラーをエンジニアに報告し、次回の処理までに提案できる解決策がある場合は、その解決策をインプリします。以下のようなイメージです。

 

 

 

 

 

 

MT Adjusted処理した後は、クライアント様との事前交渉に沿って、最終品質を決めていきます。
たとえば、MT Adjusted処理後、
1) 翻訳者にFull Post Editを依頼し、最終品質はHuman Translationと同じPremium品質の翻訳をご提供する。
2) 「翻訳者ではない」担当者が確認を行い、最終納品まで持ってもっていく。

上記2)の処理の弱点は、翻訳者を介していないため、「正確」ではありません。本来翻訳者がPost Editして間違ったMTのサジェッションを修正するステップをスキップしていますので、最終のアウトプットは「正確ではない」翻訳である可能性があります。

そのため、MT Adjustedのみの処理は以下の様な条件があてはまるお客様にお勧めしたいサービスです。
1. 大量のコンテンツをMT処理したいが、Raw MT(後処理を全くしないMT出力)よりもう少しいい品質が欲しい。
2. 日本語を読んで、おかしいと思ったときに読者は対応する英語のコンテンツを参照できる。
3. 品質よりもコストとスピードを重視する。
4. 一度MT Adjustedのみで処理を行ったプロジェクトを、Premium品質に戻すことは容易ではない。最初からHuman Translationで処理した場合よりもコストがかかる場合がある(実際にそうなったプロジェクトがありました)。

実際にMT Adjustedのみを採用されたクライアント様からは「非常に満足している」というコメントを頂いており、更新についても対応させていただいております。
またMT Adjusted処理後にPost Editに対応いただいた翻訳者様からは、「今まで処理した中で一番の品質」「生産性は確実に上がっており、処理単価に見合っている」「通常はMT案件は断っているが、このMTであれば、今後も受注したい」という声を頂いております。

ドキュメントがバージョンアップされたときはどうするのか、というご質問については、以下の図をご参照ください。

 

 

 

1度目にMT Adjusted処理したコンテンツは次回アップデートで英語が変わらない場合、そのまま前回の訳が適用されます。追加/変更があったコンテンツについてのみ、最初からMT Adjusted処理を行います。さらに、前回からMT Adjustedのシステムに追加されたエラーのFixは前回のコンテンツにも適用されます。そのため、バージョンアップを重ねるたびに品質が良くなっていきます。

機械翻訳については、色々な考え方があると思いますが、「機械翻訳後の出力をできるだけ良くする」ということよりも、むしろ「Post Editしやすいような機械翻訳の出力」を目指し、「後の出力を先にプログラムでEditしてしまおう」という考え方に基づくものです。ご興味がある方は是非一度ご相談ください。

スポーツ通訳者さんたちの情熱

この3年間で、オンラインによる講座やセミナーの開催数が急増し、学習の機会が大きく広がりました。私の場合はCourseraやFutureLearn、Peatixなどを利用して、業務に直結するセミナーから、趣味に関する講座までいろいろと受講してきました。
そんな中、昨年末には「【第5回つーほんウェビナー】スポーツ通訳者大集合! ~人気競技の言語サポート事情とは~」を受講しました。しかし受講の動機は、英語のプロ中のプロのお話を通じて、英語についての視野を広げ、業務にも生かしたい…などという高尚なものではありませんでした。単純に、登壇する通訳者さんのお1人のファンなので、英語や日々のお仕事に関するお考えをじっくり伺える貴重な機会!という程度のものだったのです。
当日は3人の通訳者さんそれぞれから、通訳者になる以前の英語との関わり、スポーツ通訳者になる経緯、そして現在のお仕事の内容、現場でどのようにチームや選手を支えているのか、さまざまなエピソードを交えて聞かせていただきました。
約2時間のお話の中で、特に印象に残ったことが2つあります。

1つ目は、「英語が好き」「だからもっと上達したい」という強い気持ちを、皆さんが持ち続けていらっしゃること。
日ごろテレビ中継やスタジアムで拝見している神業のような(時に過酷に思える)お仕事を支えているものの1つが、このシンプルなモチベーションだとは想像していませんでした。私自身が英語を勉強してきた理由が「好きだから」ではないためかもしれません。プロとしてひたすら準備をし、技術を磨き、さまざまな課題に取り組み続けている方々が、明るく「英語が好きだから」とおっしゃる様子が胸に響きました。
もう1つは、皆さん通訳者としてだけでも非常にご多忙なはずなのに、携わっているスポーツや選手たちの将来、さらにはスポーツビジネス全体の発展につながるアクションも起こしていらっしゃること。
ご自分のことのみならず、周囲の人々や環境をも「もっと良くしよう」「価値を高めていこう」と真摯に考えて、スポーツ界に広範に貢献されていることに改めて感銘を受けました。

上述のように軽い気持ちで聴講を申し込んだウェビナーでしたが、通訳者としてだけでなく人間としても超一流の方々の熱い思いやアクティブな姿勢に心打たれました。
目の前のことで精一杯なときも多いけれど、自分にできることを少しずつでも積み重ねていかなくては、と深く自省しております。

なお、10月末までの期間限定で、本ウェビナーを含む一部つーほんウェビナーのアーカイブ動画のレンタル販売を実施中とのことです。
スポーツ通訳者を目指す方はもちろん、私のようにスポーツ観戦を趣味としている方にも、ぜひお勧めしたいウェビナーです。

美味しい紅茶のおはなし

紅茶よりコーヒーの方が好きなのだが、それでも美味しく淹れた紅茶を飲むとそれはそれでいいなあと思う。

最近、イギリス人の紅茶離れが進んでいるという記事を読んだ。若者にはコーヒーの方が人気があるらしい。残念だ。

イギリス小説には紅茶に関する記述がよく出てくる。

アーサー・ヘイリー(これはアメリカ小説だけど)の「Airport」(邦題:大空港)では、イギリス人のキャビンアテンダントに正しい紅茶の淹れ方を習ったパイロットが彼女にお茶を用意するシーンがある。「紅茶の葉がお湯に触れるその瞬間までお湯は沸騰していなければいけない」のだそうだ。この言葉はいつも紅茶を入れるたび、私に響く。

アガサ・クリスティ作品にも紅茶に関する記述がよく出てくる。

「Pocket full of Ryes 」(邦題:ポケットにライ麦を)ではタイピストたちが順番に皆に紅茶を淹れるのだが、新人のタイピストが淹れた紅茶を飲んだ古参のタイピストが叱責する。
「またお湯がちゃんと湧いていませんよ!」
「すみません!今度は大丈夫と思ったのですが….」
沸騰していないお湯で入れた紅茶は飲むに堪えないのだ。解雇に値するほど。

「The Hollow」(邦題:ホロー荘の殺人)ではエルキュール・ポワロがジャップ警視に紅茶をふるまうシーンがある。生粋のイギリス人のジャップ警視は憂鬱である。ポワロの淹れた紅茶は薄くてまずいのだ。
「まったく外国人はお茶の入れ方が分かっていない。薄い。おまけにこれは中国の紅茶だ。」(インドのセイロンあたりがいいのかな)
それなのにポワロは「濃すぎませんか?お湯がありますよ」と聞く。

「マリーゴールドホテル 2」ではイギリスの名女優マギー・スミス演じるホテルの経営者がアメリカ人の不動産業者とやり合うシーンがある。ティーバックで入れた紅茶を出されたマギー・スミスは「こんなxxxのような紅茶は飲めない。熱いお湯で紅茶の茶葉をポットの中で躍らせなくてはいけないのよ!熱々のお湯もってこい!」とたんかをきる。(お湯が運ばれる)

最近、読んだアンソニーホロビッツの「Moonflower Murder」(邦題:ヨルガオ殺人事件)では、殺人の被害者の親戚を訪れたスーザンが、その家のホストに「Builer’s or Peppermint?」と聞かれる。Builder’s(ビルダーズティー)とは、建設現場で働く労働者(Builders)が休憩時間に好んで飲んだミルクと砂糖が入った濃い紅茶である(ちなみにスーザンはBuilder’sを選んでいた)。これには懐かしい想い出がある。

イギリスのバースに留学していた時、毎日11時にイレブンス(11時に紅茶を飲む休憩)があり、アツアツのミルクティー(Builder’sだった)とビスケットが生徒と教師に提供された。毎日1時間目の授業が終わって廊下に出るとマグカップがずらーっと並べられていた。カップも中に入った紅茶も熱々ですぐには飲めないほどだった。どうやってこのタイミングを狙ってこれだけの量のミルクティーが用意できるのだろうといつも感心していた。多分大量の沸騰したお湯を用意し、ポットとカップを熱々に温め、ミルクもしっかり温め、ギリギリのタイミングで入れるのだろう。お砂糖がたっぷり入っていて、疲れた頭によく染みた。確かにこの頃は街にコーヒーを出す店があまりなくて、コーヒーを飲まないと頭が痛くなる私はわざわざ駅まで行って学校帰りに濃いコーヒーを飲んでいた。その代わり紅茶はどこで飲んでも確実に美味しかった。

こういう伝統が少しずつ薄れていくのは寂しい。

日本も昔はティードリンカーだったが、今はご飯の後に熱いお番茶を飲む家庭は少なくなったのではないだろうか。
うちは父がどんなに暑い日でもご飯の後に熱いほうじ茶を欲しがるので、それが習慣になっている。熱いお茶は食事のときに摂った塩分や油分を流して口の中をさっぱりさせてくれる。
大学時代にバイト先の店長がバイトを全員呼んでお鍋をふるまってくれたことがある。その時にいた男子が「ぼく、田舎者だから食事の最後に熱い番茶がないと終わった気がしないんですよ」と言っていた。そっか、田舎がそうなのか、と「あーうちもそう」と共感したことを覚えている。確かに京都では熱々の番茶よりも、熱冷ましをしたお湯で入れた甘ーく感じる緑茶がよく出たように思う。田舎者でもいい。あつーい番茶を食事の後にじっくり飲みたい。