Trados Studio: タグIDの不一致が翻訳メモリの正確性に及ぼす影響

皆さんはTradosのエディターで翻訳する際、書式タグの表示はどのように設定していますか?
「表示」タブの「オプション」セクションにある以下の部分で設定でき、「タグ テキストなし」、「部分的なタグのテキスト」、「完全なタグのテキスト」、「タグID」があります。

翻訳時には、「部分的なタグのテキスト」または「完全なタグのテキスト」に設定し、書式タグがboldなのか、italicなのか、または参照タグなのかを確認しながら翻訳すると便利です。

ただし、見直し段階では、「タグID」表示を使用し、原文とタグのID番号を一致させることを推奨します。
このタグID番号は、文書内の各タグのペアとプレースホルダタグに自動的に割り当てられる一意の識別子です。この表示方法では、一見書式タグの種類は把握できませんが、タグの上にカーソルを合わせると、以下のようにタグの内容がツールチップに表示されます。

なぜ「タグID」の表示を推奨するかというと、タグIDが原文と一致しない状態で訳文を翻訳メモリ(TM)に登録すると、次回のTM更新のタイミングでタグそのものの情報がTMから抜け落ちてしまうからです。

実験してみましょう。

サンプルテキスト
Double-click the Search icon to open the Search Files dialog box. Then, enter “AAA” in the Search Files dialog box.

をTradosで翻訳してみましょう。
「完全なタグのテキスト」を選択すると、boldタグはすべて<cf bold=True>と表示されます。

これを「タグID」の表示にすると、それぞれ5や11、29のようなID番号で表示されます。

空のTMを作成し、太字の箇所はすべて同じboldタグなので、ID番号5のタグをコピーして翻訳してみます。

5のタグにカーソルを合わせると、ツールチップに<cf bold=True>と表示され、タグの内容を把握できます。

では、同じTMで少し異なるサンプルテキストを翻訳してみます。

Double-click the Search icon to open the Advanced Search dialog box. Then, enter “AAA” in the Advanced Search dialog box.

この段階では、2文目のSearch FilesからAdvanced Searchに原文が変わった箇所のboldタグは、タグID番号が異なっていても同じboldタグと判断され、TMからタグのついた訳文を取得できます。「Advanced Search」に合わせて翻訳を変更し、タグID番号はズレたままで確定します。

訳を追加したTMを使用し、新しいプロジェクトで下記のサンプルテキストを翻訳してみましょう。
Click the Search icon to open the Global Search dialog box. Then, enter “BBB” in the Global Search dialog box.

すると、1文目はタグのついたあいまい一致の訳文を取得できましたが、2文目のエントリでは、TM内の訳文からboldタグの情報が消えてしまいました

このようなエントリが頻出すると、改めてタグを付ける作業が増え、作業効率が悪くなるほか、原文側ではタグの変化がないように見えるため、訳文にタグを付け忘れるミスにもつながります。
タグID番号が一致していなくても、Trados上の通常の検証機能ではエラーにはなりません。もちろん、タグの削除はエラーになるのでそこで気付くこともできますが、やはり余分な修正作業が増えてしまいます。デプロでは、納品時のTMの品質を維持するためにも、翻訳時には原文と訳文のタグIDを一致させることをお願いしております。

Repetition(繰り返し)の処理について

「繰り返し」とは、CATツールで最初に出てきたときは「新規」とカウントされるが、それ以降、反復して出現する場合に「繰り返し」という分類になるカテゴリのことを指します。この「繰り返し」の文の処理は厄介です。なぜかというと、ファイルが複数あり、複数の翻訳者が同時に作業する場合、別々に訳してしまうと同じ意味の違う訳が返ってきてしまう。さらに、お客様への見積もりで、複数ファイルすべてで一度に解析を行った場合、受注上は「繰り返し」は新規単価の約10~25%の単価(案件により異なります)であるにもかかわらず、翻訳者には「新規」としてカウントすることになってしまうからです。このような状況が起きないようにシングルソースで翻訳する(1つのファイルのみを翻訳して、複数の出力形態に展開する)というのが主流ですが、諸々の理由でソースがそろっていないケースも多々あるようです。

これを解決するために、TMをサーバー上に置いて作業者がシェアすればいいという考え方があります。でもその場合、最初に翻訳した人の訳を別の人が取得してしまうことになります。その訳がよくなかったら、どうでしょう。そこに引っ張られた全体の品質は下がり、誰かが気づいて直したとしても、またそこに不統一が発生します。できるだけ、翻訳単位の品質はひとつひとつしっかりと管理していきたい。

こういう場合、弊社では全ファイルに対し、この繰り返しの2回目以降に出現するところをCATツールのエディター上でロックします。ただし、CATツール上でそのツールの機能を使ってロックすることが出来ない場合もあります。ファイルのサイズが大きすぎる場合です。たとえば、最近弊社で扱った案件では、Trados上ですべてのファイルを一度に開き、Tradosの機能を使って2回目以降に出現するところにロックをかけるのは不可能でした。そのため、弊社のエンジニアが最初の1度だけを翻訳対象とし、2度目以降はTradosでLockをかけたように処理をしました。
ちなみにCATツール上でこの処理をする場合は、どのファイルにある1度目を翻訳対象とするか、という指定はできません。
でも弊社のやり方ではこのファイルを優先的に1度目としてほしい、という指定が可能です。結果、先にそのファイルだけを翻訳し、校正してしまえば、他のファイルにどんどん展開ができるのです。この処理により、不要な複数訳文の統一作業を避け、複数の翻訳者への新規での支払いも避けることができます。一貫性も保てます。

このスキルは弊社ではよく使用しています。
似たようなマニュアルを効率的に翻訳したい、コストも削減したい、品質も落としたくない、そのようにお考えの方は是非デプロにご相談ください。

Trados 2024を使ってみた

毎年アップグレードされる非常に高価なCATツールTrados。その最新版2024を使ってみました。

https://www.trados.com/jp/resources/whats-new-in-trados-studio-2024-webinar-recording/

のセミナーでTradosの新機能が紹介されていますが、何と言っても目玉は生成AIの実装でしょう。ChatGPTとMSAsure Open AIのオプションがあり、APIキーをいれると生成AIの翻訳がサジェストされ、なおかつ、提示された訳に対して以下のようなOut of boxのプロンプトが用意されています。

プロンプトは追加可能。セミナーでは「体言止めにする」などプロンプトが紹介されていました。またここで注目すべきは用語集を前もって入れておけば、用語集の用語を使ってくれる。ただしこれは、生成AIをTrainするということではなく、返ってきた訳に対して、用語集と比較して、違うものは訂正されるといったもの。確かに便利ですが、生成AIが乱立する中、2つのAIしか使えないというのは、ちょっと幅がないかもしれない。

(実はこの考え方、実はデプロで4年前からご提供しているMT Adjustedと同じ考え方なんです。MTAdjustedでは、返ってきた訳に対して、用語集の適用、スタイルの修正などを行います。)

ちなみにTradosでは、バージョン2019まではGoogle TransをAPI経由でエディターから直接使用できたのですが、2021、2022ではLanguage Weaverのみに使用可能に変わっているようです。そのため、別のAppsからMT用のアドインをいれて、2021、2022で使用しています。2024では特に特別な知識は無くても、生成AIを個人ベースで翻訳フローに導入できるようになったというわけです。ただ翻訳チェックで提案される訳は???。ChatGPTだけではなくほかのAIも使用できればいいのかも。

ただ、それにしてもライセンスが高い!毎年新しいバージョンが出て、毎年ツールの維持だけで、こんなに高い費用が掛かるのは残念です。今回40周年記念ということで、40%オフのキャンペーンを利用してフリーランス版をまず購入してみたのですが、Pro版は本当に本当に高価で、費用対効果をじっくり考えて購入する必要あり、という結論に至りました。

次回はデプロでの生成AIを使用した取り組みについてご紹介します。