Trados Studio: タグIDの不一致が翻訳メモリの正確性に及ぼす影響

皆さんはTradosのエディターで翻訳する際、書式タグの表示はどのように設定していますか?
「表示」タブの「オプション」セクションにある以下の部分で設定でき、「タグ テキストなし」、「部分的なタグのテキスト」、「完全なタグのテキスト」、「タグID」があります。

翻訳時には、「部分的なタグのテキスト」または「完全なタグのテキスト」に設定し、書式タグがboldなのか、italicなのか、または参照タグなのかを確認しながら翻訳すると便利です。

ただし、見直し段階では、「タグID」表示を使用し、原文とタグのID番号を一致させることを推奨します。
このタグID番号は、文書内の各タグのペアとプレースホルダタグに自動的に割り当てられる一意の識別子です。この表示方法では、一見書式タグの種類は把握できませんが、タグの上にカーソルを合わせると、以下のようにタグの内容がツールチップに表示されます。

なぜ「タグID」の表示を推奨するかというと、タグIDが原文と一致しない状態で訳文を翻訳メモリ(TM)に登録すると、次回のTM更新のタイミングでタグそのものの情報がTMから抜け落ちてしまうからです。

実験してみましょう。

サンプルテキスト
Double-click the Search icon to open the Search Files dialog box. Then, enter “AAA” in the Search Files dialog box.

をTradosで翻訳してみましょう。
「完全なタグのテキスト」を選択すると、boldタグはすべて<cf bold=True>と表示されます。

これを「タグID」の表示にすると、それぞれ5や11、29のようなID番号で表示されます。

空のTMを作成し、太字の箇所はすべて同じboldタグなので、ID番号5のタグをコピーして翻訳してみます。

5のタグにカーソルを合わせると、ツールチップに<cf bold=True>と表示され、タグの内容を把握できます。

では、同じTMで少し異なるサンプルテキストを翻訳してみます。

Double-click the Search icon to open the Advanced Search dialog box. Then, enter “AAA” in the Advanced Search dialog box.

この段階では、2文目のSearch FilesからAdvanced Searchに原文が変わった箇所のboldタグは、タグID番号が異なっていても同じboldタグと判断され、TMからタグのついた訳文を取得できます。「Advanced Search」に合わせて翻訳を変更し、タグID番号はズレたままで確定します。

訳を追加したTMを使用し、新しいプロジェクトで下記のサンプルテキストを翻訳してみましょう。
Click the Search icon to open the Global Search dialog box. Then, enter “BBB” in the Global Search dialog box.

すると、1文目はタグのついたあいまい一致の訳文を取得できましたが、2文目のエントリでは、TM内の訳文からboldタグの情報が消えてしまいました

このようなエントリが頻出すると、改めてタグを付ける作業が増え、作業効率が悪くなるほか、原文側ではタグの変化がないように見えるため、訳文にタグを付け忘れるミスにもつながります。
タグID番号が一致していなくても、Trados上の通常の検証機能ではエラーにはなりません。もちろん、タグの削除はエラーになるのでそこで気付くこともできますが、やはり余分な修正作業が増えてしまいます。デプロでは、納品時のTMの品質を維持するためにも、翻訳時には原文と訳文のタグIDを一致させることをお願いしております。

日本語の翻訳単位の最後にある半角スペースの保持

Tradosのエディターで日本語の翻訳単位の最後に半角スペースがある場合、訳文生成やExportによってこのスペースがなくなってしまうことはあまり知られていないようです。

たとえば原文ファイル (word) に以下のようにコロンの後に半角スペースが入っている場合:

Tradosにファイルを入れると、以下のように半角スペースは見えなくなります。

これは、表示を

にしていた場合です。これをすべてのコンテンツを表示

にすると

それぞれの翻訳単位の後にスペースが非表示で存在することが分かります。

日本語でコロンを半角にして、その後に半角スペースを入れるスタイルの場合(Microsoftもこのスタイル)、日本語で訳すときにどう処理すればいいか。
単純に考えれば、スペースは非表示で残っているんだから、何もしなくてもいいのでは?と思いますよね。つまりAll Contents表示で

と処理する。ところが、これで訳文を生成(またはExport)すると、以下のように半角コロンの後のスペース(非表示部にあるスペース)は消えてしまうんです。

これについては、Trados2007の時代から翻訳単位の最後に入れた半角スペースは消える、と公式にSDLさん自身が認めていらっしゃいます。

SDL Trados Studio 2015 SR2で

*****************
Enhancements to processing white spaces when using Japanese as a target language. As a general rule and as before, a space at the end of the segment is removed. However, a space is added or kept after the following characters: single-byte colon, semi-colon, question mark or exclamation mark. Studio makes sure that the space between the segments is kept after these characters.
セグメントの末尾のスペースはこれまで通り削除されるが、半角コロン、セミコロン、疑問符、感嘆符が末尾にある場合は、1つスペースが追加/保持される。
*****************
ということなのですが、実際、プロジェクトを運用していく上では、以前と変わらず特別な処理が必要です。

そこで弊社では長年、このような場合は翻訳者様にお願いして末尾にスペースを入れて「●●」を追加するという処理をしてきました。つまり、
英語:

日本語:

でもこうすると非表示の半角スペースがあるのだから、●●のあとにスペースが残って生成後に●●を取った後はスペースが2つ重なりそうですよね。でも生成してみると以下のとおり、●●の後にはスペースは入っていません。

生成後のファイルで「●●」だけを削除すればOKです。
ではスペースを1つ入れて●●を入れなければどうなるか。つまり、
英語:

日本語:

です。生成してみると以下のとおり、スペースが1つちゃんと入っています。

これでよくない?って思われるかもしれませんが、実はこのスペース、TMでは保持されないんです。この翻訳単位を登録したTMをTMX形式でExportすると、スペースが登録されていません。

●●を付けたほうはスペースも登録されています。

ということで、やはり正解は
英語:

日本語:

です。

ちなみに、同じファイルに更新があった場合、Perfect Matchをかけると、末尾のスペースは以下のように保持されます。

でもTMには登録されていませんので、別の場所で100%マッチとなったところは、
TMから取得するとスペースが取れてしまいます。

TMに記号が入っているのを嫌がられるお客様もいらっしゃるのですが、このような事情によるものですので、ご理解いただければ幸いです。