半年ほど前にあるクライアントからポストエディット(Post Edit)業務についての説明を受けた。これまでもマシントランスレーションが適用されてきたプロジェクトはあったが、あくまでもマッチ率の低い文字列に対し、マシントランスレーションを適用した通常の「翻訳」プロジェクトだった。社内ではポストエディット受注に備え、社内で勉強会を開いたり、進め方について話し合いをしてきたが、当初は「多くの場合、マシントランスレーションは日本語では使えない」というのが共通理解だった。だが、昨今はそうでもないらしい。マシントランスレーションのエンジンはどんどん精査され、適切な長さの文字列では、かなり使えるものが出てくるようになった。
ポストエディットは、同プロジェクトの過去の翻訳テキストをサンプルとして取りだし、ヒューマントランスレーション (人による翻訳) とマシントランスレーション(機械による翻訳)のエラーの数を比べ (Edit Distance Ratio:エディットディスタンスレシオ)、その差がある一定以下の場合にマシントランスレーションが有効であるとみなされ、ポストエディットプロジェクトとして動き始めるらしい。
翻訳済みのデータベースがどんどん蓄積され、TMXとして公開されていくことで、この動きはますます加速すると考えられる。翻訳会社もこの動きを無視することはできない。