同じうして非なるもの

中国語には繁体字と簡体字がある。
自分の目では同じものとして認識できても、データとしては全くの別物。


データとして別物だと、検索がしづらい。
類似の文を訳した記憶があっても記録が取り出しにくいということになる。
法律関係や一部の技術文書では、決まり切った定型文も多い。
あれだと頭で分かっていても、「あれ」を具体的なデータとして発掘するのは別の話。
類似の定型文を前にどう訳したのか気になりながら訳し起こすのも焦れるものだ。
文字コードが一致していれば簡単に流用できるのにと思うこともしばしばある。
いっそ翻訳メモリを変換すればとも思い立ったのだが、これもまた失敗した。
文字コード変換は繁体字(Big5)と簡体字(GB2312)相互間になら使えるソフトがある。
いかんせん翻訳メモリを書き出すと、文字コードはUnicode(UTF-8)とこれまた別物。
当座その書き出したテキストファイルで検索するほかない。
一見いずれかの中国語のようでいて文字コードが日本語のこともある。
共通する漢字だけきれいに見えて、ところどころ形が崩れて見えたら要注意。
自分の流儀で訳すには、この類が実は最も質が悪い。
mojibake.png
こういうことになる(原文欄が明らかに文字化けしている)。
何故「最も」悪いかと言えば、新規ファイルのとき何ら問題を感じないからだ。
同一の原稿は同一条件で作成されているため、抵抗なくメモリが流用できる。
後で類似文書に行き当たったとき、原文で検索する術がないのだ。
そして上述のようなうろ覚えの呵責にさいなまれる。
対策は今のところ「気をつける」のみ。
幸いWordは然るべきフォントを割り付ければ対応する文字コードにできるため、
原稿を開いて初めに、簡体字(であるべき)原文であれば「SimSun」に置き換える。
繁体字のときは「MingLiu」でいい。
どのみち訳し上がりに中国語が残ってはならないのだから。
否、そういう場合はむしろ救われるとも言える。
文章の一部だけ翻訳対象に指定されていると一概にそうもできない。
ちまちまと担当範囲だけを選択して置き換えることにしているが。
効率化にもそれなりの手間はかかるのであります。

“同じうして非なるもの” への2件の返信

  1. 一般論としては全く正しくても、個別の仕事は飽くまで個別の事象ですし。自分に合うか、合わせられるかの工夫も要りますよね。都度。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です