分からない人(と機械)には分からない

Google翻訳に「城北図書館」と入力して日本語→英語の翻訳を試みると、「Seongbuk Library」と表示された。
日本語で「城北」を読むと「じょうほく」か、せいぜい「しろきた」になるはずだ。
私は韓国語の知識を持っていないが、「Seongbuk」は韓国語読みのアルファベット表記にしか見えない。
Google翻訳は訳例の蓄積から統計的に答えを出しているそうだが、誰がそんな対訳を放り込んだのだろうか。
日本語の文中で韓国の地名をわざわざ漢字表記した例があったということだろうか。
それにしても「城北」やら「城南」やらといった地名は日本中にあるだろうに、上記例の方が多かったのかが不思議だ。
日韓どちらの言語も分からない人、まして機械には「じょうほく」か「Seongbuk」かの区別がつかないのも道理だが。
固有名詞のローマ字表記を目的にGoogle翻訳を使ってはならないということは分かった。

イラスト教室に行ってみた その二

イラスト講座の第二回目。
イメージを言葉で列挙するという意外な課題を与えられた。
お題は春夏秋冬。それぞれの季節からイメージできる好きなものを言葉で列挙していく。
言葉を連想するのぐらい簡単だろうと思っていたが、いざ書き出してみるとなかなか増えない。
それなりに季節感のある生活をしていたつもりだったので我ながら驚いた。
春はツバメ、夏はホトトギス、カモメ、秋は雁、冬はふくら雀……気づいたら鳥ばかり。
無論この他にも色々と出したのだが、「じゃあ好きなものを題材に描いてみようか」と言われ困る。
何故か思いついたものが色彩ではなく音のイメージばかりだったので、どれも描けそうにない。
ツバメの雛に挑戦してみようかと、まずは丸っこいものを画用紙の隅に描いてみた。
描きたいもののイメージが頭にあったからか、意外と形になっている。
しかし手元の色鉛筆では綿毛に塗れる色がない。
まあとりあえず雛に見えればいいかと思って茶色で塗っていると、「単調ではいけない」と指導が。
翼や後頭部に焦げ茶で影を付けてくれたまではよかったが、喉元の緑色はちょっと….。
何だか挿し餌に小松菜の粉末を混ぜたような仕上がりに見えて仕方なかった。
しかしそれを理解してもらえそうな空気でもなかったので、おとなしくスケッチブックを閉じる。
「この色鉛筆は悪い。せめてまともな長さのにしなさい」が唯一のそれらしい指導だった。

作業としては簡単

先日来の副業は、作業としては簡単なものだった。
片方のデータを集計してもう片方のデータと関連づけるだけ。
集計のほうは項目数こそ多かったが、Accessを使えばどうということはない。
ただ、仕事としては困難な部類だった。
集計軸にするべき項目が見えていなかったり、単位が決まっていなかったり。
外注先である私が勝手に決められない(であろう)要素が未定のままだったのだ。
好きに決めてもいい、と最初から確約してあれば迷いは要らないのだが、そんなはずはない。
一人で考えているうち話が見えなくなってきてしまったので、土曜の夜だがTさんに電話した。
失礼な時間帯だろうに気にするそぶりもなく出てくれてひとまずは安堵。
こちらで考えてみた仮定の値を提示して判断を仰いだらすんなりと通った。
「そういうこと言ってもらえるのも、ならではだからねぇ」とありがたいお言葉まで頂きやや恐縮。
だが、「そういうこと」でお金をもらってもいいのでは?とささやく声がする。
漠然とした要求を形あるものに整理する、という仕事がどこまで評価されているのか、と。
そこまで織り込んで「作業代金」を請求しているか、と自問すると答えに困る。
全く想定していないといえば嘘になるが、上乗せできるほどの働きでもないような気もしている。
まあ余りに簡単な仕事だったら私に投げる暇に自社でどうにかするだろうとは思うが。
一方で依頼された仕事の難易度を判断する「仕事」がこちらに発生していることは否定できない。
…尤も、受注してしまってから仕事の難易度が分かるなどということは本業のほうで日常茶飯事だが。

誰かが教えてくれる

こまの毛引き行為が心配なので、防止用の拘束具エリザベスカラーが気になるこの頃。
手元の本にも作り方は書いてあるのだが、何故か固定方法だけ全く触れられていない。
闇雲に検索してみてもそこだけは分からなかった。
そこで、だめで元々とついったーで質問をつぶやいてみた。
「誰か教えてください」と最後に書いて待つこと一時間ほどで、三人が次々と答えてくれた。
自分の経験談からお勧めの動物病院まで、とても親身に書かれており皆さんに感謝。
おまけに、うち一人が意外とご近所さんであることまで判明した。
これまで自分だけで調べて解決するほかなかった問題が、誰かに助けてもらえる幸せ。
便利さなんかではなく、幸せなのだと思う。
何しろ答えてくれた皆さんは、ついったーでしか知らない人々なのだ。
そのうちオフ会か何かで知り合いになろうと希望してはいるが。

なんたる皮肉

副業の方が元データ待ちで手空きだったところに中文和訳校正の打診。
断るのも面倒だ、ぐらいの気持ちで引き受けた。
分野は経済。ある会社の株主向け四半期報なので、よく出る単語や言い回しは頭にある。
原文を印刷している間に訳文を一瞥したところ、早速おかしな箇所を発見。
たいてい序盤で間違いの見つかる訳文は、全体的に品質が悪い。
「辞書は引きました」と言いたげなぐらい、経済用語そのものには問題がない。
ただ、文書の用途と言い回しが合っていない箇所や、純粋に日本語としておかしい箇所が多かった。
刷り上がった原文と比較してみると、固有名詞に間違いを発見。
単語区切りを間違えたのかもしれない。
「~建設会社との契約」が、「~会社と建設する契約」になっていた。
直感的におかしいと思い百度で検索してみたところ、図星だった。
ちょっと検索するだけで分かるところなのに、経験不足なのか不注意なのか。
先日トライアルで不合格にした訳文の方がよほどよくできていた。
別会社の案件だったのでどうすることもできないが、とても皮肉に感じる。
優秀なのに惜しいところで登録翻訳者になれなかった人と、雑なのになれてしまった人。
あるいは自身も後者なのかもしれないが、どうも後味が悪い仕事だった。

ひたすら大量にある簡単なお仕事

R社のTさんから引き合いの電話をもらった。
今度は紹介ではなく彼女が発注元らしい。
「書式バラバラのたくさんあるデータを指定書式にまとめてほしい」とのこと。
件数は7000件ぐらいと聞いていたが、メールをもらってみたら1桁は違う。
とは言え作業は割と簡単(に細分化できそう)なので報酬等の条件は変更なしで受注。
私が退社しても、相手が異動しても、こうして仕事をもらえるのはありがたい。
不定期で単発の仕事なので生活費の当てにするわけにはいかないが、それ以上のものがある。
場合によってはこちらから断ることもありうるが、できるだけ大事にしたい。
皆さんに都合よく使ってもらえれば、と思う。

メニューは訳しにくいらしい

これまで引き受けた仕事の中で最も難易度が高いと感じたのは料理名の翻訳である。
中国の料理名も日本でのそれと同じように、お店の造語だったりしてその文字列から意味が拾えなかったりする。
まあ造語だと分からないのはともかく、全く一般的な名前でもいざ考えると分からないものだ。
例えば有名な中華料理「八宝菜」をおなじみの翻訳エンジンが知っているのか試してみた。


「八宝菜」を日英翻訳
Google:Eight Treasure Vegetables←漢字を一個ずつ訳しましたね。分かります。
Excite:Eight [takarasai]←途中で放棄?
Yahoo:A Chinese dish containing eight kinds of ingredients←正しい説明文。だが文。


ついでに「八宝菜」を中英翻訳すると
Google:Eight dishes←文脈によっては正しそうな気もするが、よほどの低頻度。
ナンダコノチガイハ。


当てにならないことは一目瞭然といったところか。
Web機械翻訳が対応していないとなると、ひたすら検索するしかない。
受注頻度を考えると料理専門辞書を買うのも合理的ではないし……いっそ断るしかないのか?

日本人翻訳者の需要

先日の西日本セミナーとその後の懇親会で話題になっていたのが中国勢の脅威。
・日本語を学ぶ中国人の熱気が凄まじい
・なかなか流暢な日本語を使いこなす中国人も相当数いる
・企業によっては中国語+英日トライリンガルしか採用しないほど
・とにかく安くて優秀な人材が集まる@大連
…..と続いて、「日本人翻訳者の仕事は奪われてしまうのでは?」という話で盛り上がった。
要求品質と料金のバランスによっては十分ありえる話だ。


が、同じ「バランスの問題」で日本人翻訳者の需要もあり続けるだろうと私は思っている。
現に中国語訳のクロスチェック(日本人から見た妥当性の確認)依頼が来るからだ。
日中翻訳は中国人のほうが高品質になるのは当然だろうが、
それでも日本人(日本語ネイティブ)にしか認識しがたい誤訳が発生する。


・日本語には欧米言語のような「分かち書き」がないため、単語の区切りが明示されていない。
→かな部分の単語区切りの誤解による誤訳
・固有名詞の訳出が不自然になる。
→ビル名や商品名などの造語はその語句だけを訳すと死んでしまう。
→→由来や命名意図が考慮されない訳語になる。


いずれも程度問題と言ってしまえばそれまでだし、そういう誤訳をしない人も存在しうる。
中文和訳となると更に「見た目の自然さ」という難関がそびえてはいるが、
本当に「バランスの問題」だけで我々(私だけ?)が生かされているような気がしてならない。

つなげる先が

夕方7時頃どうにも眠くなったので寝ていたら、しばらくして電話で起こされた。
すわ国際電話かと緊張したが、R社でお世話になったFさんだった。
「また例に倣ってやねんけど…」PCが不調だとのこと。
何か画面を見て対応することになるかもと思い、仕事部屋に移った。
ネットワーク接続がおかしいとのことで、状況を逐次確認。
設定が変わっていた理由は本人も分からないようだが、再設定でどうにか解決。
「これで明日からの出張も大丈夫かしらん」…答えに困る。
解決した問題は家庭内LANの接続なので出張先とは関係がない。
まぁハードがおかしくなっている訳ではないので動くだろうとは思うが。
SBMの通信アダプタがあるでしょ、と答えると「使わなければ0円なのに使うとン千円が…」
大阪人はコワいものだ。

文体診断

ついったーで誰かが紹介していた「文体診断ロゴーン」というサービスが面白い。

ランダムに「診断結果」を表示するのではなく、まじめに例文を解析してくれるのだ。

入力枠に先日の日記を貼り付けて「診断する」を押したところ、下記の結果が出た。

・64人の作家や政治家の例文で、私の日記と最も近かったのが有島武郎(作品は『或る女』)。

・最も(唯一?)好きな吉川英治と一致率ワースト2なのが切ない。

・文章評価は「一文がやや長い」「文章が柔かい」「とても表現力豊か」「とても個性的」

 文の長さで評価が低かった。反省に値する。

 「文章が柔らかい」は評価Eなのだが、必ずしも低いという意味には捉えていない。

 用途に応じて硬軟を使い分けるのが理想ではなかろうか。



詳細結果は以下のとおり。


一致指数ベスト3




名前一致指数
1有島武郎64.3
2三木清64.3
3坂口安吾63.7


一致指数ワースト3





名前一致指数
1阿川弘之30.8
2吉川英治32.9
3石川啄木33.1


文章評価






評価項目評価とコメント
1文章の読みやすさD一文がやや長い
2文章の硬さE文章が柔かい
3文章の表現力Aとても表現力豊か
4文章の個性Aとても個性的


得点詳細

平均
文長
平均
句読点間隔
特殊語
出現率
名詞
出現率
動詞
出現率
助詞
出現率
助動詞
出現率
ひらがな
出現率
カタカナ
出現率
異なり
形態素比率
粗点35.422.136.7821.199.3233.920.3462.710.8551.69
偏差値446232314774916950101