言語: 2010年4月アーカイブ

カスタム検索

Google翻訳に「城北図書館」と入力して日本語→英語の翻訳を試みると、「Seongbuk Library」と表示された。
日本語で「城北」を読むと「じょうほく」か、せいぜい「しろきた」になるはずだ。
私は韓国語の知識を持っていないが、「Seongbuk」は韓国語読みのアルファベット表記にしか見えない。
Google翻訳は訳例の蓄積から統計的に答えを出しているそうだが、誰がそんな対訳を放り込んだのだろうか。
日本語の文中で韓国の地名をわざわざ漢字表記した例があったということだろうか。
それにしても「城北」やら「城南」やらといった地名は日本中にあるだろうに、上記例の方が多かったのかが不思議だ。
日韓どちらの言語も分からない人、まして機械には「じょうほく」か「Seongbuk」かの区別がつかないのも道理だが。
固有名詞のローマ字表記を目的にGoogle翻訳を使ってはならないということは分かった。

カスタム検索
ついったーで誰かが紹介していた「文体診断ロゴーン」というサービスが面白い。
ランダムに「診断結果」を表示するのではなく、まじめに例文を解析してくれるのだ。
入力枠に先日の日記を貼り付けて「診断する」を押したところ、下記の結果が出た。
・64人の作家や政治家の例文で、私の日記と最も近かったのが有島武郎(作品は『或る女』)。
・最も(唯一?)好きな吉川英治と一致率ワースト2なのが切ない。
・文章評価は「一文がやや長い」「文章が柔かい」「とても表現力豊か」「とても個性的」
 文の長さで評価が低かった。反省に値する。
 「文章が柔らかい」は評価Eなのだが、必ずしも低いという意味には捉えていない。
 用途に応じて硬軟を使い分けるのが理想ではなかろうか。

詳細結果は以下のとおり。
一致指数ベスト3
名前一致指数
1有島武郎64.3
2三木清64.3
3坂口安吾63.7

一致指数ワースト3

名前一致指数
1阿川弘之30.8
2吉川英治32.9
3石川啄木33.1

文章評価

評価項目評価とコメント
1文章の読みやすさD一文がやや長い
2文章の硬さE文章が柔かい
3文章の表現力Aとても表現力豊か
4文章の個性Aとても個性的

得点詳細
平均
文長
平均
句読点間隔
特殊語
出現率
名詞
出現率
動詞
出現率
助詞
出現率
助動詞
出現率
ひらがな
出現率
カタカナ
出現率
異なり
形態素比率
粗点35.422.136.7821.199.3233.920.3462.710.8551.69
偏差値446232314774916950101

このアーカイブについて

このページには、2010年4月以降に書かれたブログ記事のうち言語カテゴリに属しているものが含まれています。

前のアーカイブは言語: 2010年3月です。

次のアーカイブは言語: 2011年8月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

自己紹介
主な翻訳実績
Profile in English
自我介绍
翻訳者のつくりかた

言語: 2010年4月: 月別アーカイブ

Powered by Movable Type 4.1