TIPS: 2007年10月アーカイブ

カスタム検索

面白いことを発見した。
支給原稿が紙(又は画像PDF)のとき、たまに透かしや背景画像にぶつかるが
背景画像がOCRに拾われてしまうと該当箇所の文字が読み取れない。
そういうページに限って文字数が多かったりすると捨てるのも忍びない。

読み取りを諦める前に。
ひと手間でかなり救われる場合があるのでメモ。
該当ページの画像ペイントで開き、背景を薄い灰色で塗る。以上。
これだけでモノクロ画像がかなりぼやけるので、
OCRが透かしをただのノイズとして読み捨ててくれるようになる。

今のところ成功率90%。
ほぼ完全に読み取りたい文字が目視できている(テキストにもできている)。

このアーカイブについて

このページには、2007年10月以降に書かれたブログ記事のうちTIPSカテゴリに属しているものが含まれています。

前のアーカイブはTIPS: 2007年9月です。

次のアーカイブはTIPS: 2007年11月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

自己紹介
主な翻訳実績
Profile in English

TIPS: 2007年10月: 月別アーカイブ

Powered by Movable Type 4.1