蝸牛の歩み

蝸牛の如く,ゆっくりでも着実に前へ・・・

OCR

受付担当なので、窓口でできる仕事。ということで昨日スキャンしたものをAcrobatOCRにかける。しかし、認識できなかった「不明テキスト」というのが結構あり、まじめに訂正すると大変。特に日本語・英語混じりの論文で、英語部分が認識できていない。この辺がAcrobatの限界か……。
あと解像度は200 dpiだと荒いんだけど、300 dpi以上にするとファイルサイズが大きくなり、サーバーの容量的に厳しいことが判明。200でも読めるから許して。