大阪教育大学附属図書館 谷口と申します。
おたずねしたいのですが、
”データをスキャンする際にOCRをかけて読み込むと文字がつぶれる”ということがあるのでしょうか。
というのも、本学は紀要論文メタデータとPDFファイルの作成を業者に依頼いたしました。
PDFファイルの仕様としては
・テキストは白黒の300dpi
・透明テキストをつける(文字補正は行わない)
ということをもりこんでおりました。
ところが、納品されたPDFファイルの文字がところどころつぶれたところが見受けられました。
試しに自館のスキャナで200dpiと300dpiでスキャンしてみましたが、明かに業者の作成したものと自館作成のものとで違いがあります。
業者に確認したところ、
「OCRをかけるとdpiに関わらず文字がつぶれる。」との返事でした。(e-Typistを使用)
本学ではスキャンした後に透明テキストをつける作業を行っていましたので、そういう事態が起こるとは知らなかったとは言え、あまりの画像の違いに愕然としております。
実際に業者にデータ作成を依頼されたことのある大学・機関の方々やスキャンに詳しい方がいらっしゃいましたらご教示いただけますでしょうか。
参考までに業者の作成したデータと自館作成のデータを添付します。
よろしくお願いいたします。
****************************************
大阪教育大学 学務部 学術情報課
情報システム係(附属図書館)
谷 口 慶 子
Tel 072−978-3781 / FAX 072−978-3803
e-mail:momo @ xxxxxxxxxxxxxxxxxxxxxx
****************************************