[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:1173] Re: 透明テキスト付きデータ編集について
- Date: Mon, 22 Jun 2009 14:35:15 +0900
鈴木さんこんにちは
高橋@民博です。
SOURCENEXT社の「いきなりPDFシリーズ」がお勧めです。
http://www.sourcenext.com/titles/pdf/?i=titles
上記サイトをご覧になって、他にも機能が必要であればその
機能もあるセットにするとか、考えられたら良いかと思います。
コストパフォーマンスの面ではこれが一番かと思います。
ドイツ語+日本語は試していませんが、英語+日本語でした
ら、許容範囲の内かなと考えています。特殊言語でなければ、
カバーできる可能性はあります。
業者委託に関しては、ナカバヤシに昨年お願いしたのですが、
言語混在文書に関しては、やはり苦労していたようでした。ち
なみに、e.Typistを使って処理しているとのことでしたが。サ
ンプルによっては、いきなりPDFの方が識字率が良い場合が
ありました。
> 現在、過去の論叢などの遡及入力を行っているのですが、
> 古いものはPDFに透明テキストつきのデータがないものが
> あります。業者に依頼すると高くついてしまうということ
> もあり、出来る限り自分たちで編集を行っているのですが、
> OCR機能を用いての読み込み、編集が難しいものについては、
> 皆さまどのように対応なさっているのでしょうか。教えて
> いただけるとありがたいです。(ちなみに編集はAcrobat9.0
> を使用しており、Adobeのカスタマーセンターに何度か問い
> 合わせを行いましたが、同じ文書の中に日本語とドイツ語の
> 両方の言語が入っている場合などに文字認識されないものが
> あるとのことで、頭を悩ませております。)どうぞ宜しくお
> 願いいたします。
透明テキスト付きにこだわらないという考えも、検討された
かと思いますが、何事もパーフェクトは望めません。出来ない
ものは出来ないとして、無しで登録することも必要かと...
--
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
国立民族学博物館 情報管理施設 情報サービス課
高 橋 安 司 ( TAKAHASHI, Yasushi )
TEL:06-6878-8227 FAX:06-6878-8249
E-mail: taka8441 @ xxxxxxxxxxxxxxxxx
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜