[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:1173] Re: 透明テキスト付きデータ編集について



鈴木さんこんにちは

 高橋@民博です。

 SOURCENEXT社の「いきなりPDFシリーズ」がお勧めです。
 http://www.sourcenext.com/titles/pdf/?i=titles

 上記サイトをご覧になって、他にも機能が必要であればその
機能もあるセットにするとか、考えられたら良いかと思います。
コストパフォーマンスの面ではこれが一番かと思います。

 ドイツ語+日本語は試していませんが、英語+日本語でした
ら、許容範囲の内かなと考えています。特殊言語でなければ、
カバーできる可能性はあります。

 業者委託に関しては、ナカバヤシに昨年お願いしたのですが、
言語混在文書に関しては、やはり苦労していたようでした。ち
なみに、e.Typistを使って処理しているとのことでしたが。サ
ンプルによっては、いきなりPDFの方が識字率が良い場合が
ありました。

> 現在、過去の論叢などの遡及入力を行っているのですが、
> 古いものはPDFに透明テキストつきのデータがないものが
> あります。業者に依頼すると高くついてしまうということ
> もあり、出来る限り自分たちで編集を行っているのですが、
> OCR機能を用いての読み込み、編集が難しいものについては、
> 皆さまどのように対応なさっているのでしょうか。教えて
> いただけるとありがたいです。(ちなみに編集はAcrobat9.0
> を使用しており、Adobeのカスタマーセンターに何度か問い
> 合わせを行いましたが、同じ文書の中に日本語とドイツ語の
> 両方の言語が入っている場合などに文字認識されないものが
> あるとのことで、頭を悩ませております。)どうぞ宜しくお
> 願いいたします。

 透明テキスト付きにこだわらないという考えも、検討された
かと思いますが、何事もパーフェクトは望めません。出来ない
ものは出来ないとして、無しで登録することも必要かと...

-- 
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
 国立民族学博物館 情報管理施設 情報サービス課
   高 橋 安 司 ( TAKAHASHI, Yasushi )
  TEL:06-6878-8227  FAX:06-6878-8249
  E-mail: taka8441 @ xxxxxxxxxxxxxxxxx
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜