[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:557] Re: [drf:556] Re: [drf:549] 既存画像PDFからのOCRテキスト抽出を大量に一括で



寸田さん、

> 昨年度から工学部紀要がボーンデジタルになったのですが、ダウンロード数が画
> 像のみの時の5倍になりました。
> このため、このような作業(数百件程度ですが)をしたいと考えていました。

Searchableなfull textこそが、(findabilityの観点からは)最良のメタデータ
ということですね。納得します。いわゆるメタデータは管理用のものだけでも
ういいということになるのでしょうか。

土屋