[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:564] Re: [drf:557] Re: [drf:556] Re: [drf:549] 既存画像PDFからのOCRテキスト抽出を大量に一括で



宮崎大学の寸田です。

findabilityの点では土屋先生のおっしゃるとおり、現状ではメタデータの効果
は小さいようです。
しかし、検索エンジンでヒットしてダウンロードされても、読まれなければ意味
がありません。

ログを調べたところ、メタデータ表示画面を見た人のだいたい半分がコンテンツ
をダウンロードしているようです。
残り半分はメタデータを見ただけで不要なコンテンツであると判断しています
が、ダウンロードした場合は最後まで目を通すことが多いと考えられます。
それに対して検索エンジンでフルテキストがヒットした場合は、即ダウンロード
につながりますが、一瞥しただけで捨てられるケースが非常に多いだろうと考え
られます。

つまり、「量」ではフルテキストにかなわないのですが、実際に読まれたり引用
につながる「質」まで考えると、メタデータによるナビゲーションは有用だと思
います。

Syun Tutiya さんは書きました:
> 寸田さん、
> 
>> 昨年度から工学部紀要がボーンデジタルになったのですが、ダウンロード数が画
>> 像のみの時の5倍になりました。
>> このため、このような作業(数百件程度ですが)をしたいと考えていました。
> 
> Searchableなfull textこそが、(findabilityの観点からは)最良のメタデータ
> ということですね。納得します。いわゆるメタデータは管理用のものだけでも
> ういいということになるのでしょうか。
> 
> 土屋
> 

-- 
□ □ □ □ □ □ □ □ □ □ □ □ □ □ □
□ 寸田 五郎
□ 宮崎大学学術研究協力部
□ 情報図書課情報管理係
□ TEL 0985-58-7146
□ FAX 0985-58-2896
□ sunden @ xxxxxxxxxxxxxxxxxxx
□ □ □ □ □ □ □ □ □ □ □ □ □ □ □