[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:566] 代理投稿 Re: 既存画像PDFからのOCRテキスト抽出を大量に一括で



九州大学井上先生から。

>井上先生、
すみません、SPAM対策で登録外アドレスからのメールをはじくように
してますので、個人アドレスでsubscribeしてもらえますか。
―――――――――――――――――――――――――――――――――


皆様

九大の井上創造と申します.

メタデータからダウンロードしたうち熟読する割合>フルテキスト検索からダウン
ロードしたうち熟読する割合

ということだと思うのですが,この割合にはどのような意味があるのでしょうか.
もしくは,このような観点を調査した文献などあるのでしょうか.

最近メタデータの必要性をよく議論していますが,このような観点を考えたことが
なかったので...

Goro SUNDEN さんは書きました:
> 宮崎大学の寸田です。
> 
> findabilityの点では土屋先生のおっしゃるとおり、現状ではメタデータの効果
> は小さいようです。
> しかし、検索エンジンでヒットしてダウンロードされても、読まれなければ意味
> がありません。
> 
> ログを調べたところ、メタデータ表示画面を見た人のだいたい半分がコンテンツ
> をダウンロードしているようです。
> 残り半分はメタデータを見ただけで不要なコンテンツであると判断しています
> が、ダウンロードした場合は最後まで目を通すことが多いと考えられます。
> それに対して検索エンジンでフルテキストがヒットした場合は、即ダウンロード
> につながりますが、一瞥しただけで捨てられるケースが非常に多いだろうと考え
> られます。
> 
> つまり、「量」ではフルテキストにかなわないのですが、実際に読まれたり引用
> につながる「質」まで考えると、メタデータによるナビゲーションは有用だと思
> います。
> 
> Syun Tutiya さんは書きました:
>> 寸田さん、
>>
>>> 昨年度から工学部紀要がボーンデジタルになったのですが、ダウンロード数が画
>>> 像のみの時の5倍になりました。
>>> このため、このような作業(数百件程度ですが)をしたいと考えていました。
>> Searchableなfull textこそが、(findabilityの観点からは)最良のメタデータ
>> ということですね。納得します。いわゆるメタデータは管理用のものだけでも
>> ういいということになるのでしょうか。
>>
>> 土屋
>>
> 


-- 
杉田茂樹 <sugita @ xxxxxxxxxxxxxxxxx>
北海道大学附属図書館情報システム課システム管理担当
電話番号:011-706-2524,ファクシミリ:011-706-4099
http://eprints.lib.hokudai.ac.jp