[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:568] Re: [drf:566] 代理投稿 Re: 既存画像PDFからのOCRテキスト抽出を大量に一括で



宮崎大学の寸田です。

> メタデータからダウンロードしたうち熟読する割合>フルテキスト検索からダウン
> ロードしたうち熟読する割合
>
> ということだと思うのですが,この割合にはどのような意味があるのでしょうか.
> もしくは,このような観点を調査した文献などあるのでしょうか.

メタデータ検索とフルテキスト検索とで、熟読する割合を比較することには意味
があるように思います。

フルテキスト検索可能なコンテンツはそうでないコンテンツの5倍のダウンロー
ド数があるということは、ダウンロード数のうち実に80%がフルテキスト検索に
よるものと考えられます。
そのため、「メタデータは管理用のものだけでもういい」と考えるのかもしれま
せん。

しかし、「メタデータからダウンロードしたうち熟読する割合」が「フルテキス
ト検索からダウンロードしたうち熟読する割合」の比率がもし仮に4:1(根拠
はありませんが)とすると、ダウンロード数の比率は1:4ですから、「メタ
データから熟読された数」と「フルテキスト検索から熟読された数」の比率は
1:1になり、メタデータ検索が不要とは言えないでしょう。

つまり、「メタデータからダウンロードしたうち熟読する割合」と「フルテキス
ト検索からダウンロードしたうち熟読する割合」の比率によってはメタデータ検
索は必要とも不要ともいえます。
少なくとも、ダウンロード数の比較だけではメタデータ検索が不要とはいえない
だろうと思います。

SUGITA Shigeki さんは書きました:
> 九州大学井上先生から。
> 
> >井上先生、
> すみません、SPAM対策で登録外アドレスからのメールをはじくように
> してますので、個人アドレスでsubscribeしてもらえますか。
> ―――――――――――――――――――――――――――――――――
> 
> 
> 皆様
> 
> 九大の井上創造と申します.
> 
> メタデータからダウンロードしたうち熟読する割合>フルテキスト検索からダウン
> ロードしたうち熟読する割合
> 
> ということだと思うのですが,この割合にはどのような意味があるのでしょうか.
> もしくは,このような観点を調査した文献などあるのでしょうか.
> 
> 最近メタデータの必要性をよく議論していますが,このような観点を考えたことが
> なかったので...
> 
> Goro SUNDEN さんは書きました:
>> 宮崎大学の寸田です。
>>
>> findabilityの点では土屋先生のおっしゃるとおり、現状ではメタデータの効果
>> は小さいようです。
>> しかし、検索エンジンでヒットしてダウンロードされても、読まれなければ意味
>> がありません。
>>
>> ログを調べたところ、メタデータ表示画面を見た人のだいたい半分がコンテンツ
>> をダウンロードしているようです。
>> 残り半分はメタデータを見ただけで不要なコンテンツであると判断しています
>> が、ダウンロードした場合は最後まで目を通すことが多いと考えられます。
>> それに対して検索エンジンでフルテキストがヒットした場合は、即ダウンロード
>> につながりますが、一瞥しただけで捨てられるケースが非常に多いだろうと考え
>> られます。
>>
>> つまり、「量」ではフルテキストにかなわないのですが、実際に読まれたり引用
>> につながる「質」まで考えると、メタデータによるナビゲーションは有用だと思
>> います。
>>
>> Syun Tutiya さんは書きました:
>>> 寸田さん、
>>>
>>>> 昨年度から工学部紀要がボーンデジタルになったのですが、ダウンロード数が画
>>>> 像のみの時の5倍になりました。
>>>> このため、このような作業(数百件程度ですが)をしたいと考えていました。
>>> Searchableなfull textこそが、(findabilityの観点からは)最良のメタデータ
>>> ということですね。納得します。いわゆるメタデータは管理用のものだけでも
>>> ういいということになるのでしょうか。
>>>
>>> 土屋
>>>
> 
> 


-- 
□ □ □ □ □ □ □ □ □ □ □ □ □ □ □
□ 寸田 五郎
□ 宮崎大学学術研究協力部
□ 情報図書課情報管理係
□ TEL 0985-58-7146
□ FAX 0985-58-2896
□ sunden @ xxxxxxxxxxxxxxxxxxx
□ □ □ □ □ □ □ □ □ □ □ □ □ □ □