[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:2613] Re: 今年度の活動紹介(旭川医科大学)



旭川医科大学  浅野さま

大阪大学の森石と申します。こんにちは。

活動など興味深く拝見しました。先生が、面倒くさいと
思いつつも協力的に行動してるってことは、それなりに
よい話に聞こえましたが(違う?)

ところで、最後の本文とシステムの話がちょっと不思議
でしたので、メールしました。


>4. リポジトリのシステム
>  本学のリポジトリには、ほぼ本文が登録されているのに、外部から
>  「本文なし」と見えているらしいことが最近判明し、困っています。
>  原因がどこにあるのかもよくわかりません。
>  IRDBコンテンツ分析でも、反映されていなくて、落胆しました。

何をもって、外部から本文なしに見えるっと判明したのでしょうか?
http://irdb.nii.ac.jp/analysis/shousai.php?ir_no=10
本文は、78.7 % となっていますが、これ以上に本文があるのに、一部が
反映していないということでしょうか?

もしかして、DSpace以外は 0.0 % と出てしまう、ファイル形式分布のところ
じゃないかと想像しましたが、その場合、↓の修正云々になりませんよね。
ちょっと書かれている内容がよくわかりませんでした。

>  こちらはコンテンツ登録をし直して一部修正できましましたが、先日
>  発表された世界のリポジトリランキングでもテキスト付随率が著しく
>  低く出てしまっています。

テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?

Rich Files (R). Files in formats like Adobe Acrobat (.pdf), MS Word (doc), 
MS Powerpoint and PostScript (.ps) 
extracted from Google, Bing and Yahoo.

extracted  とありますので、検索エンジンがひっぱるテキスト抽出可能な
PDF等の数が重要な気がします。
旭川さんのファイルを拝見しましたら、OCRかかっていないのもありましたし、
カバーページのセキュリティが、「アクセシビリティのための内容の抽出」は
「許可」ですが、「文書のコピー」は「許可しない」になっています。

ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。

本文なしと、ランキングは、別の話ではないかなと思いました。

もしかして違うこと言ったかもしれません。どなたかフォローいただけると
幸いです。

よろしくお願いいたします。


------------------------------------------------*-*-*
森石 みどり MORIISHI Midori 
 大阪大学附属図書館 学術情報整備室 電子コンテンツ担当
 TEL: 06-6850-5071 (学内:2061) / FAX: 06-6850-5052
 E-mail:moriishi @ xxxxxxxxxxxxxxxxxxxxx

 
 


──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
 2011年8月号を発行しました!

DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/ 
─────★─────────────────────