[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:2615] Re: 今年度の活動紹介(旭川医科大学)
- Date: Tue, 23 Aug 2011 18:25:40 +0900
大阪大学
森石さま
旭川医科大学の浅野です。
さっそくありがとうございます。
あっ!初っ端から言葉足りずですみません(汗)
テクニカルな話は弱い事を露呈してしまいました。
> http://irdb.nii.ac.jp/analysis/shousai.php?ir_no=10
> 本文は、78.7 % となっていますが、これ以上に本文があるのに、一部が
IRDBに反映されていない問題は、修正済みです。現状のIRDBには
だいたい反映されています。
コンテンツ登録時に、ID欄に何かを入れて登録し直せば本文ありと
判断してくれると分かったので、ID欄が空白だったコンテンツを
ちくちく一件づつ修正しました。
> テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?
そうです。はしょりましてすみません。
> カバーページのセキュリティが、「アクセシビリティのための内容の抽出」は
> 「許可」ですが、「文書のコピー」は「許可しない」になっています。
はい、PDFの設定をそうしています。
> ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
> しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。
そうなんですか!
アクセスログを見たところ、以前から検索エンジンからのアクセスの方が
多いのですが、どうなんでしょうか。
でも、この部分がRichFilesの判別になっているのかもしれないですね。
> 本文なしと、ランキングは、別の話ではないかなと思いました。
ランキング順位とは関係ないかもしれませんが、ちゃんと反映されないのは
困ってしまいます。
> もしかして違うこと言ったかもしれません。どなたかフォローいただけると
> 幸いです。
いえいえ、どのようなご意見でもありがたいです。関連する情報を
ご存じでしたらいろいろいただきたいです。
引き続きよろしくお願いします!
>
> 本文なしと、ランキングは、別の話ではないかなと思いました。
2011年8月23日17:50 MORIISHI Midori / 附属図書館 電子コンテンツ担当
<moriishi @ xxxxxxxxxxxxxxxxxxxxx>:
> 旭川医科大学 浅野さま
>
> 大阪大学の森石と申します。こんにちは。
>
> 活動など興味深く拝見しました。先生が、面倒くさいと
> 思いつつも協力的に行動してるってことは、それなりに
> よい話に聞こえましたが(違う?)
>
> ところで、最後の本文とシステムの話がちょっと不思議
> でしたので、メールしました。
>
>
>>4. リポジトリのシステム
>> 本学のリポジトリには、ほぼ本文が登録されているのに、外部から
>> 「本文なし」と見えているらしいことが最近判明し、困っています。
>> 原因がどこにあるのかもよくわかりません。
>> IRDBコンテンツ分析でも、反映されていなくて、落胆しました。
>
> 何をもって、外部から本文なしに見えるっと判明したのでしょうか?
> http://irdb.nii.ac.jp/analysis/shousai.php?ir_no=10
> 本文は、78.7 % となっていますが、これ以上に本文があるのに、一部が
> 反映していないということでしょうか?
>
> もしかして、DSpace以外は 0.0 % と出てしまう、ファイル形式分布のところ
> じゃないかと想像しましたが、その場合、↓の修正云々になりませんよね。
> ちょっと書かれている内容がよくわかりませんでした。
>
>> こちらはコンテンツ登録をし直して一部修正できましましたが、先日
>> 発表された世界のリポジトリランキングでもテキスト付随率が著しく
>> 低く出てしまっています。
>
> テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?
>
> Rich Files (R). Files in formats like Adobe Acrobat (.pdf), MS Word (doc),
> MS Powerpoint and PostScript (.ps)
> extracted from Google, Bing and Yahoo.
>
> extracted とありますので、検索エンジンがひっぱるテキスト抽出可能な
> PDF等の数が重要な気がします。
> 旭川さんのファイルを拝見しましたら、OCRかかっていないのもありましたし、
> カバーページのセキュリティが、「アクセシビリティのための内容の抽出」は
> 「許可」ですが、「文書のコピー」は「許可しない」になっています。
>
> ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
> しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。
>
> 本文なしと、ランキングは、別の話ではないかなと思いました。
>
> もしかして違うこと言ったかもしれません。どなたかフォローいただけると
> 幸いです。
>
> よろしくお願いいたします。
>
>
> ------------------------------------------------*-*-*
> 森石 みどり MORIISHI Midori
> 大阪大学附属図書館 学術情報整備室 電子コンテンツ担当
> TEL: 06-6850-5071 (学内:2061) / FAX: 06-6850-5052
> E-mail:moriishi @ xxxxxxxxxxxxxxxxxxxxx
>
>
>
>
>
> ──────────────────☆────────
> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
> 2011年8月号を発行しました!
>
> DRF(Digital Repository Federation)
> http://drf.lib.hokudai.ac.jp/drf/
> ─────★─────────────────────
>
>
--
--------------------------------------------------------------
浅野 泉
旭川医科大学教務部図書館情報課
内線2224(D.I:0166-68-2224)
izumia @ xxxxxxxxxxxxxxxxxxxxxxxx
係宛:libkanri @ xxxxxxxxxxxxxxxxxxx
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
2011年8月号を発行しました!
DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/
─────★─────────────────────