[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:2616] Re: 今年度の活動紹介(旭川医科大学)



浅野さま、高久さま

森石@阪大です。

どうも不見識をさらした気がしますが、ご容赦くださいませ。

2011/08/23 18:23, In message "[drf:2614] Re: 今年度の活動紹介(旭川医科大学)", Masao Takaku wrote:

>XooNips 3.45 (2011年3月バグ修正リリース)よりも前のバージョンには、
>PDFファイルの Content-Type が正常に出力されないというバグがあります。

旭川さんは、きっとこちらのせいでしょうか。

>あっ!初っ端から言葉足りずですみません(汗)
>テクニカルな話は弱い事を露呈してしまいました。

いえ、こちらも中途半端なままメールしてます(汗)

>コンテンツ登録時に、ID欄に何かを入れて登録し直せば本文ありと
>判断してくれると分かったので、ID欄が空白だったコンテンツを
>ちくちく一件づつ修正しました。

修正して78.8%になったのに、タイミングが悪くて、ランキングに反映
しなかったのかもしれませんね。修正お疲れ様です。

>> ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
>> しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。
>そうなんですか!
>アクセスログを見たところ、以前から検索エンジンからのアクセスの方が
>多いのですが、どうなんでしょうか。
>でも、この部分がRichFilesの判別になっているのかもしれないですね。

全然検索エンジンからアクセスがなかったら、それ以前に気になりますよね。
ここも私が書いたことが違うかもしれません。「アクセシビリティのための
内容の抽出」が許可なら、大丈夫そうな気がします。きちんと調べていなくて
お恥ずかしいです(でもそのまま)。

他の方のメールでまた勉強させてもらいます。
ではでは。


2011/08/23 18:25, In message "[dconwg:16011] [csi:3278] [drf:2615] Re: 今年度の活動紹介(旭川医科大学)", IzumiAsano wrote:

>大阪大学
>森石さま
>
>旭川医科大学の浅野です。
>さっそくありがとうございます。
>
>あっ!初っ端から言葉足りずですみません(汗)
>テクニカルな話は弱い事を露呈してしまいました。
>
>> http://irdb.nii.ac.jp/analysis/shousai.php?ir_no=10
>> 本文は、78.7 % となっていますが、これ以上に本文があるのに、一部が
>IRDBに反映されていない問題は、修正済みです。現状のIRDBには
>だいたい反映されています。
>コンテンツ登録時に、ID欄に何かを入れて登録し直せば本文ありと
>判断してくれると分かったので、ID欄が空白だったコンテンツを
>ちくちく一件づつ修正しました。
>
>
>> テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?
>そうです。はしょりましてすみません。
>
>> カバーページのセキュリティが、「アクセシビリティのための内容の抽出」は
>> 「許可」ですが、「文書のコピー」は「許可しない」になっています。
>はい、PDFの設定をそうしています。
>
>> ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
>> しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。
>そうなんですか!
>アクセスログを見たところ、以前から検索エンジンからのアクセスの方が
>多いのですが、どうなんでしょうか。
>でも、この部分がRichFilesの判別になっているのかもしれないですね。
>
>> 本文なしと、ランキングは、別の話ではないかなと思いました。
>ランキング順位とは関係ないかもしれませんが、ちゃんと反映されないのは
>困ってしまいます。
>
>> もしかして違うこと言ったかもしれません。どなたかフォローいただけると
>> 幸いです。
>いえいえ、どのようなご意見でもありがたいです。関連する情報を
>ご存じでしたらいろいろいただきたいです。
>
>引き続きよろしくお願いします!
>
>



2011/08/23 18:23, In message "[drf:2614] Re: 今年度の活動紹介(旭川医科大学)", Masao Takaku wrote:

>高久@物質・材料研究機構;DRF技術サポートWG です。
>
>> テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?
>こちらの話に影響しているのじゃないかと思いますので情報提供しますと。
>
>XooNips 3.45 (2011年3月バグ修正リリース)よりも前のバージョンには、
>PDFファイルの Content-Type が正常に出力されないというバグがあります。
>
>このバグが残っている場合、グーグルなどの検索エンジンがPDFファイルをダウ
>ンロードした際にも、ファイル形式を識別できない等の現象が発生しているのを
>手元でも確認しています。
>現象は、グーグルで [site:amcor.asahikawa-med.ac.jp filetype:pdf] といっ
>たクエリで、ファイル形式を指定してサイト検索してヒットしない場合、これが
>影響している可能性大です。
>
>XooNipsによる構築機関の方へは、この部分だけでも不具合対応されるか、もし
>くはバージョンアップを検討されると良いのでは、と思います。
>
>取り急ぎご参考まで。
>
>On Tue, 23 Aug 2011 17:50:50 +0900
>moriishi @ xxxxxxxxxxxxxxxxxxxxx (MORIISHI Midori /	附属図書館 電子コンテンツ担当) wrote:
>
>> 旭川医科大学  浅野さま
>> 
>> 大阪大学の森石と申します。こんにちは。
>> 
>> 活動など興味深く拝見しました。先生が、面倒くさいと
>> 思いつつも協力的に行動してるってことは、それなりに
>> よい話に聞こえましたが(違う?)
>> 
>> ところで、最後の本文とシステムの話がちょっと不思議
>> でしたので、メールしました。
>> 
>> 
>> >4. リポジトリのシステム
>> >  本学のリポジトリには、ほぼ本文が登録されているのに、外部から
>> >  「本文なし」と見えているらしいことが最近判明し、困っています。
>> >  原因がどこにあるのかもよくわかりません。
>> >  IRDBコンテンツ分析でも、反映されていなくて、落胆しました。
>> 
>> 何をもって、外部から本文なしに見えるっと判明したのでしょうか?
>> http://irdb.nii.ac.jp/analysis/shousai.php?ir_no=10
>> 本文は、78.7 % となっていますが、これ以上に本文があるのに、一部が
>> 反映していないということでしょうか?
>> 
>> もしかして、DSpace以外は 0.0 % と出てしまう、ファイル形式分布のところ
>> じゃないかと想像しましたが、その場合、↓の修正云々になりませんよね。
>> ちょっと書かれている内容がよくわかりませんでした。
>> 
>> >  こちらはコンテンツ登録をし直して一部修正できましましたが、先日
>> >  発表された世界のリポジトリランキングでもテキスト付随率が著しく
>> >  低く出てしまっています。
>> 
>> テキスト付随率とは、ランキングのRichFilesの順位のことでしょうか?
>> 
>> Rich Files (R). Files in formats like Adobe Acrobat (.pdf), MS Word (doc), 
>> MS Powerpoint and PostScript (.ps) 
>> extracted from Google, Bing and Yahoo.
>> 
>> extracted  とありますので、検索エンジンがひっぱるテキスト抽出可能な
>> PDF等の数が重要な気がします。
>> 旭川さんのファイルを拝見しましたら、OCRかかっていないのもありましたし、
>> カバーページのセキュリティが、「アクセシビリティのための内容の抽出」は
>> 「許可」ですが、「文書のコピー」は「許可しない」になっています。
>> 
>> ここがうろ覚えなのですが、確か、アクセスログ関係の話で、この両方を「許可」に
>> しないと、うまく検索エンジンからのアクセスを増やせなかった気がします。
>> 
>> 本文なしと、ランキングは、別の話ではないかなと思いました。
>> 
>> もしかして違うこと言ったかもしれません。どなたかフォローいただけると
>> 幸いです。
>> 
>> よろしくお願いいたします。
>
>--
>高久 雅生 <TAKAKU.Masao @ xxxxxxxxxx>
>// 物質・材料研究機構 科学情報室 主任エンジニア
>// 〒305-0047 茨城県つくば市千現1-2-1
>// Tel: 029-859-2813   Fax: 029-859-2400
>
> 
> 
>
>
>──────────────────☆────────
>月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
> 2011年8月号を発行しました!
>
>DRF(Digital Repository Federation)
>http://drf.lib.hokudai.ac.jp/drf/ 
>─────★─────────────────────
>

------------------------------------------------*-*-*
森石 みどり MORIISHI Midori 
 大阪大学附属図書館 学術情報整備室 電子コンテンツ担当
 TEL: 06-6850-5071 (学内:2061) / FAX: 06-6850-5052
 E-mail:moriishi @ xxxxxxxxxxxxxxxxxxxxx

 
 


──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
 2011年8月号を発行しました!

DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/ 
─────★─────────────────────