[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:652] Re: [drf:651] Google は機関リポジトリのコンテンツを半分しかクロールしていない?



加藤@北大図です。

思いつきで反応しますが、単純にSEOの問題ではと。

いいかげんな話をすると(クローラのアルゴリズムが明瞭でないのに
厳密な話ができるはずもないのですが)、
よく検索されたり、よくリンクされたりするものがインデックス
されたり上位に表示されたりするので、リポジトリ搭載論文の
半分ぐらいはそこそこ検索やらリンクがされ、あと半分はほとんど
注目されてないということでしょう。

そもそもGoogleはすべての(=Googleのアルゴリズムに対して多少
なりとも合目的的な)Webページのうち半分より多くインデックス
できてるんですかね?
そんなの計測できるわけないですけども、印象では無理と思いますから、
単純に考えると「大してSEOしてないリポジトリが半分もインデックス
されてるなら結構なことでは?」と思いましたよ。

Googleにうまいことインデックスされる方法は世の中山ほど紹介
されてるので(ただし経験的なもの少なからず)、それをやって
みればよいのでは。


HASHI Yohei さんは書きました:
> DRF-MLの皆様
> 金沢大学の橋です。
> 最近のカレントアウェアネスを眺めていたところ,次のような記事がありました。この記事について,コメントを頂けないでしょうか?
> 
> 「Googleは機関リポジトリのコンテンツを半分しかクロールしていない?」
> http://current.ndl.go.jp/node/8647
> 
> 機関リポジトリの効用をPRする場合,「Googleに引っかかるようになります」ということを皆様の大学でも言われていると思うのですが,この記事のとおりなのでしょうか?大半のアイテムについては引っかかっている気はしていたのですが,実は本学のリポジトリの中にも”何故かGoogleに引っかからないアイテム”があったりするので,「そうかもしれない」という気もしています。
> #IRの設定の方に問題があるのかな,という気もしていたのですが...よく分りません。
> 
> この記事の原典の”Google Still Not Indexing Hidden Web URLs”
> http://www.dlib.org/dlib/july08/hagedorn/07hagedorn.html
> は,きちんと読んでいませんが,リポジトリに登録されている文献を探すには,やはりOAIsterの方が確実と言えるのでしょうか?
> 
> その他,Googleでリポジトリに登録されている文献を検索してみると,Scientific Commons
> http://current.ndl.go.jp/node/8281
> に登録されているものがヒットすることがありますが,この辺の関係についてもご存知の方がありましたら教えて頂けると助かります。
> 
> 
> 橋 洋平 金沢大学情報部情報企画課情報企画係長
> TEL:076-264-5204 FAX:076-234-4050
> e-mail: yhashi @ xxxxxxxxxxxxxxxxxxx http://www.lib.kanazawa-u.ac.jp
> ------------------------------------------------------
> 金沢大学 2008年4月から3学域16学類スタート 
> ------------------------------------------------------
> 
> 
> 

-- 
加藤 大博 :: KATO Hiromichi
mailto:katze @ xxxxxxxxxxxxxxxxx
北海道大学附属図書館 情報管理課 図書受入担当
TEL 011-706-4028 / FAX 011-706-4109