[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:1616] Re: AWStats の設定と XooNIps のログ( Re: Re: 国立国会図書館によるインターネット資料の収集について)
- Date: Sat, 13 Feb 2010 12:24:26 +0900
磯野様
土屋先生
東北大学附属図書館の加藤です。
COUNTERについて言及がありましたので、論文単位の利用統計の標準化を目指す
英国のJISC(合同情報システム委員会)のプロジェクトであるPIRUSについて触
れたいと思います。
COUNTERは雑誌論文を対象とするアイテムレベルに対する標準の拡張を行って
います。PIRUS(Publisher and Institutional Repository Usage Statistics)
プロジェクトは、出版社とリポジトリコミュニティを統合し、両環境で適用可
能なアイテムレベルの利用統計を記録する共通規格を策定しようとするもので
す。
2008年8月から12月まで行われたPIRUSでは、出版社とリポジトリコミュニティ
を統合し、両環境で適用可能なアイテムレベルの利用統計の取得についての技
術的可能性を調査。確認しました。
2009年10月から2010年12月まで行われているPIRUS2は、以下の目的を持ち、
MIMAS、Cranfield University、COUNTER、Oxford University Press、
CrossRef、Southampton Universityおよび他の機関リポジトリが参加しています。
・出版社、アグリゲータ、機関リポジトリ、分野別リポジトリの個々のアイテム
を収録するCOUNTER準拠利用データ及びレポートの作成と共有を支援する、一連
の無料のオープンソースプログラムを開発すること。
・プロトタイプの論文レベルの利用統計サービスを開発すること。
・出版社及びリポジトリが、内部用あるいは公開用に作成可能な、標準利用統計
レポートのコアセットを定義すること。
・あらゆる中央クリアリング・ハウスの費用と同様に、必要となる利用レポート
の作成にかかる出版社とリポジトリの費用を査定すること。また、これらのコ
ストを利害関係者にどのように配分するかを調査すること。
cf. PIRUSのウェブサイト
http://www.cranfieldlibrary.cranfield.ac.uk/pirus2/tiki-index.php?page=About
なお、JISC利用統計レビュー(2008年9月)ではAWStatsを次のように評価してい
ます(p.5)。これは、リポジトリのログファイルに使用する基本スキームの策定と、
研究論文や科学リソースなどの電子文書のための有意義で比較可能なアイテムレベ
ルの利用統計を提供するログファイル収集用の標準の提供を目的するJISC1利用統計
レビュー・プロジェクトの報告書に当たります。
オープンソースのログ分析ソフトウェアAWStats16は、リポジトリの世界で広く
使用されている。同一IPアドレスによる1時間以内のマルチクリックは除外され
る。クリックストリームは記録されず、各自のリポジトリの統計だけが利用でき
る。人以外のアクセスはAWStatsが持つロボットリストを使って除外される。こ
のリストはIRStatsやBESTでも使用されているのである種の標準となっているが、
様々なバージョンのリストが出回っているのでベンチマークとしては極めて曖昧
なものである。
cf.JISC利用統計レビュー
http://www.nii.ac.jp/irp/archive/translation/pdf/Usage_Statistics_Review_Final_report.pdf
加藤信哉
2010/02/13 11:10:36 +0900にSyun Tutiya <tutiya @ xxxxxxxxxxxxxxxxxxxxx>さんに頂いた
「[drf:1614] Re:AWStatsの設定とXooNIpsのログ(Re: Re: 国立国会図書館によるインターネット資料の収集について)」への返事で
す。
>磯野さん、
>
>> XooNIpsのログに関しましては、ローカルではAwstats+googl analytics
>> で大体のものを確認し、XooNIps本体内のアイテム別のアクセス&ダウン
>> ロード数で調査は可能です。
>
>もちろんです。それくらいできなければ、コンテンツ管理をしているとはいえ
>ませんから。昔のanonymous ftpサーバでもそれくらいはできました。
>
>> 今回のやり取りに関しましては、ROATの方針がわかっていなかったのが
>> 私の過ちといえば過ちの一つでして、ローカルでのログ解析に関しては
>> 何の問題もない、と宣伝して過言ではありません。
>
>さて、そうでしょうか。ROATの発想の背景のひとつに、COUNTERの存在がありま
>す。これは、主としてライセンスによって利用する電子ジャーナルの「利用」
>統計を標準化するためのコンソーシアムです。雑誌価格の設定の公平性、透明
>性を問題にするときには、どの機関がどの雑誌をどの程度利用しているのかに
>ついて、提供側と購読側が共有し、提供側同士で合意できる測定基準が必要で
>す。しかし、提供方法がHTTP GETによるものであるので、たとえば、HTTPのス
>テータスコードのどれを数えるのか(たとえば、206をどうするか)、同じIPから
>きわめて短時間に来たGETコマンドにたいする200をどうするか(つまり、ネット
>ワークが遅いのでダウンロードが始まらず、すぐにまたクリックをしてしたが、
>どちらもちゃんとファイルを送り終えたような場合)などについての合意はあり
>ませんでした。これをなんとかしようとしたのがCOUNTERです。しかし、機関リ
>ポジトリは、タイトルという概念を構造化の原理としてもたないので、すこし
>前のCOUNTERの規格であるタイトル単位の情報提供という考え方を採用すること
>はできません。また、近年は、たくさんのクローラが跳梁跋扈してわけですが、
>ここからのファイル要求を満たすことは、「ダウンロードされて利用された」
>ということなるのでしょうか。これらの疑問に解答し、かつ、解答するだけで
>なく具体的な測定を行ない、その解答の考え方の妥当性をコミュニティとして
>検証することがROATの目的でした。ローカルでのログ解析が、これらの比較可
>能性を満たすためには、いずれにせよ、なんらかの標準が必要なわけです(「な
>んでうちのダウンロードはこんなに少ないの?」に対して「独自の基準でカウン
>トしています」というような返事では、誰も説得できません)。
>
>> ただ、ROATのようなもので、標準、と謳うようなものが今後も作られる
>> のであれば、今のXooNIpsのログもカウントできるようにはしていただき
>> たいなあ、とは考えています。
>
>標準化活動は、本質的にコミュニティ活動です。普通は、同業者団体が行なう
>ものです。日本の場合には、なんとなく経産省とか工業技術院とかというのが
>介在しているので「お上」っぽくなっているところがありますが、本来的な役
>割を忘れてはいけません。もちろん、「お一人様」リポジトリの運営者にとっ
>てこれは荷が重いことはわかりますが、入江さんのような方もいらっしゃるの
>ですから、まあ、みんなでちょっとずつ時間を出しあってやっていくしかない
>のではないでしょうか。
>
>土屋
>─―────────────────────────────
> ↓↓DRFイベント続々開催!詳細&参加申込はWebで↓↓
> http://drf.lib.hokudai.ac.jp
> ◆DRF-KanNihonkai 2月17、18日@金大
> ◆DRF-Tosa 2月19日@高知工科大
>―─────────────────────────────
>DRF mailing list
>DRF @ xxxxxxxxxxxxxxxx
>https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>
─―────────────────────────────
↓↓DRFイベント続々開催!詳細&参加申込はWebで↓↓
http://drf.lib.hokudai.ac.jp
◆DRF-KanNihonkai 2月17、18日@金大
◆DRF-Tosa 2月19日@高知工科大
―─────────────────────────────
DRF mailing list
DRF @ xxxxxxxxxxxxxxxx
https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf