皆様 お世話になっております。 遅ればせながら、 > 現在各参加者がまとめドキュメントなどを作成中です。後ほど,随時参加メン > バーから取り組んだ課題の内容等をお知らせさせていただく所存です。 ということで、過日DRF5でも紹介しました momiji&momizail を公開いたします。 (DRF5では武内様ほか関係の皆様、色々とありがとうございました。) DRFのページにupしようと思いましたが、Wiki編集経験が皆無のためページを壊 して しまわないかと不安になり断念しました。成果物をこのメールに添付することで 報告 とさせてください。 momijiは以下の処理を行うWebアプリケーションです。 1. 指定したBaseURLやSetに対してハーベストを行い、コンテンツ本体のURLや タイトル、著者の情報を蓄積します。 junii2でハーベスト可能なサイトであればどこでも大丈夫(なはず)です。 2. Apacheのログを投入すると、先にハーベストした情報を基に指定したBaseURL またはSetに該当するログを抽出します。これは特に共同リポジトリにおける 機関ごとのログの取得に有効です。 3. ログ抽出時に、クローラーやロボットによるアクセス、一定時間内の重複ア クセス 任意に指定するIPアドレスからのアクセスによるログを排除します。 (AWstatsのロボットDBを流用しています) 4. 抽出したログにタイトルと著者名を付加することもできます。 momiji例ページ http://harpir.cc.it-hiroshima.ac.jp/momiji/momiji.html 旧式のパソコンでメモリも少ないため遅いですが、使ってみていただいてかまい ません。 momizailは以下のようなスクリプトです。 1. momijiで著者名、タイトル情報を付加した上で抽出したログファイルを元に 著者ごとの集計を行い、結果をMailアドレスのリストに基づいて各著者に一 斉 にメールします。(集計対象のログファイルはSJISである必要があります) 2. 解凍後、そのままWindowsパソコンで実行可能です。ただし、メールサーバ の指定やアドレスファイルの作成等、適切に設定や準備を行う必要がありま す。 注意点: 1. momijiはperlで記述している事もあり、それなりの速度です。メタデータが 多いとハーベストに時間がかかりタイムアウトしますが、裏では処理は続い て いるはずです。(ハーベストはWebアプリとは馴染まないのですが・・・) 2. 抽出処理に時間がかかる場合は、投入するログの量を工夫する必要があると 思います。 3. momijiのプログラム中にGPLの著作物であるAWstatsのモジュールをがあり ますので、momijiのプログラムの扱いも、GPL的に扱ってもらえばよいかと 思います。 4. BaseURL指定用のプルダウンにHARPのものがセットされていますので、適宜 変えてください。 よろしくお願いいたします。 広島工業大学附属図書館 森保信吾 072-921-4193 ----- Original Message ----- > DRFのみなさま > > DRF技術サポートグループ(※1) 野中です。 > > 先週7-10日にかけてNIIの国際高等セミナーハウス(@軽井沢)にて,DRF及び > CSI領域2プロジェクトの「ユーザ・コミュニティ構築による持続可能なシステ > ム改善の枠組の形成」共催で機関リポジトリに関する周辺関連技術の習得と応 > 用をテーマとした技術ワークショップ(技術合宿)を開催しました。 > > 10名の参加者(※2)がそれぞれ以下のような課題に取り組みました。 > > ・これからリポジトリを構築しようとしている,もしくはシステム乗り換え > を検討しようとしている機関のために,主要なIRシステム( > Dspace,Eprints,Weko等)のVMWareイメージ,USBメモリから起動できるイ > メージの作成。 > *配布可能な形式で > *それぞれのソフトで可能なものは,デフォルトに近いバージョン,い > ろいろカスタマイズしたバージョンを用意 > *つまり自機関で簡単にいろいろなIRソフトを試してみることができる > ように。 > ・Dspace最新版(1.5.2)の新機能の確認(SWORD等)や,下位バージョンから > のアップグレードの検証。 > ・ダウンロード回数等の利用記録をより視覚的に著者に見せるための仕組み > の開発(JAWstats統計機能を使用して) > ・共用リポジトリのアクセスログの機関ごとの振り分け(フィルタリング込 > ) > ・著者へのダウンロード回数メール送信(apacheのcombined形式であれば極 > 力汎用的に利用できるような) > ・IRシステムのロードバランサを使った負荷分散 > ・IRに登録したコンテンツの特定URLを指定URLにリダイレクトさせる仕組み > の開発。(IRシステムを引っ越しした場合等のために) > ・CiNii APIを使った、naid指定だけで書誌流用が行える仕組みの開発。 > ・ETD-MS Crosswalk(Dspace) > ・WikiPediaから自機関IRコンテンツにリンクされている記事を探す方法 > ・デジタルコンテンツ内全文も検索できるJAIROもどきの開発。 > ・江別の鈴木さん作成のオンザフライカバーページの適用レポート( > Dspace1.4.2) > > > 現在各参加者がまとめドキュメントなどを作成中です。後ほど,随時参加メン > バーから取り組んだ課題の内容等をお知らせさせていただく所存です。 > > みなさまのご興味を引くものが少しでもあればと参加者一同思っております。 > > (※1)DRF技術サポートグループ > 国内IRコミュニティに技術面から貢献することを目的として,この軽井沢参 > 加メンバーを中心に結成されました。 > これからいろいろこの名前が顔を出させていただくこともあるかと思います > ので今後ともどうぞよろしくお願いいたします。 > <メンバー> > http://drf.lib.hokudai.ac.jp/drf/index.php?About%20Us#seed244c > > (※2)参加者 > 前田信治(大阪大学附属図書館), 野中雄司(北海道大学附属図書館), 堀越邦 > 恵(室蘭工業大学附属図書館), 金藤伴成(筑波大学附属図書館), 高久雅生( > 物質・材料研究機構), 武内八重子(千葉大学附属図書館), 土出郁子(大阪大 > 学附属図書館), 大園隼彦(岡山大学附属図書館), 上田大輔(広島大学図書館 > ), 森保信吾(広島工業大学附属図書館) > > 以上ご報告でした。 > どうぞよろしくお願いいたします。 > > > ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ > 北海道大学附属図書館学術システム課 > システム管理担当 > > Mail > nonaka @ xxxxxxxxxxxxxxxxx > TEL > 011-706-4025 > 野中雄司 > > ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ > > ──────────────────────────────── > 10月19日〜23日はオープンアクセス週間です。 > DRF デジタルリポジトリ連合は学術研究の自由な共有を応援します! > www.openaccessweek.org / www.openaccessweek.jp > ──────────────────────────────── > DRF mailing list > DRF @ xxxxxxxxxxxxxxxx > https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf >
Attachment:
momiji-0.1.tgz
Description: application/gzip-compressed
Attachment:
momizail-0.1.zip
Description: Zip compressed data
─―───────────────────────────── 国際会議開催決定、参加者募集中! http://drfic2009.jp DRFIC2009「オープンアクセスリポジトリの現在と未来 ―世界とアジアへの視点から―」 12月3日(木)〜4日(金)東京工業大学蔵前会館にて ―────────────────────────────── DRF mailing list DRF @ xxxxxxxxxxxxxxxx https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf