[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:1748] DSpace1.6.0



杉山@静岡大です。
静岡大のリポジトリをDSpace1.6.0にバージョンアップしました。

1.6.0マニュアルの Preface には、主な新機能として次の8点があげられて
いますので、これに沿って実際のところを報告します。

・SOLR Statistics
・Authority Control
・Embargos
・Dspace Command Launcher
・OpenSearch
・Batch Metadata Editing
・Configurable OAI-PMH Dublin Core Ouput
・Delegated Administration

以下、やや長文です。



◆SOLR Statistics
 Solrという検索エンジンを使ったアクセス統計です。アイテムページの「アク
セス統計」ボタンをクリックすると、ほぼリアルタイムに近い状況で統計表示し
ます。アクセス元IPアドレスの国名や都市名の解決には、GeoLite City
 ( http://www.maxmind.com/app/geolitecity )というフリーのデータベースを
使用しています。国名はかなり信頼できそうですが、日本の都市名解決は、まだ
まだのようです。なので、都市名については表示しないようにしようかとも思い
ます。
 設定ファイルでロボット排除のfilterが2種類用意されています。1つは「isBot」
で、DNS逆引きで「googlebot.com」「crawl.yahoo.net」「search.msn.com」の3
ドメインを排除するという、とても原始的な方法です。もう1つは「spiderIp」
で、排除するIPアドレスリストを指定するものです。初期値で、
「http://iplists.com/」が提供するリストが指定されています。ですが、今回
は両方とも使用しませんでした。filterをかけるなら標準化した方法を用いたい
からです。これからCOUNTER準拠あたりを考えていくのかなと思います。

 ところで、過去ログを取り込む際は、サムネイルのログが凶悪なほど大量で、
これが邪魔で苦労しました。Solrをどう扱うかも含めて、江別の鈴木さんに助け
ていただきました。



◆Authority Control
 メタデータの典拠機能です。デフォルトでは、著者についてOCLCの「Library
 of Congress Name Authority File」、出版者と掲載誌について SHERPA/RoMEO
の API が使えるようになっています。LCの著者名典拠を使っても日本の研究者
の大半は解決しませんので、原則として科研のIDを使うようにしています。表記
形が日本語でも英語でもIDが同一ならばすべて同じ著者として認識されます。
 また典拠された著者名は典拠形(この場合、研究者リゾルバーの著者名)にはせ
ず、論文での表記形から採用しています。もちろん論文での著者名表記がイニシ
アルのみだったりした場合は、分かる範囲でフルネームに変えていますが。
 現在リポジトリ内の著者の件数は、のべ約8,800件ですが、IDで典拠されてい
るのは、原則学内の研究者のみで4,200件あまりです。IDの異なり数は約540件に
なります。
 典拠された著者のページはURLが固定されるため、このページをカスタマイズ
していけば、如何ようにも Author's Pageを作っていくことができます。これま
でも信州大さんのプログラムを使って著者に科研IDを付けていましたが、新バー
ジョンに乗り換えたことでURLが変わったため、旧URLにアクセスした場合は新URL
へのリンクを表示するようにしました。



◆Embargos
 指定した日付まで、または無期限に本文ファイルを見せないようにする機能で
す。登録時にliftdateを指定すると、その日になるまで一般ユーザはファイルが
見られない状態で登録されます。cronを設定しておけば、その日が訪れると、ア
クセスできるようになります。なおこのcron実行のときアイテムの datestamp
も更新されます。
 ですが、この機能は、少なくともこのままでは使うべきではないでしょう。
Embargoがかかっていてもアイテムページでは、本文ファイル名が表示されてし
まいます。利用者はそこをクリックするとログイン画面が表示されて、「??」
という状況になり、まるで利用者のストレスを増大させることを目的としている
かの仕様です。
 さらに大きな問題はjunii2との関係です。embargo期間中であるかどうかをjunii2
のcrosswalkで面倒みてあげないと、本文が見られない状況であるにも関わらず、
<fullTextURL>が出力されてしまう、つまり「本文あり」としてハーベストされ
てしまいます。これは、JAIROやCiNiiにも迷惑をかけることになります。
 個人的には、本文が見らない場合、一般ユーザからは本文もメタデータも完全
に隠匿する(もしくはリポジトリ以外のシステムを使う)ほうがよいと思います。
そうしないと、リポジトリがメタデータ・データベースのようになってしまいます。



◆Dspace Command Launcher
 これはシステム管理の話です。
 DSpaceを動かしていると、定期・不定期で実行するコマンドがあります。これ
まで、それらはバラバラで冗長なものが多かったのですが、今度できた
 [dspace160]/bin/dspace というファイルで全部やってしまおうというものです。
このコマンドのオプションは、[dspace160]/config/launcher.xml に設定されて
います。例えば、よく連続して使うコマンドなどを、このlauncher.xmlにオプ
ション名をつけていっしょに書いてあげれば、次回からは dspaceコマンドに、
そのオプションを指定して実行してあげるだけでよくなります。



◆OpenSearch
検索結果を atom や rss フォーマットで返します。
  BASEURL: http://ir.lib.shizuoka.ac.jp/open-search/

有効なパラメータは、次のとおり。
  scope   ... コミュニティやコレクションを指定したい場合、そのハンドル。
              例:scope=10297%2F4
  format  ... atom(1.0) と rss(2.0) で、デフォルトは atom。
  query   ... フリーワード。
  start   ... 検索結果の開始番号。
  rpp     ... ページあたりの検索結果上限。
  sort_by ... ソート項目。ブラウズ等したときのソート項目と同じ。
              デフォルトはスコア順で「0」。
  order   ... ソートの asc(昇順)か desc(降順)。デフォルトは asc。

ソートのデフォルトがスコア順 + 昇順となっていて、関連性の低いものから表
示されてしまう、これはたぶんbugですので、スコア順のときは降順になるよう
修正してあります。
 この機能を使い、OPACとリポジトリの統合検索を作成しました。図書館トップ
ページからも検索できるようにしてあります。
  http://www.lib.shizuoka.ac.jp/  「OPAC+SURE」ボタンをクリック

ただ、リポジトリは全文検索なのですが、OPACのほうは相変わらずのCAT的分か
ち書き検索のため、相性はよくありません。今の時代になって、利用者に分かち
書きを強いるのは受け入れ難いですから、早く図書館システムの更新時期が来る
のを待っています。



◆Batch Metadata Editing
 大量のメタデータを一度に修正したいときの編集機能です。管理者でログイン
して、特定のコレクション・コミュニティ、ブラウズや検索結果一覧、あるいは
1件でも、全件でもよいのですが、指定した範囲のアイテムの「メタデータ エク
スポート」ができるようになっています。出力したファイルを手元でExcelなど
を使って編集し更新したら、「メタデータ インポート」でDSpaceに戻してあげ
ると、編集した箇所が一括で更新されます。
 詳細なイメージはこちら↓が分かりやすいです。
  http://oldwiki.dspace.org/static_files/a/ac/Batchmetadata.pdf

 これは、NII-ELSで「データ出力」→「Excelで編集」→「一括登録」とやれば
目次情報を一括編集できる機能によく似ています。例えば、新たなメタデータの
項目を定義して、そこにデータを埋めたいときや、著者の表記形と異表記形とを
1つの項目を繰り返し使って入力してしまっていたのを、別々の項目に分けたい
ときなど、いざというとき役立つツールであると思います。



◆Configurable OAI-PMH Dublin Core Ouput
 これが、どの機能を特定しているのかよく分からないのですが、たぶんoai_dc
の出力項目が設定ファイルで変更できるようになった件ではないかと思います。
昨年drfMLのこれ↓
  http://drf.lib.hokudai.ac.jp/drfml/msg01230.html

これまでは、プログラムに書いてあげないと見せたくないデータや、みっともな
いデータが勝手にoai_dcに垂れ流しでハーベストされてしまう事態が起こってい
ましたが、それが防げます。

 これとは別に、設定ファイルに「Hide Item Metadata Fields」という項目が
出来ています。例えば、登録履歴などが自動的記録される「dc.description.provenance」
というメータデータがあるのですが、これは利用者に見せるべきデータではあり
ませんので、
  metadata.hide.dc.description.provenance = true
としてあげれば、アイテムの詳細画面にもoai_dcにも出力されなくなります。管
理者のみが使っていて、他の人から見られると困る項目というのは、結構どのリ
ポジトリも持っているのではないでしょうか。そういった項目をここに設定して
あげれば情報漏えいを防ぐ安全弁にもなります。



◆Delegated Administration
 ログインユーザにコミュニティやコレクション、アイテムごとの管理者権限を
付与したとき、それらの権限の範囲を設定ファイルで選べるようになっています。
コミュニティ管理者を設定した場合は、コミュニティ内のサブコミュニティやコ
レクションを作成できる/できない・削除できる/できない、アイテム作成をでき
る/できない・削除できる/できない、などのいろいろな設定が可能です。
 これは、複数機関でひとつのDSpaceを運用している場合や、大規模機関やキャ
ンパスが分かれている機関などで、コミュニティやコレクションごとに管理者を
置きたい場合に使用できます。運用形態に応じて、付与できる権限を選べるのが
ポイントのようです。



DSpace1.6.xの開発が終わると、次はいよいよバージョン2.0ですね。


-- 
----------------------------------------
杉山 智章 (SUGIYAMA Tomoaki)    /~\
静岡大学附属図書館 学術情報部
図書館チーム スタッフ
422-8529静岡市駿河区大谷836
phone:054-238-4477 fax:054-238-5408
--
DRF mailing list
DRF @ xxxxxxxxxxxxxxxx
https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf