[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:1019] Re: 機関リポジトリ公開時にすべきこと



高橋課長、

北大 杉田です。こんにちは。

「なによふん」と言われるかとびくびくしながら投稿しましたが、このよう
なお返事をいただけてほっとしました:-)

>  あんたとこ、○○してへんやろとか、××どうしてます▽▽
> するとええですよとか、言うてくれませんか、指摘してくれま

>  今週、一括登録やります。今あるデータは削除して入れ直し
> です。私がじゃなくて、業者委託です。私がちまちまやってた

とのことですので、すみませんが、お言葉に甘えて以下遠慮なく、OAIの
Validateでは検出されなそうな部分を中心に気づいたことを挙げます。
本メールは必要があれば業者さんなどにお渡しいただいても結構です。

(みんぱくリポジトリさんをいろいろあげつらうようなことになってしまい
ますが、他の機関の方々もOAI-PMH出力を一度じっくり見てみることをおす
すめします。)



(1)「今あるデータは削除して入れ直し」の方法ですが、みんぱくリポ
ジトリのOAI-PMHの設定は、

 http://ir.minpaku.ac.jp/dspace-oai/request?verb=Identify

で見られる通り、

 <deletedRecord>persistent</deletedRecord>

となっています。これは「わがリポジトリは、レコードを削除したときは、
『ID何番のレコードを削除した』という記録を永遠に残しますよ」という
宣言でありますので、業者さんには、

・削除するレコードは、ほんとに削除するのではなく「deleted」属性の
 データとして残す。

あるいは、

・削除して新たに入れる代わりに、今あるレコードへの上書きで置き換える。

のどちらかの方法をとらねばなりません。

業者さんに、

http://www.nii.ac.jp/irp/archive/translation/oai-pmh2.0/OpenArchivesProtocol.htm#DeletedRecords

を示し、<deletedRecord>設定の意味するところを伝え、含んでもらうとよ
いかと思います。



(2)junii2対応

http://ir.minpaku.ac.jp/dspace/handle/123456789/60

のレコードを、junii2形式でハーベストすると、

http://ir.minpaku.ac.jp/dspace-oai/request?verb=GetRecord&metadataPrefix=junii2&identifier=oai:ir.minpaku.ac.jp:123456789/60

のように見えます。

descriptionメタデータに、

> <description>
> Submitted by dspace sitemaster (minpakuir-admin @ xxxxxxxxxxxxxxxxx) on 2009-03-21T10:10:48Z
> No. of bitstreams: 6
> SER42_000.pdf: 681251 bytes, checksum: 15ba70532361a416aa57d261deadd500 (MD5)
> SER42_001.pdf: 4950383 bytes, checksum: 4ffb1a6eafd29192c3c896b2166f8b59 (MD5)
> SER42_002.pdf: 3232019 bytes, checksum: 5cb58dd8366f7162127ad687e9c024e3 (MD5)
> SER42_003.pdf: 1355622 bytes, checksum: ecafc9a6bf6e1e07e12bec20afd418fb (MD5)
> SER42_004.pdf: 1134148 bytes, checksum: 867b7f9d5c94433678a84fbb28667273 (MD5)
> SER42_005.pdf: 11342145 bytes, checksum: 3b385d0a5a31b9aae488bb09b723ef5c (MD5)
> </description>

というような、DSpace特有の管理メタデータが出力されてしまっています。
これは出ないようにクロスウォークを設定すべきだと思います。

また、

> <URI>http://hdl.handle.net/123456789/60</URI>

という無効なURLがURIとして出力されてしまっています。
正規のハンドルプレフィックスを取得するまでは、こうしたデータは出力
されないよう、クロスウォークを設定しておくのが望ましいです。

(3)oai_dc対応

同じレコードのoai_dc形式出力です。
http://ir.minpaku.ac.jp/dspace-oai/request?verb=GetRecord&metadataPrefix=junii2&identifier=oai:ir.minpaku.ac.jp:123456789/60

> <dc:rights>publisher</dc:rights>

textversionがrightsメタデータとして出力されてきているようで、その
要因は、DSpace内で、textversionがrightsエレメントの修飾子として設
定されていることによると思われます。これはあまり適切ではないと思い
ます。
(textversionはどこにもダムダウンさせようがない情報だと思います。
強いてやるとしたなら「版:XXXXXXX」と自動編集してdescription行きと
かでしょうか。がすみません、ここは全然自信ないので目録屋さんにおま
かせします。)

少なくとも、

 ・クロスウォークで、dc.rights.textversionがrightsとして出力され
  ないように設定する。

さらに言えば、

 ・DSpaceのメタデータ設定中、textversionの親要素がrightsである状態
  を解除する。

のがよいかと思います。


> <dc:date>2009-03-21T10:10:58Z</dc:date>
> <dc:date>2009-03-21T10:10:58Z</dc:date>

これはdc.date.accessionedとdc.date.availableをもとに出力されてい
るようですが、どちらかというとDSpaceの内部管理情報に近いものであ
りますので、dc.date.issuedからの、

> <dc:date>2003-10-25</dc:date>

だけが出力されるほうが美しいと思います。これもクロスウォークの設
定次第です。

#と書いていたら、うちのIRもdc.date.accessionedとdc.date.available
#が出てしまってました。直そっと。

> <dc:identifier>42</dc:identifier>

さきのtextversionの件と似て、volumeがidentifierの修飾子として表現
されているために出てきているものですが、巻を“識別子(identifier)”
と呼ぶのは無理があると思います。これも、クロスウォークで、
dc.identifier.volumeをidentifierとして出力しないよう設定すべきで
ないかと思います。



以上、ぱっとみであーだこーだ言ってすみません。適宜取捨ください。




> 杉田さん、こんにちは高橋です。
> 
> 注意:ちょっと長いです。
> 
>  ありがたいです。とってもありがたいです。そういうことを
> 知らないんですよ、私は。だから、注意喚起していただけるの
> が何より嬉しいし、ありがたいです。それでこそ、ここに投稿
> する意味があるって思いますね。
> 
>  一部の方はご存じのように、私、前任の大学図書館ではリポ
> ジトリの統括担当でしたし、あちこちに顔を出してはいっちょ
> 前の発言もしてました。だけど、現場仕事をほとんど知らない
> のです。用語も突っ込まれると危ないような有様で、いやほん
> まに。勉強不足やないかと言われたら、素直に認めますが、所
> 管事項っていいますか、所掌事務っていいますか、それが多い
> 職務だったこともあり、リポジトリはその一部なわけですよ。
> 業務比重ってのも考えないといけないし。で、当然、部下任せ。
> もちろん、出張って行かないかんところに担当と一緒に行くと
> か、なんちゃら会議やとかには出ますし開きますけど、立場上、
> 実際どういう仕組みですかと聞かれることはまず無いし、知ら
> なくてOKだったりするわけです。ま、教員も聞きませんけど。
> 
>  部下が走り回って構築してくれて、ハンコくださいとか了解
> しといてくださいとか言いに来て、ええよ、はいはいと。上司
> や教員から「進行が遅い」とか「どないなってんねん」と言わ
> れたらタテになると、そういう役割ですね。
> 
>  ここ、現場担当者になる得る人が居ないんです。で、勢い自
> 分が走るんです。こんな私でもまだマシな方だし、業者さんも
> 何社か知ってるし、口数多いし...知りもしないのに(苦笑)
> 
>  幸い、システムは、お隣の情報システム課に任せられるので、
> かなり楽です。そこんとこ私は調整役。
> 
>  いやもう、そんなん言い訳やであんた、と言われたらそれは
> それで認めます。知らない理由をあーだこーだ言ってるんです
> からね。これってひょっとしたら、ものすごい恥さらしだとは
> 思うけれど、知らないんだから、もっと極端に言うと「自分が
> 何を知らないか知らない」んです。
> 
>  だから、杉田さんのように言ってくれる人を求めてます。
> 
>  あんたとこ、○○してへんやろとか、××どうしてます▽▽
> するとええですよとか、言うてくれませんか、指摘してくれま
> せんか。うちだけかもしれませんけど、ほんまにベースになる
> ところをわかってないという自覚と自信はあります。それと、
> 爺ぃですからね私、頭、固なってます。なかなか沁み込みませ
> ん、入ってきません。本読んでも「うーん」唸ります。
> 
>  うちがシステム構築を依頼した業者さんには、小学生にでも
> わかるように言うてください、と先日お願いしました。「フィ
> ラデルフィア」の弁護士ジョー・ミラーじゃないですけどね。
> 多分業者さん本気にしてないでしょうねぇ...本気やぞ。
> 
>  OAI-PMHのデータ提供もどうやったらええんやろ、ま、もう
> 少し後で、試験公開やし、件数ごっつ少ないしと考えてました。
> 杉田さんの投稿で、ちょい気が楽になりました。実際のところ
> はよくわかってませんが、なるほどと腑に落ちたところはある
> ので。
> 
>  DRFの投稿、正直小難しい話ばっかでわかんないこと多いん
> ですよ実際。用語も単語も略語も含めて、何言ってるのかなと
> 思うこと日常茶飯事です。そのうち分かるようになるんだろな、
> と思いつつ読んでます。みんなよぉついてってるなぁ、歳とっ
> たなぁ俺と思いながら。
> 
>  今週、一括登録やります。今あるデータは削除して入れ直し
> です。私がじゃなくて、業者委託です。私がちまちまやってた
> ら、委員長が「そんなんあかんて。お金取ってくるし外注し」
> と見るに見かねて突っ込んでくれました。
>  登録後の、許諾が取れているものを公開にってのは私がしま
> す。デフォルト非公開なので。ほんまに千里の道です。
> 
>  あたたかく見守ってくれとは言いません。気がついたことが
> あったら指摘してください。他力本願ですけど、わかってない
> ので。
> 
>  ええ加減にせぇ甘えるな、と叱ってくれるのも歓迎です。
> 
>  今後ともよろしくお願いします。
> 


-- 
杉田茂樹 <sugita @ xxxxxxxxxxxxxxxxx>
北海道大学附属図書館学術システム課システム管理担当
電話番号:011-706-2524,ファクシミリ:011-706-4099
http://eprints.lib.hokudai.ac.jp