[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:3983] Re: DSpaceでのデータ一括登録機能について



室蘭工業大学附属図書館 野中です。

三隅さんが作られたツール、まだ試していませんがいろいろ細かな設定もでき
便利そうですね!

少し本筋とは離れるかもしれませんが、wiki中の以下の記述、

------------------------------------
もっと簡単なものはないの?

・以下のプログラムでは、Excelの列名にメタデータを書くことで(dc.title
   など)、Simple Archive Formatを作ってくれるようです。(未検証)
・cf. Simple Archive Format Packager
https://wiki.duraspace.org/display/DSPACE/Simple+Archive+Format+Packager
------------------------------------

この紹介されている「Simple Archive Format Packager」ですが、以前使用し
たことがあるのと、その際つまづいた部分があったのでご報告しておきます。


(以下自分の作業メモより)
------------------------------------
「Simple Archive Format Packager」の使用記録

メタデータと本文ファイルを一括投入すべく、「Simple Archive Format 
Packager」を使ってみる。
ただし、
https://wiki.duraspace.org/display/DSPACE/Simple+Archive+Format+Packager
のとおりにやってみたが、日本語が文字化けする。(ファイル文字エンコーデ
ィングはUTF-8)
ちょっとよくわからないがググって似たような事例を探してよくわからないま
ま以下の部分を変更。

inputCSV = new CsvReader(absoluteFileName);
 ↓↓↓
inputCSV = new CsvReader(new InputStreamReader(new FileInputStream(absoluteFileName),"UTF-8"));

再コンパイルして実行したら文字化けせず成功。
------------------------------------

以上ご参考まで。



28 Jan 2014 17:05 misumi @ xxxxxxxxxxxxxxxxx wrote:
> 北大 三隅です。
> 
> 少し前に話に出ていた、DSpace でのデータとPDFの一括登録について、
> 北大で運用している取り込み用プログラムを DRF wiki で公開しました。
> http://drf.lib.hokudai.ac.jp/drf/index.php?tech%2Ftool%2Fsaf_packager
> 
> 堀越さんの、
> > メタデータのファイル(xml)とPDF等の本文ファイルおよび本文等の
> > ファイルのテキストリスト(contents)をアイテム1件ごとに1フォルダに
> > 格納しておいて、コマンドラインでインポートする、というものです。
> >
> > 「Importing and Exporting Items via Simple Archive Format」
> >>
> https://wiki.duraspace.org/display/DSDOC3x/Importing+and+Exporting+Items+via+Simple+Archive+Format
> 
> これを実行するために必要な、「メタデータのファイル(xml)と
> PDF等の本文ファイルおよび(略)格納」した形式を、
> Excelを元にしたメタデータTSVファイルから作成することができます。
> 
> 次のような手順です。
>  Excel
>  ↓ エクスポート
>  TSV(と、必要であればPDF)
>  ↓ 本プログラムにかける
>  XMLのファイルを含んだフォルダの形式
>  ↓ インポートコマンド実行
>  DSpace
> 
> 
> 素人プログラミングですので、マニュアルなど分かりにくい部分が
> あるかもしれません。お気づきの点、疑問、使い方などございましたら
> お知らせください。
> 
> (2013/05/08 15:01), Kunie Horikoshi wrote:
> > 堀越です。みなさま大変ご無沙汰しております。
> > 
> > DSpaceの基本的なインポート形式のものであれば、かなり古いバージョン
> > (1.2.x?)のころからあるはずです。軽く3.xのドキュメントを見た感じでは、
> > いまもかわらずある模様。
> > メタデータのファイル(xml)とPDF等の本文ファイルおよび本文等のファイルの
> > テキストリスト(contents)をアイテム1件ごとに1フォルダに格納しておいて、
> > コマンドラインでインポートする、というものです。
> > 
> > 「Importing and Exporting Items via Simple Archive Format」
> >> https://wiki.duraspace.org/display/DSDOC3x/Importing+and+Exporting+Items+via+Simple+Archive+Format
> > 
> > ver. 1.6.x以降であれば、ブラウザの管理画面からCSV形式で
> > メタデータをインポートすることが可能です。
> > ただし、新規インポートは「メタデータのみ」を登録しますので、
> > PDF等の本文ファイルは別途登録する必要があります。
> > 「Batch Metadata Editing」
> >> https://wiki.duraspace.org/display/DSDOC3x/Batch+Metadata+Editing#BatchMetadataEditing-ImportFunction
> > 
> > CSVでのバッチ処理(インポートによるメタデータ修正、新規インポート等)の
> > 画面スライドが以下にありますので参考まで。
> > http://hdl.handle.net/1811/47279
> > 
> > (2013/05/08 9:25), 橋 洋平 wrote:
> >> DRFの皆様
> >> 金沢大学の橋です。
> >> 本年度もよろしくお願いします。今年度の機関リポジトリ関係の課題としては,何といっても博士論文の登録が課題ですので,このMLを通じて質問や情報の交換をさせていただきたいと思っています。
> >>
> >> 早速初歩的な質問なのですが,DSpaceでデータを一括登録する方法について教えてください。博士論文をリポジトリに登録する場合,メタデータとPDFを一括で登録することが多いと思うのですが,DSpaceに一括登録機能は標準で付いているでしょうか?
> >>
> >> 金沢大学では,5年以上前に別途開発した一括登録プログラムを使っているのですが,かなり使いにくいものなので,これを機会にもっと使いやすい一括登録に変更しても良いかなと考えています。
> >>
> >> 一括登録機能についてはどの大学でも使う可能性があると思いますが,各リポジトリごとにカスタマイズをして使う形になるでしょうか。きちんとマニュアル類を調べずに書いているのですが,一括登録について,「これが便利」といった参考になる情報がありましたら教えてください。
> >>
> >> よろしくお願いします。
> >> --
> >> 金沢大学附属図書館 情報企画課副課長
> >> 橋 洋平 〒920-1192 石川県金沢市角間町
> >> e-mail: yhashi @ xxxxxxxxxxxxxxxxxxxx
> >> TEL:076-264-5217, FAX: 076-234-4050
> >> ──────────────────☆────────
> >> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
> >>  2013年5月号(40号)を発行しました!
> >>
> >> DRF(Digital Repository Federation)
> >> http://drf.lib.hokudai.ac.jp/drf/
> >> ─────★─────────────────────
> >>
> >>
> > 
> > 
> 
> -- 
> 北海道大学附属図書館学術システム課システム管理担当
> 三隅健一
> Tel. 011-706-4025 / Mail js @ xxxxxxxxxxxxxxxxx
> eprints.lib.hokudai.ac.jp
> ──────────────────☆────────
> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
>  2013年1月号(48号)を発行しました!
> 
> DRF(Digital Repository Federation)
> http://drf.lib.hokudai.ac.jp/drf/
> ─────★─────────────────────


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
室蘭工業大学附属図書館 学術情報ユニット

Mail
   nonaka @ xxxxxxxxxxxxxxxxxxxx
TEL
   0143-46-5191
                 野中雄司
 
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
 2013年1月号(48号)を発行しました!

DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/
─────★─────────────────────