[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:3886] 第3回 SparcJapan セミナ雑感
- Date: Mon, 28 Oct 2013 16:08:05 +0900
核融合研の力石です。
先日のSparc Japan セミナに参加しました。
その中で感じた雑感などを。
1 公開(蓄積)するデータのレベル
これは当日も質問させていただきましたが、
「どのレベルのデータ(計測器から出てきたままの生データ?一次加工したもの?論文用のグラフにまとまったもの?)を蓄積公開するか。
研究者としては、多分、人の手の入っていない生データ、もしくは一次加工(下拵え程度)されたデータの需要が多いのではと推測しています。
たとえば、オリジナルの論文では使われなかった生データを再度別の観点から分析評価して新しい価値を見出したり、
同じデータでも第三者が再評価することで、分析の妥当性を確認するには、やはり手の入っていないデータが必要でしょう。
ただし、第三者が利用できるためには、相応の付随情報(そこにあるのがどういうデータかを示すもの)も必要で、それの整備が大変そうです。一番良いのは、生データ、一次加工されたデータ、、、論文に使用したグラフ、というピラミッド構造すべてを公開することでしょうか。
また、取捨選択が行われる前のデータとなるとかなりのデータ量になりそうです。(ちなみに、核融合研のLHD実験では、一次加工されたレベルのデータが現在(といっても、2年くらい前)0.5Pbyte程度あるのだとか。)
さて、図書館を公開データセットの基地とするときには、どのレベルの情報を集積、公開するのが得策か。
2 公開データの位置づけ、評価
データの公開も、論文の公表と同じように評価しよう、ってのは大型プロジェクトの実験装置を担当している研究者にとっては朗報です。なにせ、そういう研究者は装置を開発、設置、運用するのに多大な労力を払っています。従来の論文一本の評価だと、このあたりの労力が必ずしも適正に評価されていません。Aさんが苦労して出したデータを(Aさんが装置の運用に時間を取られているあいだに)Bさんが論文にした、Aさんは自分の出したデータに関わらず、業績につながる論文にできなくなった、なんてことも起きえます。(これを防ぐために、データの使用に一定に制約をかけたりしています。)
データの公開自体が評価の対象になるなら、このあたりの配慮が不要になり、もっとスマートな運用が期待できます。
3 データの循環
当日した質問と関連しますが、データの公開が有効に機能するには、
・自分のデータを第三者が利用し、新しい成果を得る。
・その成果が公開され、自分がそれを利用する。
といった成果の循環があるか、が鍵かと思います。
30年程前でしたか、日本が「情報のブラックホール」(研究情報を取り込むだけで、出さない)と揶揄されたことがあります。こういうのがあると、研究者としてはデータの公開に躊躇するのではないでしょうか。
4 図書館の存在意義
数年前にとある会合で、やはりこれが話題に上りました。
質問された方曰く「今や、インターネットでいろんな情報を直接得ることができる。さて、その場合の図書館の意義とは?」
その時、私がしたコメントは「インターネット上の情報には変質しているもの(取捨選択によって異なる意味合いになったり、ひどい場合には恣意的に編纂されたり)が多い。オリジナルの情報が確実にある場所、として重要な意味を持つはず。」
データの保存、公開拠点としての図書館、はこの「改ざんされていないオリジナル情報の拠点」としての図書館の位置づけ(のひとつ)かな、と感じています。
以上、長くなりましたが、Sparc Japanセミナでの雑感でした。
--
CHIKARAISHI Hirotaka <hchikara @ xxxxxxxxxx>
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
2013年10月号(45号)を発行しました!
DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/
─────★─────────────────────