[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:3072] Re: オープンアクセスに関する最近の論争



栗山先生、土屋先生

人間が読むことができるのであれば、明示的に「マイニング禁止」とか書いて
ない限り、機械(アルゴリズム)に読ませても問題ないと思っています。ただ、
ML で「マイニングできないようなのは意味がない」と言っている人もいるのに、
何を根拠に「マイニングできない」と思ってるのかよくわからなかったので...

>>> Sun, 10 Jun 2012 10:58:54 +0900 (JST) の刻に
>>> mtkuri @ xxxxxxxxxxxx氏曰く
> 
> よくわからないので誤解しているのかもしれませんが、まとめてダウン
> ロードできることがテキストマイニングの第一歩なんですよね?

機械的にダウンロードできれば、大量にデータが取得できるのでよいですが、
機械的なダウンロードを禁止しているのは、マイニングとは関係ないでしょう。
サーバへの負荷とか、別の観点じゃないでしょうか。

> で、その後のプログラムによる処理自体は人の目に触れないところで
> 行われるわけですから著作権上の問題になりようがないと思います。
> それで、たとえば何らかの傾向が発見できたとかいうことを発表しても
> 別に元のテキストを再配布したり改変したりするわけではないので、
> これも問題ありませんよね?

私も著作権はまったく関係ないと思います。マイニングとかで問題になるのは、
人は読んでもいいけど、機械にはダメだというをよく聞きます。例えば、スパ
ムの検出のために Google がメールをチェックするのはイヤだ、とかですね。

>>> Sun, 10 Jun 2012 12:10:05 +0900 (JST) の刻に
>>> tutiya @ xxxxxxxxxx(Syun Tutiya) 氏曰く
> 
> ので、このCC-BYでデータマイニング用再利用はカバーされていると考えてよ
> いのではないでしょうか。

つまり、マイニングするためには、単に読むという以上の許諾が必要というわ
けですね。もちろん CC-BY は自由度が高いライセンスなので、マイニングでき
るというのは納得ですが、CC-BY がなければマイニングできない、ということ
であれば、かなり制約が厳しそうです。
#ということを海外 ML の方は憤ってたのかな??

> Text::Mining::Parser::PubMedCentral - Parse XML documents from PubMed Central
> 
> なんていうモジュールも公開されていますし、池田さんが何を気にされている
> のか、、、、

そうですねー、上に書いたようにマイニングができないと行っている人は何を
気にしているのか、気にしています...知らないところで、実はデータが自由に
使えない、というのは、特にテキストをよく扱っているものとして気になると
ころです。

> によれば、text mining用のサービスも提供されているようですね。これもあ
> る意味での付加価値。

pubmed 系の人たちがデータを生成、再利用するのにものすごく労力をはらって
いるのはすごく感心します。

池田

──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
 2012年6月号(29号)を発行しました!

DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/ 
─────★─────────────────────