[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:3073] Re: オープンアクセスに関する最近の論争



池田先生、
ちょっと
http://poynder.blogspot.co.uk/2012/06/new-declaration-of-rights-open-content.html
とか
http://poynder.blogspot.co.uk/2008/01/open-access-interviews-peter-murray.html
あたりを読んだだけなのですが、
traditional subscription publishers like the American Chemical Society
and Wiley explicitly forbid text mining of papers they publish.
とかいう文章がありますから、やはり出版社はテキストマイニングを明示的に
禁止しているようですね。
もちろん個々にダウンロードした論文をプログラムにかけたとしても出版社側
には防ぎようがないし、それで訴えることができるかどうか疑問ですが、
とりあえず一括ダウンロードを禁止して発見したら警告を発したりすることは
やってますよね。
よくわからないのですが、テキストマイニングをするにはやはり人手で個別に
論文をダウンロードなどするなどやってられなくて、機械的に大量にダウン
ロードする必要があるのではないでしょうか?
また、
Having extracted the data he then wanted to aggregate them, compare
them, input them into programs, use them to create predictive models,
and reuse them in a variety of other ways.
というような文もあります。引き出したデータを様々な形で再利用したい
ということですよね。
で、これも教えていただきたいのですが、テキストマイニングを行った結果、
たとえばあちこちの論文から抜き出してきた文章やデータがまとめられた形で
利用者に提示されるといったことがあるのでしょうか?
もしそうだとしたら、著作権上問題になるような気がします。

   栗山 正光
   常磐大学人間科学部現代社会学科
   〒310-8585 水戸市見和1-430-1

(2012/06/11 13:43), Daisuke Ikeda wrote:
> 栗山先生、土屋先生
> 
> 人間が読むことができるのであれば、明示的に「マイニング禁止」とか書いて
> ない限り、機械(アルゴリズム)に読ませても問題ないと思っています。ただ、
> ML で「マイニングできないようなのは意味がない」と言っている人もいるのに、
> 何を根拠に「マイニングできない」と思ってるのかよくわからなかったので...
> 
>>>> Sun, 10 Jun 2012 10:58:54 +0900 (JST) の刻に
>>>> mtkuri @ xxxxxxxxxxxx氏曰く
>>
>> よくわからないので誤解しているのかもしれませんが、まとめてダウン
>> ロードできることがテキストマイニングの第一歩なんですよね?
> 
> 機械的にダウンロードできれば、大量にデータが取得できるのでよいですが、
> 機械的なダウンロードを禁止しているのは、マイニングとは関係ないでしょう。
> サーバへの負荷とか、別の観点じゃないでしょうか。
> 
>> で、その後のプログラムによる処理自体は人の目に触れないところで
>> 行われるわけですから著作権上の問題になりようがないと思います。
>> それで、たとえば何らかの傾向が発見できたとかいうことを発表しても
>> 別に元のテキストを再配布したり改変したりするわけではないので、
>> これも問題ありませんよね?
> 
> 私も著作権はまったく関係ないと思います。マイニングとかで問題になるのは、
> 人は読んでもいいけど、機械にはダメだというをよく聞きます。例えば、スパ
> ムの検出のために Google がメールをチェックするのはイヤだ、とかですね。
> 
>>>> Sun, 10 Jun 2012 12:10:05 +0900 (JST) の刻に
>>>> tutiya @ xxxxxxxxxx(Syun Tutiya) 氏曰く
>>
>> ので、このCC-BYでデータマイニング用再利用はカバーされていると考えてよ
>> いのではないでしょうか。
> 
> つまり、マイニングするためには、単に読むという以上の許諾が必要というわ
> けですね。もちろん CC-BY は自由度が高いライセンスなので、マイニングでき
> るというのは納得ですが、CC-BY がなければマイニングできない、ということ
> であれば、かなり制約が厳しそうです。
> #ということを海外 ML の方は憤ってたのかな??
> 
>> Text::Mining::Parser::PubMedCentral - Parse XML documents from PubMed Central
>>
>> なんていうモジュールも公開されていますし、池田さんが何を気にされている
>> のか、、、、
> 
> そうですねー、上に書いたようにマイニングができないと行っている人は何を
> 気にしているのか、気にしています...知らないところで、実はデータが自由に
> 使えない、というのは、特にテキストをよく扱っているものとして気になると
> ころです。
> 
>> によれば、text mining用のサービスも提供されているようですね。これもあ
>> る意味での付加価値。
> 
> pubmed 系の人たちがデータを生成、再利用するのにものすごく労力をはらって
> いるのはすごく感心します。
> 
> 池田
> 
> ──────────────────☆────────
> 月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
>  2012年6月号(29号)を発行しました!
> 
> DRF(Digital Repository Federation)
> http://drf.lib.hokudai.ac.jp/drf/
> ─────★─────────────────────
> 
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
 2012年6月号(29号)を発行しました!

DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/ 
─────★─────────────────────