[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:3083] Re: オープンアクセスに関する最近の論争
- Date: Mon, 18 Jun 2012 09:00:54 +0900
>>> Wed, 13 Jun 2012 19:21:15 +0900 の刻に
>>> mtkuri @ xxxxxxxxxxxx(Masamitsu Kuriyama) 氏曰く
>
> とかいう文章がありますから、やはり出版社はテキストマイニングを明示的に
> 禁止しているようですね。
情報ありがとうございます。明示的に書いてありますねー。
> よくわからないのですが、テキストマイニングをするにはやはり人手で個別
> に論文をダウンロードなどするなどやってられなくて、機械的に大量にダウ
> ンロードする必要があるのではないでしょうか?
これは、主張したいことによると思うのですが、例えば、ネイティブの英語と
ノンネイティブの英語の違いを、フレーズとかに着目して見つけたい、とかや
りたい場合、やはりある程度の数が必要ですよね。けっきょく、1 本ずつ比較
して、違いがあっても、それはその論文固有の違いで、統計的に説得力を持た
せたいわけなので。
ただ、大量ダウンロードが著作権的に問題になることがありましたね。データ
ベース自体にも著作権が認められると思うので、データベースの中身をねこそ
ぎもっていこうとするのは、個々の論文の著作権というより、DB 全体の著作権
上問題になるかも。
> また、
> Having extracted the data he then wanted to aggregate them, compare
> them, input them into programs, use them to create predictive models,
> and reuse them in a variety of other ways.
> というような文もあります。引き出したデータを様々な形で再利用したい
> ということですよね。
> で、これも教えていただきたいのですが、テキストマイニングを行った結果、
> たとえばあちこちの論文から抜き出してきた文章やデータがまとめられた形で
> 利用者に提示されるといったことがあるのでしょうか?
> もしそうだとしたら、著作権上問題になるような気がします。
マイニングの結果が著作権上問題になることはないのではないでしょうか。こ
こでの「再利用」というのは、論文の形で再利用というわけではなく、論文を
データとして利用することではないかと。
なぜ著作権上問題にならないかというと、マイニングや機械学習、さらには統
計などは、基本的にある程度のデータで共通なパターンや規則等を見つけます。
つまり、見つかったものはある程度の普遍性を持ちます。例えば、自然言語処
理の定型表現抽出などでは、Twitter でよく使われる省略した文章などが見つ
けられるでしょう。しかし、これは特定の人の表現ではなく、多くの人が使っ
ているため、誰かが「それは私特有の表現だ」というは困難でしょう。
#これらの書き手が集まって集団訴訟するかも!?
マイニングには、めずらしいパターンを見つけるものもあり、実際私はそうい
うパターンを見つけようとしています。この場合、見つかった表現は書いた人
固有の表現となることは有りえます。が、これは著作権者は誰か示して使えば
よいだけです。例えば、「夏目漱石の助詞の使い方は特徴的で、その例はこん
なものです」と見せたとしても、十分引用の範疇じゃないでしょうか。
> たとえばあちこちの論文から抜き出してきた文章やデータがまとめられた形
> で利用者に提示されるといったことがあるのでしょうか?
というのを著作権上問題になりそうな形、つまり、著作権者に無断で使うとし
たら、スパムの自動生成が思いつきます。あまり研究とは関係ないのではない
でしょうか。
----
池田 大輔 (准教授)
九州大学大学院 システム情報科学研究院 情報学専攻
〒819-0395 福岡市西区元岡744
Mail: daisuke @ xxxxxxxxxxxxxxxxxx
(旧 daisuke @ xxxxxxxxxxxxxxxx)
Web (Personal): http://www.inf.kyushu-u.ac.jp/Members/daisuke
Web (Lab): http://ikeike.i.kyushu-u.ac.jp/
Twitter: @DaisukeIkeda365
Skype: daisuke.ikeda
Tel: 092-802-3781 (90-3781)
Fax: 092-802-3786
──────────────────☆────────
月刊DRF http://drf.lib.hokudai.ac.jp/gekkandrf/
2012年6月号(29号)を発行しました!
DRF(Digital Repository Federation)
http://drf.lib.hokudai.ac.jp/drf/
─────★─────────────────────