[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:737] Re: [drf:736] Google、スキャン文書も検索対象に【補足】



DRFメーリングリストの皆さま

  国立情報学研究所学術コンテンツ課の杉田です。
 
 先ほどお知らせした件,言葉足らずでしたので,補足いたします。
 大変失礼いたしました。

>  NIIが電子化した本文PDF(紀要・学協会誌)は,画像PDFであるため
>  本文の検索ができないことが課題でしたが,少なくともGoogleからは
>  検索が可能になるようです。

 NIIのELSにある本文PDFは,Googleのクロール対象にはしておりません
 ので,それがスキャンされて検索対象になることはありません。

 NIIのELSの本文を各大学のIRに入れた場合に,各IRに搭載されている
 本文がGoogleからクロールされれば,スキャンされて検索対象になる
 可能性があります。

 以上,補足いたします。
 どうぞよろしくお願いいたします。
 

Izumi SUGITA さんは書きました:
> DRFメーリングリストの皆さま
> 
>   国立情報学研究所学術コンテンツ課の杉田です。
>  いつも大変お世話になっております。
> 
>  Googleが,紙の文書をスキャンしてPDF化したものも,OCRを使って
>  内容を読み取ることで検索可能になったと発表しています。
> 
>  http://markezine.jp/article/detail/5822
> 
>  NIIが電子化した本文PDF(紀要・学協会誌)は,画像PDFであるため
>  本文の検索ができないことが課題でしたが,少なくともGoogleからは
>  検索が可能になるようです。
>   
> 
> -----------------------------------------------------------------
> 国立情報学研究所 学術基盤推進部 学術コンテンツ課 図書館連携チーム
> (機関リポジトリ担当)杉田いづみ
> 
> 〒101-8430 東京都千代田区一ツ橋2−1−2
> Tel: 03-4212-2350,Fax: 03-4212-2375
> E-mail: izumi @ xxxxxxxxx,Web: http://www.nii.ac.jp/irp/
> 
> -------------------第10回図書館総合展----------------------------
> フォーラム「学術コンテンツサービスの成長点」(11/26)開催!
> 奮ってご参加ください。
> http://www.nii.ac.jp/library_fair/2008/img/leaflet.pdf 
> http://www.nii.ac.jp/library_fair/2008/index-j.shtml
> 
> 


-- 
-----------------------------------------------------------------
国立情報学研究所 学術基盤推進部 学術コンテンツ課 図書館連携チーム
(機関リポジトリ担当)杉田いづみ

〒101-8430 東京都千代田区一ツ橋2−1−2
Tel: 03-4212-2350,Fax: 03-4212-2375
E-mail: izumi @ xxxxxxxxx,Web: http://www.nii.ac.jp/irp/

-------------------第10回図書館総合展----------------------------
フォーラム「学術コンテンツサービスの成長点」(11/26)開催!
奮ってご参加ください。
http://www.nii.ac.jp/library_fair/2008/img/leaflet.pdf 
http://www.nii.ac.jp/library_fair/2008/index-j.shtml