[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[drf:1877] Re: Google の検索結果について



永井さま
みなさま

北大 鈴木です。

江別の鈴木氏からのメールを代理投稿します。
これでうまくいくといいですね。

--- koko-kara --------------------------

>> 現在メタデータページのタイトルは「Hyokyo Repository: Item 10132/2499」
>> となっていますが、これはクローラにも一般ユーザにもほとんど無意味です。

>そうなんです。ダサいでしょ、これ。
>うちのheader-default.jspもちゃんと、<title><%= siteName %>: <%=
>title %></title>になっており、以前までは論文タイトルを冠したペー
>ジがヒットしていたんです。

ここのtitleにアイテムのタイトルが入るようになったのはDSpace 1.4.1からです。
しかし、修正は簡単です。TOMCATをTomcatのインストールディレクトリとすると

TOMCAT/webapps/dspace/display-item.jsp の2箇所を変更します。


(1) 67行目(若干違うかもしれません)から次のような行があると思いますので、

<%@ page import="org.dspace.content.Item" %>
<%@ page import="org.dspace.core.ConfigurationManager" %>

この前に次の1行を追加します。

<%@ page import="org.dspace.content.DCValue" %>

(2) 91行目(若干違うかもしれません)から次のような行があると思いますので

   // Full title needs to be put into a string to use as tag argument
   String title = "";
   if (handle != null)
   {
       title = "Item " + handle;
   }
   else
   {
       title = "Workspace Item";
   }

次のように変更します。

   // Full title needs to be put into a string to use as tag argument
   String title = "";
   if (handle == null)
   {
       title = "Workspace Item";
   }
   else
   {
       DCValue[] titleValue = item.getDC("title", null, Item.ANY);
       if (titleValue.length != 0)
       {
           title = titleValue[0].value;
       }
       else
       {
           title = "Item " + handle;
       }
   }

JSPは変更すると直ちに反映されますので、Tomcatのリスタートは必要ありません。
うまくいったらこのファイルを次のようにDSpaceのソースコートがあるディレクトリ
(DSPACE_SRCとします)にコピーしてください。これをしないと別件でDSpaceを
更新した際に、今回の変更が消えてしまいます。

cp TOMCAT/webapps/dspace/display-item.jsp DSPACE_SRC/jsp/local


sitemapの追加やDSpaceのバージョンアップもやってみればそれほど
難しいことはないですが、問題が生じた場合にすぐに相談できる体制にないと
本番サーバーに実施するのはためらわれると思います。このあたりDRFの技術
WGあたりで対応されたらと思います。

--- koko-made --------------------------




2010年6月25日18:30 Kazuki Nagai <knagai @ xxxxxxxxxxxxx>:
>
> 北大 野中さま、三重大 西さま
>
> 早急なご回答ありがとうございます。
>
> 野中さま:
>>アイテムページもビットストリームもその配下にいるので、これが原因
>>ではないような気もしますが、う〜ん、わからないですね…
>
> 北大さんもドメイン/dspaceで登録して問題ないようですので、関係ない
> のかもしれないですねえ。
>
> 西さま:
>> むしろ今回の作業によりPDFがヒットしやすくなったのだと思います。
>> まったく気に病む必要はないと思いますよ。
>
> ところが、なんです。先のメールでは書きませんでしたが、検索結果が
> 変容した直後の23日にテストアイテムを登録したんですが、現時点で
> Googleにひっかかってこないのです、悲しいことに。
> 三日も経てば、一回くらい巡回に来るような気がするんですが・・・
>
> テストアイテム
> http://hdl.handle.net/10132/3389
> (ご面倒でなければ、「可視性に関するテスト兵庫教育」でググってくだ
> さいませ)
>
>> 現在メタデータページのタイトルは「Hyokyo Repository: Item 10132/2499」
>> となっていますが、これはクローラにも一般ユーザにもほとんど無意味です。
>
> そうなんです。ダサいでしょ、これ。
> うちのheader-default.jspもちゃんと、<title><%= siteName %>: <%=
> title %></title>になっており、以前までは論文タイトルを冠したペー
> ジがヒットしていたんです。
>
> で、対応策として、サイトマップを作ろうかと思うんですが、うちのは1.
> 3.2なので、トウシロの私には作成が困難ということで二の足を踏んでい
> ます。
>
> http://drf.lib.hokudai.ac.jp/drf/index.php?tech%2Fnote%2FDSpace%
> 2FGoogle%20Sitemap
>
> ちなみに1.5以降は最初からhtmlmapというファイルがトップページから
> リンクされていて、SEO的にはずいぶん向上しているようですので、1.5
> にバージョンアップしたいですが、そんなお金がありません。
>
> トップページのニュースで、「なんとGoogleから検索できなくなりまし
> た!」と広報した方がよろしいでしょうか(涙)
>
>
> <4C244512.5020108 @ xxxxxxxxxxxxxx> の、
>   "[drf:1866] Re:Google の検索結果について" において、
>   "NISHI Keisuke <nishi @ xxxxxxxxxxxxxx>"さんは書きました:
>
>> 兵庫教育大学附属図書館
>> 永井様
>>
>> DRF-MLには初めて投稿いたします。
>> 三重大学附属図書館・機関リポジトリ担当の西です。
>> みなさま、よろしくお願いいたします。
>>
>> > Googleウェブマスターツールを活用されているDspaceユーザの方にお尋
>> > ねします。
>>
>> DSpaceでは使用していませんが、私的なサイトでGoogleウェブマスターツールを
>> 使用しています。が、あんまり今回の話には関係なさそうです。
>>
>> ウェブマスターツールでの設定によってGoogleのインデックスが変化した可能性
>> は高いと思いますが、Googleのインデックスをこちら側でコントロールするのは
>> 不可能でしょう。
>>
>> 今回、メタデータのページが上位に出てこなくなったのは、単に、
>> 本文のPDFのほうが検索語によりよくマッチしているとGoogleが判断したためだ
>> と思います(相対的にメタデータのページの順位が下がった)。
>>
>> 「site:repository.hyogo-u.ac.jp/dspace/handle 食堂で鶏を捕まえる」で検索
>> したところ、メタデータのページが最上位に表示されるので、特にメタデータの
>> ページがインデックスから削除されたわけでもないようです。
>>
>> もちろんPDFをクロールさせないようにすることは可能ですが、
>> PDF内のテキストからの検索ができなくなってしまうため、
>> 機関リポジトリの大きな利点を失ってしまいます。
>> (まあこれは論外ですよね)
>>
>> むしろ今回の作業によりPDFがヒットしやすくなったのだと思います。
>> まったく気に病む必要はないと思いますよ。
>>
>> ------------------------------------------------------------------------
>>
>> とはいえ、メタデータのページを見てもらいたい気持ちもわかります。
>>
>> とりあえずすぐに考えられる改善点としては下記の2点でしょうか。
>>
>> ・ページのタイトルに論文タイトルを入れる。
>> 現在メタデータページのタイトルは「Hyokyo Repository: Item 10132/2499」
>> となっていますが、これはクローラにも一般ユーザにもほとんど無意味です。
>>
>> 当大学の機関リポジトリMIUSE(DSpace 1.4.1)では
>> [dspace-source]/jsp/layout/header-default.jsp
>> の<title>あたりを下記のようにしています。
>>
>>   <title><%= siteName %>: <%= title %></title>
>>
>> 論文のタイトルを入れる事で、クローラにも一般ユーザにもその論文に強く関係
>> しているという事がわかるようになっています。
>>
>> ・PDFからメタデータページへのアクセス経路を確保する
>> 現状では、PDFからメタデータページへのアクセス経路がないようです。
>> せっかくhandleも取得しているので、
>> PDFからhandleのURLにアクセスできるようにすべきかと思います。
>>
>> MIUSEではPDFにカバーページを付与し、そこにURLを書いています。
>>
>> 参考:「PDF文書にカバーページを付ける」(江別の鈴木さんのページです)
>> http://www12.ocn.ne.jp/~zuki/Japanization/dspace141/coverpage/coverpage.html
>>
>> どちらも多くのリポジトリでやっていらっしゃる事ですので、
>> 私が説明するのも変かもしれませんが。
>>
>>
>> --
>>  ■───────────────────╋
>>  │ 三重大から論文を世界へ発信 MIUSE
>>  │     http://miuse.mie-u.ac.jp/
>>  ╋──────────────────────╋
>>
>> NISHI Keisuke  西 佳祐
>> 国立大学法人三重大学 学術情報部(附属図書館)
>> 情報図書館チーム 機関リポジトリ担当
>> nishi @ xxxxxxxxxxxxxx
>>
>> 〒514-8507 三重県津市栗真町屋町1577
>> Tel:059-231-9084
>> Fax:059-231-9086
>> --
>> DRF mailing list
>> DRF @ xxxxxxxxxxxxxxxx
>> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>>
>
>
> ---------------------------------
> 兵庫教育大学
> 学術情報課学術情報チーム
> 永 井 一 樹
> TEL:0795-44-2062/FAX:0795-44-2059
> E-MAIL:knagai @ xxxxxxxxxxxxx
> ---------------------------------
> --
> DRF mailing list
> DRF @ xxxxxxxxxxxxxxxx
> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>
--
DRF mailing list
DRF @ xxxxxxxxxxxxxxxx
https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf