[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[drf:1991] Re: Metadata
- Date: Fri, 17 Sep 2010 16:16:55 +0900 (JST)
栗山先生、みなさま
お世話になっております。静岡大の杉山(NIIあと14日)です。
識者ではありませんが、私の分かる範囲ではこのmetaタグの件は、
DSpaceのこちらのお話しのことなのかなと思います。
http://jira.dspace.org/jira/browse/DS-396
江別の鈴木さんブログで以前取り上げてくださっているのを
見ています。旧バージョン用パッチ付きです。
http://d.hatena.ne.jp/zuki_ebetsu/20100819/1282213395
DSpace1.6でmetaタグ出力機能が加わったのは気が付いてはいたのですが、
今まで手を付けずにいました。
今回の情報を参考に、静岡大のリポジトリ(DSpace1.6.0)で DC と
Highwire Press タグを「Google Scholar」のガイドラインにそって(?)
出力できるようにしてみました。
http://ir.lib.shizuoka.ac.jp/
アイテムページのソースを見ていただければ分かりますが、
例えば、このような感じになります。
<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
<meta name="DC.title" content="Sphingosinicella microcystinivorans gen. nov.,sp.nov,a microcystin-degrading bacterium" />
<meta name="DC.creator" content="Kato, Kenji" />
<meta name="DC.creator" content="Maruyama, Tomoko" />
<meta name="DC.publisher" content="Society for General Microbiology" />
<meta name="DC.date.issued" content="2006" scheme="DCTERMS.W3CDTF" />
<meta name="DC.citation.issn" content="14665026" />
<meta name="DC.relation.ispartof" content="International Journal of Systematic and Evolutionary Microbiology" />
<meta name="DC.citation.volume" content="56" />
<meta name="DC.citation.spage" content="85" />
<meta name="DC.citation.epage" content="89" />
<meta name="DC.rights" content="(c)2006 International Union of Microbiological Societies" />
<meta name="citation_title" content="Sphingosinicella microcystinivorans gen. nov.,sp.nov,a microcystin-degrading bacterium" />
<meta name="citation_author" content="Kato, Kenji" />
<meta name="citation_author" content="Maruyama, Tomoko" />
<meta name="citation_publisher" content="Society for General Microbiology" />
<meta name="citation_date" content="2006" />
<meta name="citation_issn" content="14665026" />
<meta name="citation_journal_title" content="International Journal of Systematic and Evolutionary Microbiology" />
<meta name="citation_volume" content="56" />
<meta name="citation_firstpage" content="85" />
<meta name="citation_lastpage" content="89" />
DSpace内部の「dc.title」を「DC.title」と「citation_title」というように
2回出力することはデフォルトでは出来ませんので、DC用とHighwire Press タグ用
の2回繰り返してmetaタグに出力させるようコーディングをしました。
当該ファイルは、「xhtml-head-item.properties」と「XHTMLHeadDisseminationCrosswalk.java」です。
それと、問題になるのは、掲載誌情報を誌名、巻、号、開始ページ、終了ページ
に分けて出力させることです。DSpaceのデフォルトでは掲載誌情報を
「identifier.citation」に文字列で全て入力してしまうため、部品に分けること
が大変です。その点、日本のリポジトリのほとんどはjunii2に対応するため、
最初から項目を分けて入力していますので、上記のような出力も正確に出来るように
なっています。
という話題なのかなと思いました。
なお、「Google」と「Google Scholar」のインデクシングは別物と理解しています。
今回のガイドラインは、あくまでも「Google Scholar」のものではないでしょうか。
いずれにしても、Google (Scholar) 相手ということだけでなく、こういう機能を
どんどん実装して、そこからまた新しいサービスが生まれていけば、面白い話しなの
ではないでしょうか。
>皆様
>前のパーマーさんのメールはEUCで送られたみたいですね。
>これで文字化けしないでしょうか?
>
>クロスウォークは必要ないと書いてしまいましたが、同じデータを手作業で三つ
>の形式で入れるのはつらいですよね。
>入力は一度で、それを下のような三種類のタグに自動的に振り分けるプログラム
>が必要ということですかね。
>
> 栗山 正光
> 常磐大学人間科学部現代社会学科
> 〒310-8585 水戸市見和1-430-1
>
>(2010/09/16 16:27), David Palmer wrote:
>> 栗山先生、皆様
>>
>> ご参考のため、下記はHTMLにNPGの使っている三形式のmetaタグです。
>>
>> - david
>>
>> <html lang="en" class="no-javascript">
>> <head>
>> <meta name="generator" content=
>> "HTML Tidy for Windows (vers 12 April 2005), see www.w3.org">
>> <meta charset="utf-8">
>> <title>
>> Monoclonal antibodies isolated without screening by
>> analyzing the variable-gene repertoire of plasma cells :
>> Nature Biotechnology : Nature Publishing Group
>> </title>
>> <script type="text/javascript">
>> <!--//--><![CDATA[//><!--
>> document.getElementsByTagName('html')[0].className = 'js-enabled';
>> //--><!]]>
>> </script>
>> <meta name="robots" content="noarchive">
>> <meta name="keywords" content=" , , ,">
>> <meta name="description" content="Isolation of antigen-specific antibodies or antibody fragments, whether through B-cell immortalization or recombinant libraries, generally requires laborious screening. Reddy et al. circumvent this step using high-throughput sequencing of plasma cells and bioinformatic analysis of the variable-gene repertoire.">
>> <meta name="access" content="Yes">
>> <meta name="DC.date" content="2010-08-29">
>> <meta name="DC.publisher" content="Nature Publishing Group">
>> <meta name="DC.language" content="en">
>> <meta name="DC.title" content="Monoclonal antibodies isolated without screening by analyzing the variable-gene repertoire of plasma cells">
>> <meta name="DC.creator" content="Sai T Reddy">
>> <meta name="DC.creator" content="Xin Ge">
>> <meta name="DC.creator" content="Aleksandr E Miklos">
>> <meta name="DC.creator" content="Randall A Hughes">
>> <meta name="DC.creator" content="Seung Hyun Kang">
>> <meta name="DC.creator" content="Kam Hon Hoi">
>> <meta name="DC.creator" content="Constantine Chrysostomou">
>> <meta name="DC.creator" content="Scott P Hunicke-Smith">
>> <meta name="DC.creator" content="Brent L Iverson">
>> <meta name="DC.creator" content="Philip W Tucker">
>> <meta name="DC.creator" content="Andrew D Ellington">
>> <meta name="DC.creator" content="George Georgiou">
>> <meta name="DC.rights" content="宵、召2010 Nature Publishing Group, a division of Macmillan Publishers Limited. All Rights Reserved.">
>> <meta name="DC.identifier" content="doi:10.1038/nbt.1673">
>> <meta name="prism.issn" content="1087-0156">
>> <meta name="prism.eIssn" content="1546-1696">
>> <meta name="prism.copyright" content="宵、召2010 Nature Publishing Group, a division of Macmillan Publishers Limited. All Rights Reserved.">
>> <meta name="prism.startingPage" content="965">
>> <meta name="prism.publicationName" content="Nature Biotechnology">
>> <meta name="prism.issue" content="9">
>> <meta name="prism.rightsAgent" content="permissions @ xxxxxxxxxx">
>> <meta name="prism.section" content="Research">
>> <meta name="prism.publicationDate" content="2010-08-29">
>> <meta name="prism.volume" content="28">
>> <meta name="prism.endingPage" content="969">
>> <meta name="citation_authors" content="Sai T Reddy; Xin Ge; Aleksandr E Miklos; Randall A Hughes; Seung Hyun Kang; Kam Hon Hoi; Constantine Chrysostomou; Scott P Hunicke-Smith; Brent L Iverson; Philip W Tucker; Andrew D Ellington; George Georgiou">
>> <meta name="citation_journal_title" content="Nature Biotechnology">
>> <meta name="citation_issue" content="9">
>> <meta name="citation_volume" content="28">
>> <meta name="citation_date" content="2010-08-29">
>> <meta name="citation_doi" content="doi:10.1038/nbt.1673">
>> <meta name="citation_title" content="Monoclonal antibodies isolated without screening by analyzing the variable-gene repertoire of plasma cells">
>> <meta name="citation_publisher" content="Nature Publishing Group">
>> <meta name="citation_firstpage" content="965">
>> <meta name="WT.cg_n" content="Nature Biotechnology">
>> <meta name="WT.cg_s" content="Research">
>> <meta name="WT.template" content="C">
>> <link rel="shortcut icon" href="http://www.nature.com/favicon.ico">
>> <link rel="search" href="/search/executeSearch">
>> <link title="Journal home" rel="home" href="/nbt/index.html">
>> <link title="Previous article" rel="prev" href="/nbt/journal/v28/n9/full/nbt.1643.html">
>> <link title="Next article" rel="next" href="/nbt/journal/v28/n9/full/nbt.1675.html">
>> <link title="nature.com" rel="search" type="application/opensearchdescription+xml" href="http://www.nature.com/opensearch/opensearch.xml">
>> <link title="nature.com" rel="search" type="application/sru+xml" href="http://www.nature.com/opensearch/request"><!--[if !IE]>-->
>> <link rel="stylesheet" type="text/css" media="all" href="http://www.nature.com/view/builds/nbt/build,rev139.css"><!--<![endif]-->
>> <!--[if IE 8]>
>>
>> -----Original Message-----
>> From: drf-bounces @ xxxxxxxxxxxxxxxx [mailto:drf-bounces @ xxxxxxxxxxxxxxxx] On Behalf Of Masamitsu Kuriyama
>> Sent: Thursday, September 16, 2010 2:29 PM
>> To: drf @ xxxxxxxxxxxxxxxx
>> Subject: [drf:1984] Re: Metadata
>>
>> パーマーさん、皆様
>> 私も無知ですのでぜひ識者にご教示いただきたいのですが。。。
>> 確かにGoogle scholarの下記ガイドラインには、HTMLのmetaタグでメタデータを
>> 記録する際、Highwire Pressタグ(例:citation_title)、Eprintsタグ(例:
>> eprints.title)、PRISMタグ(例:prism.title)などを使うよう指示があります
>> ね。ダブリン・コア(DC)は雑誌のタイトル、巻号、ページ数をあらわすフィール
>> ドがないから最後の手段にしろ、とか書いてありますよね。
>>
>> で、ネイチャーはこれに沿って、論文の検索結果のリンク先となるページ
>> (Landing pageというのかsplashdown pageというのかよく知りませんが)に
>> DC、PRISM、Highwireの三種類のタグを使って書誌データを記録しはじめた、と
>> いうことですよね。
>> #関係ないですけど、例にあがってるのが日本人の論文というのがなんとなくう
>> れしいですね。
>> 横断歩道というのはクロスウォーク、すなわちあるメタデータ体系から別のメタ
>> データ体系へのマッピング表のことだと思うのですが、ここではある一つの体系
>> に統一して使おうという話ではないので、クロスウォークは必要ないのではない
>> でしょうか?
>> 実際、著者とか巻号とか別形式で重複して記述されてますよね。
>>
>> それで、私もパーマーさん同様知りたいと思うのですが、どこかグーグルのガイ
>> ドラインに沿ってmetaタグを記述していらっしゃるところはありますかね?
>> やろうと思えばわりと簡単にできると思うのですが。
>>
>> ##それにしてもグーグルってメタデータは時間の浪費とか言ってたんじゃな
>> かったでしたっけ?
>>
>> 栗山 正光
>> 常磐大学人間科学部現代社会学科
>> 〒310-8585 水戸市見和1-430-1
>>
>> (2010/09/16 0:27), David Palmer wrote:
>>> DRFメーリングリストのみなさま
>>> 香港大学のパーマーです。
>>>
>>> GoogleScholarのインデックスのガイドラインには
>>> http://scholar.google.com/intl/en/scholar/inclusion.html
>>> HTMLにPRISMタッグとか他のタグを推薦して、最後の手段のみとして、Du
>>> blinCoreを使用するほがいいとのことですが。
>>>
>>> CrossRefのブログは
>>>
>>> http://www.crossref.org/CrossTech/2008/05/natures_metadata_for_web_pages_1.h
>>> tml
>>> NaturePublishingGroup(NPG)という出版社がHTMLに
>>> PRISM,DC,Googleの自分のメタデータ形式("Google's own bespoke
>>> metadata format")をし始めていると説明しています。NPGのSplashDow
>>> nPageをみて、このメタデータの形式を三つ見ます。
>>>
>>> この三つの形式の間の”横断歩道”をどこに見ることができるでしょうか。
>>>
>>> GoogleのタグはHighWirePressから来たようで、例えば、
>>> "citation_title"。そうだったら、同じ様に、DCとの横断歩道はどこでしょうか。
>>>
>>> どくかの機関リポジトリーはこのHTMLのMetaの形式をいろいろ実行していま
>>> すか。これらの様々な形式を使用して、どの目的でしょうか?SEO?
>>>
>>> Thanks
>>>
>>> David Palmer
>>> Scholarly Communications Team Leader
>>> The University of Hong Kong Libraries
>>> Pokfulam Road
>>> Hong Kong
>>> tel. +852 2859 7004
>>>
>>>
>>>
>>>
>>> --
>>> DRF mailing list
>>> DRF @ xxxxxxxxxxxxxxxx
>>> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>> --
>> DRF mailing list
>> DRF @ xxxxxxxxxxxxxxxx
>> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>> --
>> DRF mailing list
>> DRF @ xxxxxxxxxxxxxxxx
>> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>>
>>
>>
>> --
>> DRF mailing list
>> DRF @ xxxxxxxxxxxxxxxx
>> https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
>--
>DRF mailing list
>DRF @ xxxxxxxxxxxxxxxx
>https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf
--
------------------------------------
杉山 智章 (SUGIYAMA Tomoaki) /~\
静岡大学附属図書館 学術情報部
図書館チーム スタッフ
422-8529静岡市駿河区大谷836
phone:054-238-4477 fax:054-238-5408
--
DRF mailing list
DRF @ xxxxxxxxxxxxxxxx
https://ml.hines.hokudai.ac.jp/mailman/listinfo/drf