早稲田大・今村さま
皆さま
杉田@三重大です。
DRF2ではお世話になります。
どうぞよろしくお願いいたします。
>ひらがなとカタカナ、旧字と新字などの検索の問題にどのように対処さ
>れていらっしゃいますでしょうか?
>テーブルを作成されているなどの例がありましたらご教示くださるよう
>お願いいたします。
DSpaceのキーワードの正規化というのは、正直なところ、考えた
ことがありませんでした。
DSpaceでは、基本的に入力してある文字列がそのまま検索される
という前提なのでしょうか?
#以前、DSpaceで漢字の単語の区切り具合によっては上手く検索で
#きないと悩んだことがありましたが・・・。
DSpaceの検索機能にはあまり期待せず、Googleなどで引っかかっ
てくれたらいいかなと思っていますが、そもそもGoogleの検索で
ひらがなとカタカナ、旧字と新字などの検索の問題はクリアされ
ているのかな? そのほか長音とかは?と疑問になってきました。
例えば「紀伊国屋」でぐぐると、「紀伊國屋書店」も「紀伊国屋
旅館」も「紀ノ国屋スーパー」もヒットしますね。
一方「"らいすかれー"」でぐぐると、「ライスカレー」や「らい
すかれえ」はヒットしないみたいでした。
-----------------------------------------------------------
http://www.google.co.jp/support/bin/answer.py?answer=3178&topic=352
Google では必要に応じて検索語句だけでなく、その語句の一部または全部に関して、類似した単語の検索も
行っています。たとえば、「ペットキツネザル 食物」 という検索用語に対しては、"ペットショップ キツネ
ザル 食物" やその他類似した文字句の検索結果も表示されます。
-----------------------------------------------------------
OPACやWebcatでは、検索できるように、キーワードが切り出されて
いたり、新旧漢字のテーブルを持っていたりする(=正規化されて
いる?)のですよね・・・?
DSpaceのキーワードの正規化は可能なのでしょうか?
また、その必要性は高いのでしょうか?
すみません、目録の知識がなくて、こういうことはカラキシです。
どなたかご存知の方いらっしゃいましたら、ぜひぜひご教示いた
だければ幸いです。
aimamura @ waseda.jp さんは書きました:
>CSI, DRFの皆様
>
>お世話になっております。早稲田大学の今村です。
>今更ながらの質問で恐縮ですが、DSpaceユーザーの皆様にお尋ねします。
>ひらがなとカタカナ、旧字と新字などの検索の問題にどのように対処さ
>れていらっしゃいますでしょうか?
>テーブルを作成されているなどの例がありましたらご教示くださるよう
>お願いいたします。
>
>***********************************************
>早稲田大学図書館情報管理課 今村昭一
>
>〒169-8050 東京都新宿区西早稲田1−6−1
>Tel: 03-3203-4322(直通)
>Fax: 03-5273-4378
>E-mail: sommelier @ wul.waseda.ac.jp(情報管理課)
>***********************************************
>
>
=================================================
Sugita Izumi 杉田いづみ izumi @ ab.mie-u.ac.jp
国立大学法人三重大学 学術情報部(附属図書館)
情報図書館チーム 情報リテラシー担当
〒514-8507 三重県津市栗真町屋町1577
Tel:059-231-9089 (ext.2208) Fax:059-231-9800
図書館Web:http://www.lib.mie-u.ac.jp/
問合先Email:literacy @ ab.mie-u.ac.jp