HUSCAP logo Hokkaido Univ. logo

Hokkaido University Collection of Scholarly and Academic Papers >
情報科学研究科  >
雑誌発表論文等  >

対話文生成のためのWebを用いた話題語の抽出

フルテキスト
IPSJ-NL09189018.pdf2.04 MBPDF見る/開く
この文献へのリンクには次のURLを使用してください:http://hdl.handle.net/2115/63779

タイトル: 対話文生成のためのWebを用いた話題語の抽出
その他のタイトル: Extracting Topic Words from the Web for Dialogue Sentence Generation
著者: 下川, 尚亮 著作を一覧する
Rafal, Rzepka 著作を一覧する
荒木, 健治 著作を一覧する
キーワード: 自然言語処理
Web【情報システム】
チャット
口語
発行日: 2009年 1月15日
出版者: 情報処理学会
誌名: 情報処理学会研究報告. 自然言語処理研究会報告(NL)
巻: 2009
号: 2
開始ページ: 121
終了ページ: 126
抄録: 本研究では,Internet Relay Chat の対話文の 1 文中で話題となっている話題語の抽出を行う.インターネット上の対話文は,blogやWebページに比べ,口語に近い表現が多数使用される.このことから,Web上の対話においてその入力文が意味するところを把握するには,ユーザの意図にそった入力文の解釈が必要となる.しかし,名詞だけを対象にユーザの入力文から,その文中で話題になっていることを把握ことは困難である.そこで本稿では,形容詞,動詞も考慮したWebからの話題語の抽出手法を提案する.実験の結果,名詞のみを対象にした場合よりも形容詞を考慮した場合の方が多様な表現の話題語を抽出できることが明らかとなった.
In this paper we extract topic words from Internet Relay Chat utterances. In such dialogues there are many more spoken language expressions than in blogs or usual Web pages and we presume that the always changing topic is difficult to determine only by nouns which are usually used for topic recognition. In this paper we propose a method for determining a conversation topic considering also association adjectives and verbs retrieved from the Web. Our first experiments show that extracting association words using nouns and adjectives leads to determining topic labels of higher diversity.
Rights: ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
資料タイプ: article
URI: http://hdl.handle.net/2115/63779
出現コレクション:雑誌発表論文等 (Peer-reviewed Journal Articles, etc)

提供者: Rafal Rzepka

 

本サイトに関するご意見・お問い合わせは repo at lib.hokudai.ac.jp へお願いします。 - 北海道大学