HUSCAP logo Hokkaido Univ. logo

Hokkaido University Collection of Scholarly and Academic Papers >
Graduate School of Information Science and Technology / Faculty of Information Science and Technology >
Peer-reviewed Journal Articles, etc >

プロパティ接尾辞木のオフライン線形時間構築アルゴリズム

Files in This Item:
電子情報J91D3_595-607.pdf1.28 MBPDFView/Open
Please use this identifier to cite or link to this item:http://hdl.handle.net/2115/47141

Title: プロパティ接尾辞木のオフライン線形時間構築アルゴリズム
Other Titles: A Linear-Time Off-Line Construction of Property SuffixTrees
Authors: 上村, 卓史1 Browse this author
喜田, 拓也2 Browse this author
有村, 博紀3 Browse this author
Authors(alt): UEMURA, Takashi1
KIDA, Takuya2
ARIMURA, Hiroki3
Keywords: テキスト索引
情報検索
プロパティ付き文字列
接尾辞木
パターン照合
Issue Date: Mar-2008
Publisher: 電子情報通信学会
Journal Title: 電子情報通信学会論文誌. D, 情報・システム
Volume: J91-D
Issue: 3
Start Page: 595
End Page: 607
Abstract: プロパティ付きテキストとは,長さnのテキストに,補助情報としてテキスト上の互いにオーバラップを許した区間の集合(プロパティという)が付加された構造化文書の一種であり,アノテーション付きの系列データの形式的なモデルとなっている. このプロパティ付きテキストへの全文テキスト索引として, Amirら(CPM2006) は,プロパティ接尾辞木を提案した. これは,プロパティの各区間に含まれるすべての部分文字列を格納する索引構造であり,遺伝子情報や,ビデオストリーム,メタデータ付き時系列データなどへの応用がある. また,高度な検索問題である重み付きパターン照合にも用いられる. Amirらは,定数サイズのアルファベット上で,プロパティ接尾辞木をO(n log log n)時間でオフライン構築するアルゴリズムを与えたが,その線形時間構築アルゴリズムは,現在まで未解決の問題であった. 本論文では,定数アルファベット上で,プロパティ接尾辞木を線形時間で構築するオフラインアルゴリズムを与え,この問題を肯定的に解決する. 提案アルゴリズムは,接尾辞リンクの巡回を用いた簡潔な手法であり,理論的に効率良いだけでなく,実際のデータに対しても高速に動作する. 更に,人工データ上の計算機実験を行い,実際の性能を評価する.
Rights: Copyright © 2008 社団法人 電子情報通信学会(IEICE).
Relation: http://search.ieice.org/
Type: article
URI: http://hdl.handle.net/2115/47141
Appears in Collections:情報科学院・情報科学研究院 (Graduate School of Information Science and Technology / Faculty of Information Science and Technology) > 雑誌発表論文等 (Peer-reviewed Journal Articles, etc)

Submitter: 喜田 拓也

Export metadata:

OAI-PMH ( junii2 , jpcoar_1.0 )

MathJax is now OFF:


 

 - Hokkaido University