実際的簡潔データ構造の開発と大量データ活用
【研究分野】情報学基礎
【研究キーワード】
データ圧縮 / 情報検索 / 文字列検索 / 簡潔データ構造 / 接尾辞配列 / 接尾辞木 / 圧縮接尾辞配列 / 順序木 / アルゴリズム理論 / データ構造
【研究成果の概要】
これまで理論的な研究だけが行われてきた簡潔データ構造に対し,現実の計算機で用いる際の問題点を解決した,実際的な簡潔データ構造を開発した.順序木に対しては,既存の簡潔データ構造のサイズを4割削減し,なおかつこれまで実現できなかった多くの演算を行えるようになった.また,文字列検索の簡潔データ構造である圧縮接尾辞配列,圧縮接尾辞木のライブラリを作成した.これにより,110ギガバイトの文書データからの検索を行うためのデータ構造のサイズを680ギガバイトから22ギガバイトに圧縮することができた.
【研究代表者】
【研究種目】若手研究(A)
【研究期間】2007 - 2010
【配分額】18,980千円 (直接経費: 14,600千円、間接経費: 4,380千円)