ギガシークエンスデータの高速解析技術の開発
【研究分野】生体生命情報学
【研究キーワード】
ゲノム / ギガシークエンサー / アルゴリズム / ショートリード / 類似配列検索 / 編集距離 / ギガシークエンスデーター / 最小全域木
【研究成果の概要】
ギガシークエンサーは,短い断片配列(リード)を大量に出力するため,高速な解析技術の開発が急務となっている.本研究では,オフセット付き鳩ノ巣原理を応用し,大量のリードから超高速に類似配列を発見するアルゴリズムSlideSortを開発した. SlideSortは従来手法と比較して,同程度のメモリで1000倍以上の速度向上を達成した.考案したアルゴリズムの応用例として,最小全域木を構築するソフトウェアの開発も行った.類似ペア検索の応用範囲は広く,上記に述べたクラスタリングの他にも,共通パターンの発見,アセンブリの効率化などに役立つと期待される.
【研究代表者】
【研究種目】若手研究(B)
【研究期間】2010 - 2011
【配分額】3,250千円 (直接経費: 2,500千円、間接経費: 750千円)