不揮発メモリーを用いたゲノム情報学の新展開
【研究キーワード】
不揮発メモリー / アルゴリズム / 配列アラインメント / ゲノムデータベース / 配列検索
【研究成果の概要】
DNAシークエンサーの技術進歩により大規模なゲノム解析が従来より安価で気軽に実施できるようになった。このため、ゲノム解析で大容量のメモリーを必要とする場面が激増している。このため、ゲノム計算を明示的にサポートする大規模な学術用計算機センターではメモリーを大量に搭載した計算ノードを多数用意して、ユーザーが数TB程度のメモリーを用いる計算であっても実行可能としている。しかし、DNAシークエンサーとその試薬代の価格低下の速度は、計算機の速度向上と価格低下より速いため、計算機資源が相対的に高価になってきており、将来的にゲノム解析の大きなネックになる可能性が高い。
そこで、本研究では高価なDRAMメモリーの代わりにビット単価がより安価な不揮発メモリーを用いてシステム全体として高価なDRAMの消費量を抑制しつつ、様々なゲノム解析アルゴリズムを実行できるように新規アルゴリズムを開発することを目指した。本年度は、不揮発メモリーとビットマップベースのグラフを用いた配列検索アルゴリズムに対して、ビットマップを圧縮することで、大量に必要としていた不揮発メモリーの使用量を削減したアルゴリズムを考案した。また、ビットマップベースのグラフを用いた場合には、検索して見つかったターゲット配列の配列メタデータを取得する計算効率/記憶容量効率の良い手法が存在しなかったが、ハッシュ関数を用いて配列そのものからメタデータへの索引を張る手法を考案し、この問題を軽減することができた。また、本アルゴリズムは主にDNA配列を対象として研究を進めていたが、アミノ酸配列の検索に対して拡張するべく理論的検討を行った。
【研究代表者】
【研究種目】挑戦的研究(萌芽)
【研究期間】2020-07-30 - 2023-03-31
【配分額】6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)