多個体ハプロタイプ解析による超高ヘテロ接合性生物圏の実態解明
【研究キーワード】
ハプロタイプ / ゲノム / メタゲノム / 多様性 / ヘテロ接合性 / ゲノム多様性 / 高ヘテロ接合性 / de novoアセンブリ
【研究成果の概要】
本年度では前年度に引き続きハプロタイプ解析用ツールの開発を実施した。開発を進めるにあたって、多数の微生物のハプロタイプが混在した微生物叢のメタゲノムデータは当ツールのテストに適しており、本研究の成果の応用先にもなることが見いだされた。そのため微生物叢のデータを用いて開発を推進し、類似した配列の誤接続を防ぎつつゲノム配列を決定可能なツール: MetaPlatanusを実装し論文発表した (Kajitani et al. 2021)。当ツールは正確性に優れ塩基あたりのコストが低いショートリードDNAシークエンサーのデータ、およびコストは高いが一度に長い配列を読み取れるロングリードDNAシークエンサーのデータを併用することで長いゲノム配列を決定できる。本手法は今後は繰り返し配列が多い真核生物のゲノムデータにも応用されることが期待される。
並行して近年に使用例が増加している、DNA分子の空間的な近接関係を捉えるHi-C法や、エラー率の低いロングリード技術であるHiFiリードの利用の検討も行った。代表者は所属研究室の人員と共同でHi-C法を利用したハプロタイプ配列決定手法を開発している (論文投稿中)。また、HiFiリードを用いても高ヘテロ接合性のサンプルに対しては課題が存在することもベンチマークにより確認している。
公開データを用いたヘテロ接合度分布の網羅的解析については進行中であるが、多数の生物種のゲノムを対象とした計画 (Vertebrate Genomes Project、Darwin Tree of Lifet等) が急速に進行していることに注意を払っている。次年度はクラウド計算機資源を活用しつつ、大量のデータを並列的に処理して解析結果をまとめていく予定である。
【研究代表者】
【研究種目】若手研究
【研究期間】2020-04-01 - 2023-03-31
【配分額】4,160千円 (直接経費: 3,200千円、間接経費: 960千円)