植物の巨大なゲノムを解読・解析する手法
【研究キーワード】
ゲノムアセンブリ / 長鎖DNAシークエンサー / 植物ゲノム / 反復配列 / アルゴリズム / ロングリード
【研究成果の概要】
反復配列に富みゲノムサイズが極めて大きい(11Gbp)植物ゲノムとしてスギゲノムを選び、共同研究者により以前からシークエンスを提供されていた、あるいは本年度に新たにシークエンスを行ったロングリード配列から、様々な戦略を用いてゲノムアセンブリを行い比較した。その中で最も成績が良かったゲノムアセンブリ結果は、知る限りでは針葉樹ゲノムとして世界最長のコンティグ配列を得ることができた。また、共同研究者より提供された遺伝学的地図との比較を行い、得られたコンティグと遺伝学的地図の整合性が極めて高いことを確認した。また、共同研究者と共にHi-C解析を用いてコンティグを整列し、約9割の塩基配列を染色体上に関連づけることができた。この結果により、巨大な植物ゲノムであっても一定の戦略でゲノム配列を染色体レベルで決定できることが示唆された。
反復配列に富む植物ゲノムの解析においては反復配列の同定が非常に大事であるが、ロングリードのアラインメントを用いた反復配列の同定手法を改良した。また、Gypsy/Copiaについては個別の解析を行った。反復配列のマスキングを並列化するソフトウェアを作成した。
また、ゲノムアセンブリのような、メモリーを大量に使用する大規模計算を行うプログラムをより迅速に開発できるようにするため、並列分散計算を行うプログラムを従来より短時間で記述できるようにするライブラリーのプロトタイプを昨年度開発したが、引き続いて改良を行い実用度を高めた。
【研究代表者】
【研究種目】基盤研究(B)
【研究期間】2020-04-01 - 2023-03-31
【配分額】17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)