遺伝子変異を考慮しナノポアシーケンスから高精度にメチル化を検出する情報技術の開発
【研究キーワード】
methylation / nanopore sequencing / deep learning / ナノポアシーケンシング / メチル化 / 構造変異 / 深層学習
【研究成果の概要】
本研究では、ナノポアシーケンシングから複雑なメチル化プロファイリングを正確に行うために、特定遺伝子型を考慮したディープニューラネットワークによって高精度にメチル化を検出する情報解析技術を構築する。これに関して今年度には、以下三つの研究を進めた。
(1)評価用データの収集と学習データを作成した。DNAメチル化の5mCと6mAを中心として、近年発表されたベンチマークデータを網羅的に収集し、分析した。学習データを作成するため、山口貴世志講師と共同研究し、細胞株RKOに対して、全ゲノムとメチル化なし(全ゲノム増幅した)のナノポアシーケンシングと解析を行った。増幅手法によって(Multiple displacement amplification(MDA)とランダムプライミング技術)、ナノポアシーケンシングデータの品質を分析した。
(2)評価用データにおけるBi-directional transformer encoderを利用し、ナノポアシーケンシングデータのためのメチル化を予測する方法を開発した。予測精度に大きく影響を与える電圧信号の特徴を分析し、目標塩基と離れている距離をモデルに考慮し、軽量化かつ精度も負けないモデルが開発した。この成果は、国際会議IEEE International Conference on Bioinformatics and Biomedicine (BIBM)へ投稿し、採択された。
(3)構造変異に関して、変異区間(特に分断点の位置)の予測精度を上げるため、ディープニューラネットワークの構造を改善した。リードデプスより、1塩基精度の予測が可能になった。この成果は、論文の一部としてPLoS computational biologyに発表した。
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2021-04-01 - 2024-03-31
【配分額】4,160千円 (直接経費: 3,200千円、間接経費: 960千円)