RNA2次構造の確率分布を内包した機械学習アルゴリズムの開発
【研究キーワード】
RNA2次構造 / 特徴抽出 / 回帰モデル / 機械学習
【研究成果の概要】
RNAの2次構造は様々な生命現象で重要な役割を果たしており、その役割を正確に理解することは学術的にも工学的にも重要である。近年、実験技術の進歩によりRNA2次構造が関与する生命現象に関するデータが蓄積されつつある。具体的には、RNAの塩基配列と、その活性についての大規模データが蓄積されつつある。本研究では、大規模データの背後にあるRNA2次構造の確率的振る舞いを考慮しつつ、特徴抽出や予測モデルの構築を行う新しい機械学習アルゴリズムを開発する。そして、このアルゴリズムを様々なタイプの大規模データへ適用することを通じて、汎用的な枠組へと発展させることを目指す。
今年度は、より詳細な2次構造の特徴を考慮できるようにアルゴリズムを拡張した。具体的には、2次構造に含まれる塩基対、ヘアピンループ構造、内部ループ構造、バルジループ構造などの部分構造の寄与を考慮できるようにした。さらに、RNA-RNA間の分子間2次構造についても塩基対、その他の部分構造の寄与を考慮できるようにした。また、公開された大規模データの解析を一部前倒しで実施した。具体的には、原核生物の翻訳開始効率、スプライシング効率、リボザイムの自己切断活性についてのデータに開発したアルゴリズムを適用した。さらに、RNA構造プロービング実験(SHAPE-seqなど)のデータを本アルゴリズムに取り込むための予備実験を行った。そして、ここまでの解析結果を論文としたまとめて発表するとともに、提案アルゴリズムを実装したソフトウェアを開発した。
【研究代表者】
【研究種目】若手研究
【研究期間】2021-04-01 - 2024-03-31
【配分額】4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)