タンパク質界面の複雑ダイナミクスの解析:機械学習とMD計算に基づく新手法の開拓
【研究キーワード】
分子動力学 / 機械学習 / シミュレーション / 分子動力学シミュレーション / 古典力学 / データベース / 分子ダイナミクス / 2次元カオス系 / 深層学習 / タンパク質 / タンパク質-タンパク質相互作用
【研究成果の概要】
機械学習技術の発展により、人工知能は画像認識やチェスや囲碁などの分野において人間の知能を凌駕するようになってきた。近年、AlphaFoldのような先進的なタンパク質構造予測技術においても、機械学習が中心的な役割を担っている。本研究では、こうした機械学習技術を分子科学に導入することによって、タンパク質間に見られる重要なダイナミクス現象を解き明かしていくことを目指している。
これまでの研究で、基本的な機械学習プログラムとデータベースのプロトタイプを作り、2次元ハミルトン系ダイナミクスの学習データベースを用いて、カオス性予測に取り組んだ。このテストにおいては9割程度の正答率まで上げることができるようになった。また、NaイオンとClイオンの会合・解離の予測をする機械学習にも取り組んできた。予測の正答率を75%程度まで向上することに成功している。
今年度は、機械学習モデルによるNaイオンとClイオンの会合・解離の予測精度が正答率これ以上改善することが困難になる要因について、解析をおこなった。機械学習手法・データ数・ハイパーパラメータなど色々な可能性を探ったが、本質的な正答率の改善はできなかった。そこで、系自体に、学習困難な要因がある可能性を調べた。その結果、不正解であった初期条件のトラジェクトリーはカオス性が高いものが多いことが分かった。さらに、タンパク質界面環境への応用として、卵白リゾチーム(HEL)とその抗体(HyHEL-10)の複合体にある塩橋の形成・崩壊のダイナミクスについてデータベース化をおこなった。さらに、簡略的な機械学習もおこなった。
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2018-04-01 - 2023-03-31
【配分額】4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)