ゲノム多様性解析のための新しい統計的方法
【研究分野】統計科学
【研究キーワード】
機械学習 / 統計推論 / ブースティング / 遺伝子発現 / タンパク発現 / SNP / プロテオーム / ゲノムデータ / マイクロアレイ / パタン認識 / メタアナライシス / 関数データ解析 / 独立成分分析 / 自己組織化主成分 / 多重比較 / 一塩基多型 / バイオインフォマティクス / バイアスモデル
【研究成果の概要】
バイオインフォマティックスのための新たな統計科学を構築することに貢献した。特にヒトゲノム多様性に由来する様々なデータから合理的な結論を得るための統計的方法論を開発した。具体的な問題としては、遺伝子発現データからの難治性がん疾患遺伝子の発見や、SNPsデータから薬剤感受性を規定する遺伝子多型の同定が挙げられる。これらの目的のために特化した新たな統計的方法を開発,又は開発中である。主な研究成果は次のようにまとめられる.
1.遺伝子発現の表現形との相関研究はグループ・ブースとの提案,実用化が成された.
2.タンパク発現の相関研究は共通ピーク法が実用化され,実データで新たな知見が得られた.
3.ゲノム多様性と治療効果に関連するSNPsの探索は現在,方法論的検討を終えて進行中である.
4.機械学習の方法論として,ゲノムデータの解析を念頭においてブースティングやICAの統計的考察が統一的に成された.
このことによって機械学習の分野で文字・音声・画像認識のために開発された統計的パタン識別の方法,独立線分解析,ブリーフプロパゲイションが、ゲノムデータの解析法に拡張させたことによって更なる方法の提案と普及が期待される。これは統計学、情報学、人工知能分野などを横断的に展開する新分野の誕生への貢献が期待される。一方で今回の研究プロジニクトよって、厳しい管理とよく整理された環境のもとで,ヒト遺伝子解析データの本格的な統計解析が実施されたことは、従来の多くの困難な問題の解決に多大な貢献が期待される。将来的にはいわゆる「テイラーメイド医療」の実現に、統計学の分野からの積極的な貢献となると考えられる。上記の計画を円滑に進めるために癌研究所,国立遺伝研究,国立がんセンター研究所,国立循環器センター研究所の共同研究者との情報交換,共同研究を密接に行った.
【研究代表者】