ベイズ型統計モデルによる複数異種形式データ解析の理論と方法論の研究
【研究分野】統計科学
【研究キーワード】
多変量解析 / グラフィカルモデル / ベイジアンネットワーク / ノンパラメトリック回帰 / クラスタ分析 / マイクロアレイデータ / データ同化 / タンパク質間相互作用データ
【研究成果の概要】
●マイクロアレイデータとデータベース上で各遺伝子に付与されている機能アノテーションを統合し,情報抽出を行う手法を開発した. GO:: TermFinder, FatiGOと呼ばれるソフトウェアとして公開されている既存の方法論の問題点を指摘し,それを解決する方法論を構築できた.また,kの成果を基にしたソフトウェアを公開するために準備中である.
●マイクロアレイデータは,各遺伝子が生成するメッセンジャーRNAを計測しているため,実際に細胞内で働いているタンパク質の状態(量・活性度)を理解することは難しい.しかしながら,転写制御機構を明らかにするためには,転写因子と呼ばれる多数の遺伝子を制御しているタンパク質の活性を予測することが必要不可欠である.そこで,マイクロアレイデータと転写因子結合配列情報を利用することで,転写因子の活性度を予測する手法を開発した.また,この手法を,人参養栄湯と呼ばれる漢方薬を投与したマウスについて適用し,その作用機序を明らかにするための知見を得た.この論文は,複合薬である漢方のバイオインフォマティクス的解析の世界初の論文であり,複合薬の解析にこのアプローチは有用であることを示した.
●ベイジアンネットワークによる遺伝子ネットワーク推定においては,その構造学習はNP-困難であることが示されている.そこで,パラメータ推定と構造学習が同時に可能なlassoに着目し,グラフィカル・ガウシアンモデルを推定するための方法論を開発した.また, lassoを改良したweighted lassoを開発し, lassoの問題点である擬陽性を大幅に減らすことに成功した.
【研究代表者】
【研究種目】若手研究(A)
【研究期間】2005 - 2007
【配分額】23,140千円 (直接経費: 17,800千円、間接経費: 5,340千円)