統計学,ニューラルネット,機械学習の新しい融合
【研究分野】統計科学
【研究キーワード】
バイオインフォマチックス / SNPハプロタイピング / 遺伝子発現データ / アダブースト / 独立成分分析 / 自己組織化主成分分析 / プロテオーム / 関数データ解析 / 統計学 / DNAマイクロアレイ / 機械学習 / 統計推理 / SNPデータ / ブースティング / ロバスト / ニューラルネット / 統計推測 / モデル特異性 / 独立成分解析
【研究成果の概要】
1.バイオインフォマチックスへの挑戦
癌研究会ゲノムセンターとの共同研究で行ったSNPハプロタイピングの研究がBioinformaticsに掲載予定,国際特許申請中である.次なるプロジェクト,SNPハプロタイプブロックの同定問題について藤澤主導で進行中で論文準備の段階にある.さらに月例のゲノム研究会においてプロテオームの関数データ解析についても同時進行している.日本統計関連学会連合大会2003・企画セッションにおいて,「SNP統計解析における統計的諸問題」を松浦,江口が企画した.11月に柳川教授(九州大学)の紹介で,P.R.Sen教授(ノースカロライナ州立大)の公開講演会をオーガナイズした.また遺伝子発現のデータベースについて,国立遺伝学研究所の舘野研究室を2度訪問し,意見交換を行った.
2.ブースティング法の拡大と統計理論
この3年間プロジェクトを通して行われた月例アダブースト研究会(村田,金森,江口,竹ノ内君(統計科学,総研大修了予定)も成果が出始めている.Uブースト・アルゴリズムの提案,統計的一致性とベイズルール同値性の両立について新しい理論が建てられた(Neural Computation掲載予定).また,イータブーストのミスラベル・ロバストネス(Neural Computation,2004,掲載)は医療診断などラベルの観測にノイズが入る場合に有効であることが示された.
3.独立成分分析と主成分分析
奈良で4月に開催されたICA国際会議第4回の組織委員(村田,南,江口)を勤めた.また自己組織化主成分分析(J.Machine Learning Researchに掲載予定)を1の遺伝子発現データに適用して好結果が得られた.
【研究代表者】