大規模データに対するベイズモデリングの新展開
【研究キーワード】
ベイズ統計 / 一般化ベイズ / 状態空間モデル / 時系列データ / 空間データ / 階層モデル / ロバスト推測 / 時空間統計
【研究成果の概要】
本研究の目的は、大規模データ解析で見受けられる実用上の問題点に着目し、それらを解決する効果的なベイズモデリングの方法論の開発を目指している。今年度は具体的に以下のような研究に取り組んだ。
(A) 外れ値に頑健なベイズモデリング: 現実のデータには外れ値が含まれることが多く、その影響で誤った統計的推測を行ってしまう危険性がある。まず、ロバストダイバージェンスと呼ばれる分布間の尺度を用いたベイズ推測の方法論を開発し、その計算アルゴリズムの開発や理論的な性質の解明を行った。また、正規データとカウントデータの場合にそれぞれ焦点を当て、外れ値に対してロバストな確率分布を開発しその理論的な性質を明らかにした。さらにマルコフ連鎖モンテカルロ法による効率的な推定アルゴリズムも開発した。
(B) 適応的な縮小事前分布: 大規模データ内の異質な構造を適応的に捉えることが可能な縮小事前分布の方法論の開発を行った。特にカウントデータと正値データに対する縮小事前分布を新たに開発し、その理論的な性質の解明と効率的な計算アルゴリズムの開発を行った。
(C) 空間データに対する予測統合手法: 大規模空間データを用いて解釈性と精度が高い空間予測を行うため、複数の単純なモデルによる予測を空間潜在変化係数モデルで組み合わせる枠組みを提案し、変分近似法やマルコフ連鎖モンテカルロ法による計算手法を開発した。
(D) 状態空間モデルの効率計算アルゴリズムの開発: 高頻度で観測される時系列データに対して状態空間モデルを用いて高速にベイズ推論を実行するための効率的な計算アルゴリズムを開発した。さらに、分布にガンマ関数を含むクラスのモデルに対してギブスサンプラーを実行するためのアルゴリズムの枠組みも開発した。
【研究代表者】