MDL原理に基づくBayesian Networkの学習-事前知識の導入による探索の効率化-
【研究分野】知能情報学
【研究キーワード】
MDL原理 / Bayesian Network / 機械学習 / 事前知識 / 分岐限定法 / 帰納推論 / ネットワーク構造
【研究成果の概要】
不確実な知識を確率を用いて表現し、何らかの推論を進めていく際に、Bayesian networkが頻繁に適用され、最近では、経営診断、医療診断、故障診断といった、分析診断型の問題に多くの実績を残している。Bayesian networkは、各属性データをノードで、その因果関係をノード間を結ぶ有向アークで示す、いわゆるDAG(directed acyclic graph)として表現される。特に、各ノードAの属性データx_Aは、有向アーク(A←B_i)を介して親にあたるノードB_iの属性データの値xB_i,i=1,2,・・・,m,を前提にした条件付値率P(x_A|x_B_1,,x_B_2,・・・,x_B_m)に基づいて生成されるという仮定がおかれる。すなわち、ノードの集合が事前に与えられれば、有向アークをどのように結ぶか(構造の決定)と、条件付確率をいかに設定するか(パラメータの推定)を検討して、Bayesian networkが決定される。Bayesian networkの推論は、一部のノードに事実として具体的な属性データを与えておき、他のノードの属性データの値をBayes統計学でいう事後確率最大の基準で推定する(未知属性データのおこりうる各値の確率を付与する推論も可能である。)処理に相当する。
本研究では、推論を行なう前にBayesian networkを最初にいかに獲得するか、特にその構造の決定について議論をすすめた。Bayesian networkは視覚的に表現されるので、エキスパートがその知識を直接Bayesian networkの形式で記述してもよい。しかし、大規模なnetworkでは、その作業量が膨大になることと、エキスパートの潜在意識にある知識が表現されないことなどから、トレーニングデータからの自動学習が検討されるに至っている。本研究では、この問題についてminimum description length(MDL)原理に基づいて解決する方法を示した。一般に、MDL原理は、トレーニングデータを、知識の記述と、その知識に基づいたトレーニングデータの記述の2段階で記述し、その合計の記述長(ビット数)を最小にする知識を採択する。MDL原理は、前者を知識の記述長(知識の簡潔さを表す)、後者をその知識では説明できない例外の記述長(データの知識への適合性を表す)とみなせば、データ圧縮の立場からその両者について最もバランスのとれた知識を真の知識とみなす学習原理であるということができる。
特に、構造決定の探索に分岐限定法を用いて、効率良く最適解を求める方法を見い出した。この結果は、電子情報通信学会論文誌英文誌分冊D(1999年2月)に掲載された。
【研究代表者】