確率制御理論における同定問題の研究
【研究分野】数学基礎・応用数学
【研究キーワード】
部分観測確率制御 / 逆問題 / 確率制御問題 / ハミルトン・ヤコビ・ベルマン方程式 / 再生核補間 / 部分観測確率制御問題 / Zakai方程式 / カーネル選点法 / 確率制御 / 応用数学 / 確率論
【研究成果の概要】
確率最適制御理論における逆問題について,提案した枠組みにおいて,適切性が成り立つための十分条件を明らかにした. また数値解法についても検討し,いくつかの具体的な問題に対して,処罰パラメーターが高い精度で再現されることを数値的に確認した.
部分観測確率制御問題の数値解析について,拡散過程に対する部分観測問題を特徴付けるZakai方程式に対するカーネル選点法の収束の議論を基に,元の問題を通常の有限次元完全観測確率制御問題により近似し,その誤差評価を与えた.これはすなわち,部分観測確率制御問題に対応する無限次元ハミルトン・ヤコビ・ベルマン方程式を有限次元のそれで近似する手法を与えることを意味する.
【研究の社会的意義】
これまで,確率制御の一般的枠組みにおいて逆問題はほとんど研究されておらず,また,決定論的制御においても逆問題の適切性を議論した論文は無いため,本成果は,最適制御の逆問題という,長年重要視されてきた問題に対し理論的基盤の一つを与えるものと位置付けられる.さらに,部分観測確率制御問題に対して実装可能な数値解法を初めて提供した.
本研究の貢献は,非線形確率システム同定・制御の実用化に必要な部分の数値解析の端緒として位置付けられ,これを基に広範囲の応用分野の発展が期待できる.
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2017-04-01 - 2021-03-31
【配分額】3,640千円 (直接経費: 2,800千円、間接経費: 840千円)