次世代進化・適応システムの基盤研究
【研究分野】知能情報学
【研究キーワード】
進化計算 / 実数値GA / UV構造 / k-tablet構造 / 強化学習 / Actor-Critic / 4足歩行ロボット / 分散強化学習 / α-domination戦略 / Profit Sharing / 粉末X線解析 / 蛋白質構造決定 / UV構造仮説 / actor-critic / マルチエージェントシステム / 進化システム / 遺伝的アルゴリズム / 多目的GA / 適応システム / マルチエージェント強化学習 / 報酬共有の合理性
【研究成果の概要】
1.進化計算に関する研究成果
(1)非線形性・悪スケール性・多峰性をもった関数最適化問題に対してロバストな実数値GAとして,外挿的交叉EDX,交叉的突然変異ANSを提案した.(2)探索空間に大きな谷が複数存在して各谷に有力な局所解が存在する大域的多峰性下でGAが探索に失敗する現象を説明するUV構造仮説を提唱し,UV現象を回避する世代交代モデルISMを提案した.(3)稜構造に代表される悪スケール構造の一般化であるk-tablet構造に対応できる交叉LUNDX-mを提案した.(4)クラスタリング手法をベースにk-tablet構造を同定する方法を提案した.
2.強化学習に関する研究成果
(1)マルチエージェント強化学習における報酬共有の合理性について理論的に考察し,不合理な挙動を回避するための条件を明らかにした.(2)多数の行動を扱う強化学習の性能向上を図るために,確率的2分木の行動選択を用いたActor-Criticアルゴリズムを提案した.(3)actorの行動選択に正規分布を用いるアルゴリズムを提案し,8次元連続状態・連続行動の4足ロボットの歩行動作獲得問題に適用して,適切な歩行を効率よく学習できることを示した.(4)多段フローシステムを分散強化学習の枠組みで定式化したとき直面する2種類のトレードオフ(利己と利他,制約と性能)を適応的に調整する共有意思決定を提案した.
【研究代表者】
【研究分担者】 |
木村 元 | 東京工業大学 | 大学院・総合理工学研究科 | 助手 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2001 - 2003
【配分額】13,600千円 (直接経費: 13,600千円)