思考ゲームの並列分散探索と機械学習基盤
【研究分野】エンタテインメント・ゲーム情報学
【研究キーワード】
ゲームプログラミング / ゲーム情報学 / 人工知能 / 機械学習 / 並列計算
【研究成果の概要】
アルファ碁が人工知能全体の進歩として社会に衝撃を与えたように,ゲームを題材として人工知能研究はめざましく進歩している.この研究課題では,ゲームAIの賢さを実現する機械学習(特に強化学習)とゲーム木探索という基礎技術を研究した.さらに,並列分散計算を活用した高速化にも取り組んだ.現在の強化学習の枠組みではAIが賢さを身につけるために膨大の計算時間が必要で,社会で広く使うことが難しいためである.
【研究の社会的意義】
研究計画の通りに機械学習とゲーム木探索とその並列実行について研究した.また採択後に大きく発展したAlphaGoに代表するGPU計算と強化学習についても,最新技術を研究に反映させた.成果の一つであるUniformity regularizationという学習方式については,tensorflow及びchainer上で実装し,囲碁,将棋,チェスなど代表的なゲームを題材に性能を示した.成果全体を総合して15件の論文を公表した.
【研究代表者】
【研究種目】基盤研究(B)
【研究期間】2016-04-01 - 2019-03-31
【配分額】5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)