深層学習の原理究明に向けた関数推定理論の開発
【研究キーワード】
深層学習 / 関数推定 / ノンパラメトリック統計 / 汎化誤差 / ノンパラメトリック統計学 / 学習理論 / ミニマックス最適性 / 機械学習
【研究成果の概要】
当該研究計画の概要は、深層学習の原理を説明することができる理論の構築である。深層学習は実用上で高い性能を発揮しているが、その原理は未解明の点が多く、この性能を説明できる理論は未だ発展途上である。
当該研究課題では、以下のような成果を得た: (i)データを生成する真の関数が特異性などの特殊な性質を持つ場合、深層学習の優位性が示されることを証明した。(ii) 深層学習の複雑な非凸損失関数が過学習を回避できることを示す理論を開発した。(iii) 深層学習モデルでも過剰パラメータ下での二重降下現象が起こることを示した。(iv)理論的な知見を用いて非凸最適化問題を解くアルゴリズムを開発した。
【研究の社会的意義】
深層学習は、その高い性能から強い注目を集め、社会の各所で応用されている重要な技術である。今回のAIブームにおいて、深層学習によって実現する技術は数多い。
しかしながら、深層学習の原理は未だ十分に解明されていないのが現状である。その結果として、深層学習の欠点である膨大な計算コストや、ブラックボックスな挙動などの問題点は、未解決のまま残っている。これらの問題を根本から解決するには、基礎研究を通じて深層学習の原理を理解し、抜本的な解決手法を開発することが望まれる。
本研究はその試みの一端として、深層学習という新しい技術を数学的に記述することを試み、そして深層学習の成功の要因を明らかにする理論を構築した。
【研究代表者】
【研究種目】若手研究
【研究期間】2018-04-01 - 2022-03-31
【配分額】3,900千円 (直接経費: 3,000千円、間接経費: 900千円)