機械学習における予測の不確実性の定量化基盤の構築
【研究キーワード】
不確実性 / 機械学習 / 確率予測 / 深層学習 / 医用画像 / 細胞画像 / 汎化能力 / 学習理論 / PAC Bayes
【研究成果の概要】
深層学習の診断予測確率を補正する方法を開発し,機械学習分野の難関国際会議であるAISTATS2021で発表した.
医療の現場では, 症例に関する識別結果よりもその症例である可能性の確率を出力することが重要視される場合がある.例えば今回の研究で具体的に扱った血液検査ではすべての細胞を肉眼で網羅的にチェックすることができないため,異常細胞をその異常確率でリストアップすることは重要である.また,明らかに異常細胞というのが分かるだけでなく,人の判断が分かれるような不確実なデータに対してその不確実性を定量化することが重要である.
しかし,深層学習を用いた判断では,その予測確率を出力すると自信過剰な確率予測をすることが知られている.例えば,99%の確率でこの細胞はがん細胞であると判断したのであれば,そのような細胞画像を100枚持ってくれば,その中で判断の誤りは1枚程度であることが望ましいものの実際には,自信過剰に,つまり,多くの判断で高い(極端な)確率を出力をして判断結果を出力してしまう.本研究では,特に医療分野を背景とし,1つのデータに対して複数人が判断をする場合を想定し,その判断の正答率を反映し予測確率を補正するalpha-calibrationを提案した.提案手法は学習済モデルに対して補正することができるので再学習する必要はない.この方法は単なる予測の不確実性だけでなく,人の判断の不一致度も推定することができるため専門家の判断が難しい症例の予測が可能となる.さらに専門家の判断により予測確率を更新することができるためセカンドオピニオンの必要性も定量化可能である.
深層学習における確率的勾配の性質を拡散定理により解析し機械学習の難関国際会議であるICLRで発表した.確率的勾配に現れる摂動の性質に着目し,学習のダイナミクスを解析することで損失関数の非平坦な解への回避に関する性質を解明した.
【研究代表者】
【研究分担者】 |
三森 隆広 | 早稲田大学 | 理工学術院総合研究所(理工学研究所) | 次席研究員 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2020-04-01 - 2025-03-31
【配分額】17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)