データに潜在する曲率情報に着目した統計解析手法の開発
【研究キーワード】
データ解析 / 機械学習 / Wasserstein距離 / グラフ埋め込み / 単語分散表現 / クラスタリング / 多様体学習 / 曲率 / 幾何学的統計学 / 距離空間
【研究成果の概要】
本年度の研究成果としては,これまでの本研究課題の成果である,①経験グラフ測地距離のα,β距離を用いたデータ解析手法,②正規分布の場合のエントロピー制約付きWasserstein距離の理論解析,③計量錐を用いたグラフ埋め込みによるデータの階層構造の抽出手法のそれぞれについて,Shoenberg理論の応用という見地からまとめた結果を統計関連学会連合大会において発表したことが挙げられる.また,Shoenberg理論は距離空間を特徴づける理論として統計学やで機械学習などの幅広い分野で応用されてきたが,それらを統合的にまとめることはこれまでなされてこなかったので,発表においては幾何学的なデータ解析という本研究課題に即した視点でのサーベイも行った.さらに,③の計量錐を用いたグラフ埋め込みについては,新たな実験結果を加えた論文を機械学習の国際会議に投稿した.
また,学習による英語心内辞書の推移に関するデンドログラムを用いたデータ解析およびその知見を用いた英語学習教材の開発に関する共同研究の成果を学会で発表し,成果をまとめた論文が受理され出版された.
以上に加えて,自然言語処理分野における質疑応答(QA)データセットの評価用データセットの役割と日本語QAデータセットの必要性についての共同研究と,強化学習の手法であるCounterfactual Regret Minimization(CFR)による不完全情報繰り返しゲームに対する近似的な均衡戦略に関する共同研究についても,その成果をそれぞれ国内会議で発表した.
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2019-04-01 - 2023-03-31
【配分額】4,030千円 (直接経費: 3,100千円、間接経費: 930千円)