ビジネス価値創造のためのデータ解析プラットフォームと時変協調フィルタリングの研究
【研究キーワード】
データ解析プラットフォーム / ビッグデータ / 機械学習 / 協調フィルタリング / データ解析 / 解析プラットフォーム
【研究成果の概要】
本研究ではデータを持ち出さずに解析を行うプラットフォーム(DAPF)の構築並びにその効果的な運用方法の提案を目的の一つとしている.現在までにクラウドを用いたDAPF(CDAPF),並びにオンプレミスによるDAPF(ODAPF)のそれぞれの構築が完了している.またCDAPFに関しては実運用を開始しており,現在みずほ銀行の実データの解析を行う3つのプロジェクトを実施している.これにより,DAPFの持つべき機能やセキュリティ等が明らかになってきている.またCDAPFについては2021年度に新たにVPN接続を可能にすることにより,大学外からセキュアにデータ解析を可能とした.さらにデータ持ち出しを防ぐためのチェック要件定義を行い,運用の効率化の実施を提案した.
また顧客の消費行動に対するビジネス価値創造のための機械学習に関して,昨今説明性が大変重要になってきている.具体的にはデータの構造推定結果や予測関数の意味などが分析者に理解できる説明性が求められてきている.2021年度はこの説明性に着目して,回帰並びに分類というプリミティブな問題に対して,回帰木(あるいは決定木)に対する生成モデルを設定し,この生成モデルにおけるベイズ最適な予測を決定関数として出力する方法を示し,さらにこれにブースティングを適用することにより,非常に複雑な問題にも良好な性能を示す手法を提案した.この手法は一般化加法モデルの一種となることを示すことができ,説明性を担保することが可能である.これによって時系列の影響を可視化することが可能であり,非定常な場合に拡張が可能になっている.
さらに,ディープラーニングを含む多値分類手法の複数の2値分類器の組合せで行われているが,これを効果的に行う誤り訂正出力符号(ECOC)が提案されている.この手法に対して理論的に最適な符号の構成,並びにその理論的な性能解析を行なった.
【研究代表者】
【研究分担者】 |
平澤 茂一 | 早稲田大学 | 理工学術院 | 名誉教授 | (Kakenデータベース) |
松嶋 敏泰 | 早稲田大学 | 理工学術院 | 教授 | (Kakenデータベース) |
|
【研究種目】基盤研究(C)
【研究期間】2019-04-01 - 2023-03-31
【配分額】4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)