機械学習によるロングテール現象の解決方法に関する研究
【研究分野】知能情報学
【研究キーワード】
知識発見 / データマイニング / 機械学習 / テキストマイニング / Web / ネットワークデータ / 統計 / 曖昧正解消 / プライバシー保護 / 言語学習 / クラスタリング / 曖昧性解消 / テキスト / 非負行列分解 / GPU / アルゴリズム
【研究成果の概要】
2009年度は当初の予定通り、Webにおける人名検索結果を同姓同名であるが異なる人物ごとにまとめるクラスタリングシステムを開発し、実験的に評価した。2010年度は大規模データ処理のために非負の確率行列分解アルゴリズムを提案し、既存のLDAと同様な性能を得ることを実証し、並列化アルゴリズムにおいては変分ベイズ法をロングテールに対応するPitMan-Yoモデルに適用し高い性能を得た。2011年度は最近注目されているプライバシー保護データマイニングをネットワークデータに応用した。2012年度は、プライバシー保護データマイニングの応用手法と大規模データに適したオンライン学習で、新規な正則化手法を提案した。
【研究代表者】