ウィキペディアのモデル化に基づく解説型テキストの自動生成
【研究分野】知能情報学
【研究キーワード】
自然言語処理 / World Wide Web / ウィキペディア / 情報検索 / 用語説明 / 説明の観点 / 機械学習 / クラスタリング
【研究成果の概要】
本研究は,様々な用語に関する説明を効率よく活用することを目的として,ウェブページの集合からウィキペディア記事のような解説型テキストを自動的に生成する手法について研究した.動物名や病名といった用語の種類によって説明に必要な観点が異なるため,ウィキペディアの記事集合から観点に基づく用語説明のパターンを学習する.用語の種類に応じて検索結果から必要な文章が抽出され,解説型テキストとして統合される.
【研究代表者】
【研究分担者】 |
徳永 健伸 | 東京工業大学 | 情報理工学(系)研究科 | 教授 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2010 - 2012
【配分額】17,940千円 (直接経費: 13,800千円、間接経費: 4,140千円)