大規模テキストを対象とした質問応答技術の高度化に関する研究
【研究分野】知能情報学
【研究キーワード】
質問応答 / 対話処理 / テキスト処理 / 情報アクセス / 情報検索 / 情報抽出
【研究成果の概要】
大規模テキストを対象とした質問応答とは,利用者からの任意の質問に対して,蓄積された大規模テキストを参照して回答するというもので,質問という形で受け取った利用者の興味関心に基づき,利用者が真に必要とした情報だけを提供することを可能とする.本研究は,この質問応答技術を高度化し,利用者を中心に据えた高度な情報アクセス手段として確立することを目指し,以下の成果を得た.
高度化の第一の方向性として,現状の一問一答型の質問応答技術から,複数の関連した質問に連続して対話的に解答することが可能となる質問応答技術への展開を図った.利用者のレポート作成支援を行うシステムを想定し,その状況でどのような質問がなされるか,それらの質問に適切に解答するためにはどのような処理が必要かの調査検討を行った.その結果に基づき,そのような状況で必要となる質問応答システムの能力を定量的に測定するタスクの提案とテストセットの構築を行った.これを用いて現状システムを分析し,質問応答技術は文脈処理の点でまだ改善の余地があること,正解の列挙を求めるリスト型質問については理論的に未整理の問題が残されていること等を明らかにした.
高度化の第二の方向性として,テキストを中心とした質問応答技術からグラフ等の視覚的なモードを利用したマルチモーダルな質問応答技術への展開を行った.その中で,質問に解答するための適切なグラフの選択は利用者の意図に依存すること,その意図が文脈処理を通じて明らかにできることを示した.このマルチモーダル質問応答を更に発展させ,質問応答技術を情報可視化技術,文書要約技術と結びつける研究トピック「動向情報の要約と可視化」を提示し,研究の枠組みを提案すると共に,研究のためのデータセットを作成した.特に新聞記事に対して,要約と可視化の観点から意味的な情報を注釈づけるための仕様の設計を行い,注釈付きコーパスを作成した.
【研究代表者】
【研究分担者】 |
中澤 恒子 | 東京大学 | 大学院・総合文化研究科 | 助教授 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2002 - 2004
【配分額】14,400千円 (直接経費: 14,400千円)