談話情報を付与したコーパスを用いた音声対話処理の高度化に関する研究
【研究分野】知能情報学
【研究キーワード】
音声対話コーパス / 課題遂行対話 / 談話タグ / 韻律情報 / 形態素情報 / 談話行為情報 / 談話セグメント情報 / 課題逐行対話
【研究成果の概要】
音声対話システムの実現には、対話データが必須であり、形態素や係り受けなどの統語レベルのタグだけではなく、意味レベルや談話レベルでの多様なタグが重要となる。
(1)複数の研究機関で収集されてきた音声対話データを整備し、談話タグ付き音声対話コーパスの作成した。課題遂行タイプの音声対話40対話に対して、音声・転記データフォーマットの統一をはかるとともに、そのコーパスに対して、韻律、形態素、基本単位、談話行為、談話セグメントの情報を付与した。
(2)音声対話コーパスを利用して、対話管理機構、談話タグ予測手法、談話セグメント付与方法について提案するとともに、談話タグを利用した音声対話システム構築法について種々の知見を得た。
・対話潤滑語がどのように現れるかを分析し、相槌の挿入のパターンや打ち方が対話の性質を反映していることを示した。
・話者交替現象を生み出す人間の発話行動を説明する自律モデルを提案した。
・規則学習(Transformation-based learning)を用いて、談話行為タグは推定する方法を示した。
・韻律情報とキーワード情報を利用した2進分類木により、談話行為タグが予測できることと韻律情報が意図推定に有効であることを明らかにした。
・フレーム駆動型対話システムにおいて発話解析の際に必要となる格構造定義と談話目標情報を談話行為タグ付きコーパスから取得する方法を提案した。
・対話例に対して、対話の背景知識の構造に準拠した談話セグメントタグを付与し、音声対話システムの雛型とすることができることを示した。
・音声対話データに対する新たな談話セグメントタグ付与方式を提案した。
・談話セグメントタグ付与の信頼度の改善する方法を検討するとともに、応答表現に着目して,対話セグメントを抽出する方法を提案した。
【研究代表者】