言語・パラ言語の生成・理解能力を有する会話システムに関する研究
【研究分野】知覚情報処理・知能ロボティクス
【研究キーワード】
音声対話 / パラ言語 / 韻律 / ジェスチャ認識 / 対話ロボット
【研究成果の概要】
自然な音声対話コミュニケーションを成立させるための要件を探るための道具として,言語情報の理解・表出機能に加え,パラ言語情報の理解・表出機能を持つ音声対話システムのプロトタイプを作成した.
近年の音声認識・合成の著しい研究成果にも係らず,一般の利用者に広く受け入れられる可能性を感じさせるような,自然性の高い音声対話システムは見られない.この一つの要因が,対話にとって重要な役割を果たすパラ言語情報(顔表情や声表情に含まれる,発話者の内的・心的状態を伝える情報)の軽視にある.しかし,言語・パラ言語をバランスよく扱う対話システムを作る際必要なパラ言語に関する定量的知見はほとんどない。本研究では,パラ言語の役割を定量的に明らかにするための道具として各種の要素技術を開発し,音声対話システムとして組み上げた.
具体的には次に挙げるものを実現した.1)ロボット頭部に設置した4系統の指向性を用いてロボットに適した形で音源定位・音源分離を行う方式を提案した,2)パラ言語の表現を可能とする合成音声方式について検討し,波形合成方式を対象として合成品質を向上させる手法を提案するとともに,高品位な声質の変換方式を提案した.3)音声に含まれるパラ言語情報として,発話態度と相槌/聞き返しを取り上げ,発話に含まれる韻律情報を基にこれらを認識する手法を提案した.4)頭部ジェスチャ・表情等の視覚的情報に含まれるパラ言語情報の認識手法を提案した.5)音声対話システムのプラットフォームとして人間型ロボットROBISUKEの設計,構築を行った.6)各モジュールの理解・生成機能を有機的に統合する情報共有の枠組としてMONEAを提案し,通信ミドルウェアの実装を行った.
今後,これらの成果を利用し,自然な音声対話に必要とされる要件を明らかにするための定量的な実験を行う予定である.
【研究代表者】
【研究分担者】 |
藤江 真也 | 早稲田大学 | 理工学術院 | 客員講師(専任) | (Kakenデータベース) |
小川 哲司 | 早稲田大学 | 理工学術院 | 助手 | (Kakenデータベース) |
松坂 要佐 | 日本学術振興会 | 特別研究員(PD/">(Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】2003 - 2006
【配分額】13,300千円 (直接経費: 13,300千円)