ガウス過程回帰に基づく音声合成技術の確立
【研究分野】知覚情報処理
【研究キーワード】
テキスト音声合成 / 統計的パラメトリック音声合成 / 韻律生成 / ガウス過程回帰 / GPR音声合成 / HMM音声合成 / 機械学習 / 深層学習 / 音声情報処理 / 深層ガウス過程
【研究成果の概要】
多様で表情豊かな音声合成の実現に向け,統計的パラメトリック音声合成の新たな枠組みであるガウス過程回帰に基づく音声合成(GPR音声合成)技術の確立をめざして研究を行った。ガウス過程回帰に基づいたスペクトルパラメータ生成に加え,基本周波数および音韻継続長予測からなる韻律生成手法を提案し,GPR音声合成システムを構築した。評価実験を通してGPR音声合成手法の有効性を示すとともに,多様な話者性やスタイルによる音声合成への応用,従来手法では合成音声の韻律の自然性が不十分であった声調言語への適用を検討し,提案手法の有用性を示した。
【研究代表者】
【研究分担者】 |
郡山 知樹 | 東京工業大学 | 工学院 | 助教 | (Kakenデータベース) |
|
【研究協力者】 |
Moungsri Decha | |
長濱 大樹 | |
能勢 隆 | |
Arifianto Dhany | |
|
【研究種目】基盤研究(B)
【研究期間】2015-04-01 - 2018-03-31
【配分額】13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)