基于BERT的Fast Speech2语音合成系统韵律增强研究(英文)
摘要: 传统的FastSpeech2虽然具有较高的生成效率和语音自然度,但在韵律建模方面仍有局限,尤其是缺乏语义和韵律之间的有效联系。为了提高合成语音在节奏表达方面的性能,本研究基于BERT预训练语言模型,提出了ProsodySpeech语音合成系统。通过引入了预训练语言模型适配器(Pre-trained Language Model Adapter,PLM Adapter)和语义-韵... (共12页)
开通会员,享受整站包年服务