当前位置:首页 > 科技文档 > 电信技术 > 正文

基于语音文本跨模态表征对齐的端到端语音翻译

中文信息学报 页数: 10 2025-12-15
摘要: 端到端语音翻译需要解决源语言语音到目标语言文本的跨语言和跨模态映射,在有限标注数据条件下,建立语音文本表征间的统一映射,缓解跨模态差异是提升语音翻译性能的关键。该文提出语音文本跨模态表征对齐方法,对语音文本表征进行多粒度对齐并进行混合并行输入,基于多模态表征的一致性约束进行多任务融合训练。在MuST-C数据集上的实验表明,该文所提方法优于现有端到端语音翻译跨模态表征相关方法,有... (共10页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报