当前位置:首页 > 科技文档 > 电信技术 > 正文

基于中文语义-音韵信息的语音识别文本校对模型

通信学报 页数: 15 2022-11-24
摘要: 为了研究拼音对检测和纠正语音识别文本错误的影响,提出了一种基于中文语义-音韵信息的文本校对模型。定义了5种拼音编码方法构建字符-音韵嵌入向量,以此作为基于GRU的Seq2Seq模型的输入,并应用注意力机制提取语句的语义-音韵信息来校对语音识别文本错误。针对标注语料不足的问题,提出了一种基于拼音声韵置换的数据增强方法。在AISHELL-3公开数据集的实验结果表明,拼音携带的音韵信... (共15页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报