当前位置:首页 > 科技文档 > 电信技术 > 正文

结合单流网络的自监督语音-人脸跨模态学习方法

小型微型计算机系统 页数: 8 2024-12-04
摘要: 现有的非监督语音-人脸跨模态关联学习方法多采用双流网络结构,在降低计算复杂度和实现高效非监督方法方面还面临一些挑战,为了改善模型性能,提高跨模态学习的效率,提出一种结合单流网络的自监督语音-人脸跨模态学习方法.首先,将预处理的两种模态数据送入单流特征提取网络,然后对提取的两种模态特征向量进行基于注意力机制的特征融合得到视频粒度的特征表示用以在线深度聚类,最后使用聚类步骤生成的伪... (共8页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报