当前位置:首页 > 实用文档 > 计算机软件及计算机应用 > 正文

融合答案掩码的视觉问答模型

中国图象图形学报 页数: 13 2023-11-16
摘要: 目的 现有的视觉问答模型由于受到语言先验的影响,预测准确率不高。虽然模型能够根据数据集中问题和答案的统计规律学习到它们之间简单的对应关系,但无法学习到问题和答案类型之间深层次的对应关系,容易出现答非所问的现象。为此,提出了一种使用答案掩码对预测结果中的无关答案进行遮盖的方法,迫使模型关注问题和答案类型之间的对应关系,提高模型的预测准确率。方法 首先对数据集中的答案进行聚类并为每...