当前位置:首页 > 科技文档 > 计算机软件及计算机应用 > 正文

基于场景图知识的文本到图像行人重识别

模式识别与人工智能 页数: 13 2024-11-15
摘要: 现有的大多数文本到图像的行人重识别方法对CLIP(Contrastive Language-Image Pretraining)等视觉语言模型进行微调以适应行人重识别任务,并获得预训练模型的强大视觉语言联合表征能力,然而,这些方法通常只考虑对下游重识别任务的任务适应,却忽视由于数据差异所需的数据域适应,难以有效捕获结构化知识(理解对象属性及对象间关系).针对这些问题,基于CLI... (共13页)

开通会员,享受整站包年服务