当前位置:首页 > 科技文档 > 计算机软件及计算机应用 > 正文

视觉Transformer(ViT)发展综述

计算机科学 页数: 16 2024-10-12
摘要: 视觉Transformer(Vision Transformer, ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对近年来ViT的发展进行概述。首先,简要回顾了ViT的基本原理及迁移过程,并分析了ViT模型的结构特点和优势;然... (共16页)

开通会员,享受整站包年服务