当前位置:首页 > 科技文档 > 水产和渔业 > 正文

基于位置编码重叠切块嵌入和多尺度通道交互注意力的鱼类图像分类

计算机应用 页数: 8 2024-03-12
摘要: 水下鱼类图像分类是一项极具挑战性的任务。传统Vision Transformer (ViT)网络骨干的局限性较大,难以处理局部连续特征,在图像质量较低的鱼类分类中效果表现不佳。为解决此问题,提出一种基于位置编码的重叠切块嵌入(OPE)和多尺度通道交互注意力(MCIA)的Transformer图像分类网络PIFormer (Positional overlapping and I... (共8页)

开通会员,享受整站包年服务