当前位置:首页 > 科技文档 > 软件 > 正文

基于Mamba多尺度特征提取的密集视频描述方法

红外与激光工程 页数: 13 2025-11-25
摘要: 密集视频描述旨在从视频中提取多个关键事件并生成连贯的文本描述,可广泛应用于自动讲解、人机交互、视频检索以及辅助视障人士日常生活等场景。现有方法存在对视频中短时、长时等多尺度事件特征提取不足,以及视频重复帧或相似帧特征信息冗余的问题,这导致现有方法生成的视频描述缺失细节信息,连贯性和准确性较低。针对这一问题,研究提出了一种基于Mamba多尺度特征提取的密集视频描述模型(Mamba... (共13页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报