当前位置:首页 > 科技文档 > 计算机软件及计算机应用 > 正文

视觉富文档理解预训练综述

计算机科学 页数: 18 2024-08-26
摘要: 视觉富文档指语义结构不仅由文本内容决定,还与排版格式和表格结构等视觉元素相关的文档。现实生活中的票据理解和证件识别等应用场景,都需要对视觉富文档进行自动化的阅读、分析和处理。这一过程即为视觉富文档理解,属于自然语言处理和计算机视觉的交叉领域。近年来,视觉富文档理解领域的预训练技术在打破下游任务的训练壁垒和提升模型表现上取得了重大的进展。然而,目前对现有的预训练模型的归纳总结和深... (共18页)

开通会员,享受整站包年服务