在使用表格识别工具时,确保识别准确性的关键在于以下几个方面:
1.图像质量:确保扫描或拍摄的图像清晰,无遮挡、无反光、无阴影,并且文字清晰可辨 。
2.预处理图像:在图像送入OCR识别之前,进行预处理,如去噪、二值化、旋转校正等,以提高图像的清晰度和可识别度 。
3.选择正确的识别工具:选择一个具有高识别准确率的OCR工具,不同工具的识别准确率、处理速度、支持的语言和格式可能不同 。
4.训练和优化识别算法:如果可能,使用更多的训练数据和改进算法模型来提高算法的泛化能力和准确率 。
5.多模态融合:如果票据包含图像、二维码等其他信息,使用多模态识别技术提高识别的准确性 。
6.系统集成:将OCR票据识别技术与其他系统(如财务软件、ERP系统等)进行集成,以实现自动化的财务处理流程 。
▶如何用深度学习技术保证表格识别的准确性?
表格识别主要包括表格检测和表格结构识别两大任务。表格检测主要检测表格主体,即从图片中确认表格区域;表格结构识别是对表格区域进行分析,提取表格中的数据与结构信息,得到表格的行列逻辑结构。两大任务均具有相当的复杂性。
首先,表格类别多样,根据有无边框可以分为有线表、少线表、无线表等。从有线表、少线表到无线表,表格识别难度逐渐增加。同时,表格文件中常见的背景填充、单元格行列合并等情况,会进一步增加表格识别难度。其他外部因素,如图片倾斜褶皱、背景干扰等问题,都会对表格识别带来挑战。
合合信息以其高精确度表格识别技术大幅节省文件处理时间,作为其智能文字识别技术的核心部分,显著提升了图像处理和复杂场景下文字识别的能力。合合信息智能文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,包括有线表,三线表,无线表等,并且支持合并单元格、多表格并存等复杂情况的识别
·无线表识别难点
无线表识别是表格识别中的难点,教科书上的部分统计表、药品配方表,都存在框线不完整甚至无框线的情况。无线表缺少表格线,直接套用有线表识别方案无法得到理想的表格结构。合合信息无线表识别采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。
合合信息通用智能文字识别引擎对无线表格进行识别
·B端领域应用
B端领域中,作为合合信息智能文字识别引擎中的重要模块,表格识别技术已落地在银行、证券、保险、制造、物流等近30个行业中,广泛应用于发票、合同、财报、银行流水、物流单据识别等多个场景。除了通用表格识别模块产品外,合合信息还推出了财报机器人、合同机器人、票据机器人等内置表格识别引擎的场景化智能文档处理系统。
以财务场景为例,合合信息表格识别技术被应用于企业发票与订单的数字全流程管理中,曾助力全球知名汽车零配件供应商伟巴斯特实现票据智能扫描、识别、验真、合规自动检查、发票与订单数据匹配、数字化数据、影像留存等全流程财税管理,作业效率提升500%~1000%。
合合信息表格识别技术受到了学术界与行业的共同认可,在2019年国际文档分析识别大会(ICDAR)中,荣获表格识别竞赛冠军。公司智能文字识别相关技术还在国际顶会ICPR、ICFHR等竞赛中获得十余项冠军,并于CVPR、AAAI、ACL、ACM MM等国际顶会上发表。