CCIG:智能文档处理「新未来」

news2024/11/30 11:27:21

文章目录

  • ⭐️ CCIG大会简介
  • ⭐️ 领先世界的智能文档处理技术
    • 🌟 智能图像处理:为文字识别 "增质提效" 筑基
      • ✨ 切边增强 - 提升文档图像质量
      • ✨ 弯曲矫正 - 解决图像畸变问题
      • ✨ 去摩尔纹 - 保证图像信息完整
    • 🌟 图像预处理整体效果展示
  • ⭐️ 产品介绍 - 信息智能文字识别服务平台

上个月非常有幸的参加了 CCIG大会 ,参会除了收获众多福利品与手办礼之外,在关于我国 “图象图形” 上的发展有了进一步的深刻了解,也看到了国内众多业界前辈门对与 “图像图形” 技术的贡献与追求。

受益良多,虽然时间略晚,但是依然想为各位小伙伴们分享一番,寻找文档图像处理领域的未来进阶方向。


⭐️ CCIG大会简介

CCIG中国图象图形大会(Chinese Congress on Image and Graphics),是中国图象图形学学会的年度旗舰会议,每年举办一次,是涵盖图像图形各专业领域的学术盛会。

中国图象图形学学会经过30余年的发展,团结了一大批图像图形领域优秀人才,拥有29个专业委员会和14个工作委员会,学会凝聚力、学术影响力、平台创新力日益提升,进入了一个全新的发展阶段。

2022年,中国图象图形学学会充分利用丰富的学术资源和平台优势,凝聚图像图形领域知名专家,在20届品牌学术年会全国图象图形学学术会议(NCIG)的基础上,创办中国图象图形大会(Chinese Congress on Image and Graphics,CCIG),来自图像图形领域专家学者以及企业家约1500人参会。CCIG作为中国图象图形学学会的年度旗舰会议,涵盖图像图形各专业领域的综合性的全国性学术会议,面向开放创新、交叉融合的发展趋势,为图像图形相关领域的专家学者和产业界的同仁,搭建了一个展示创新成果、展望未来发展的,集高度、深度、广度三位一体的交流平台。


⭐️ 领先世界的智能文档处理技术

此次 CCIG大会,丁凯博士分享的主题是 "智能文档处理技术在工业界的应用与挑战" 。从最开始的简单的光学字符识别拓展到涵盖图像预处理、文字识别、版面分析、文档理解等多项技术的智能文档处理领域,而且站在合合信息的角度提出了一些技术难题的解决办法。

针对这些难以解决但又被攻克的技术难题,为各位小伙伴做一些针对性的讲解。


🌟 智能图像处理:为文字识别 “增质提效” 筑基

智能图像处理是指利用AI技术,对复杂场景中的图像进行自动识别和要素分析。受拍摄设备、拍摄环境等多方因素的制约,文档原始图像往往存在亮度不均、模糊、背景杂乱、页面残缺、透视变形等多种问题。合合信息智能图像处理技术可帮助各应用领域简化下游文档处理任务,提升后续文字识别的效率与准确性,为全球企业和个人用户提供创新的数字化、智能化服务。

✨ 切边增强 - 提升文档图像质量

合合信息的 "切边增强技术" 可以智能判断照片中主体文档的边缘进行切边,同时增强图像突出文字,可在杂乱的背景中,聚焦到核心的文档内容,大幅度提升文档图像的质量

该技术可以解决以下应用场景,当采集的业务材料图像存在着多余背景、主体过小、角度倾斜等问题时,通过合合信息的切边增强技术,可自动裁切出图像主体区域,并增强图像质量,经过该项处理后再进入后续的文字识别、信息提取、材料审核等业务,提升文档处理速度与质量。



✨ 弯曲矫正 - 解决图像畸变问题

合合信息的 "弯曲矫正技术" 创新性地采用基于位移场网络学习方法的系统构架,可对弯曲地文档进行曲面、透视矫正,同时智能定位文档边缘,能够切除多余背景。

在日常的实际工作场景中,手持镜头拍照得到的文档图像往往存在着复杂的几何形变,包括拍摄视角、纸张本身的折叠、褶皱、弯曲以及厚度等因素,都会造成拍摄图像存在畸变,极大地影响了视觉观感和后续内容识别工作的进行,“弯曲矫正技术” 解决的正是这一痛点难题。




✨ 去摩尔纹 - 保证图像信息完整

在使用相机拍摄电子屏幕,图像上会出现呈现条状、网状、波纹状等多种形态、颜色各异的摩尔纹(也称为屏幕纹)。如果不能进行及时去除,既影响图片观感,叠加在图像上的纹路也会破坏图片原有信息,对后续的内容提炼造成障碍。

而合合信息的 "去摩尔纹技术" 采用多重神经网络技术,通过分析暗角、摩尔纹的形成原理,对图像中存在的干扰因素进行对应处理,可去除所有样式的摩尔纹,同时保证图像信息完整、颜色不失真 ,保证了图像信息的完整性。



🌟 图像预处理整体效果展示

文字检测与识别技术主要对多版式、多格式的文档图像段落、表格、图片等内容信息及其位置关系进行解析、理解,不仅需要产品具备检测多样式版面的能力,也要具备多语言的识别能力,方能服务于更广泛的群体。据权威机构检测,合合信息印刷体文档字符平均识别率为 99.77%,支持全球超50种语言的文字识别与信息提取。


⭐️ 产品介绍 - 信息智能文字识别服务平台

该产品为 “合合信息” 基于智能文字识别技术,融合不同行业和场景,提供200+国内外常见卡证、票据、行业单据、定制场景等高精准度识别产品,广泛用于多个行业和场景,支持安全稳定的云端服务、端侧SDK、私有化部署等多种服务形式。

合合信息智能文字识别服务平台面向企业应用者提供的文档识别标准模块,以及面向开发者的智能文字识别训练平台构成,提升智能文档企业应用及开发效率。并内置了场景丰富的预训练模型,配备专项模型类型,以满足固定版式、半固定版式、不固定版式文档的识别与分类需求,可对单页/多页、任意版式文档,提取自定义的结构化信息。

  • 国内证照:
    • 身份证识别:支持对身份证正反面的全部字段进行结构化识别,包括姓名、性别、民族、出生日期、地址、身份证号、有效期限、签发机关,同时可返回头像切片位置信息,进行头像检测。
    • 银行卡识别:支持对主流银行卡6个关键字段的高精度结构化识别,包括类型、发卡机构、发卡机构代号、有效期、卡号、持有人,同时可返回图像切边位置信息。
    • 驾驶证识别:持对驾驶证正副页全部字段进行结构化识别,包括姓名、类型、驾驶证证号、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有限期限始(至)、总计有效期限。
    • 其他证照识别:组织机构代码证、开户许可证、回乡证、社保卡、护照、户口本、结婚证、离婚证、房产证、军官证、车辆合格证、车辆登记证、车牌号、车辆Vin码、卫生许可证、法人证、港澳通行证台湾保健卡、出生证明、不动产证等证照识别。
  • 国内票据:
    • 国内通用票据识别:支持对多种票据类型(多票据)票据切分、票据分类、票据识别,包括增值税普通发票、增值税普通发票(卷票)、增值税专用发票、增值税电子普通发票、货物运输业增值税专用发票、增值税销货清单和其他可报销票据。
    • 火车票识别:支持对任意方向旋转的红、蓝火车票12个字段智能识别为结构化文本,包括火车票红色编码、检票口、出发地、车次号、乘车时间、乘客信息等。
    • 其他票据识别:电子承兑汇票识别、通用机打发票识别、通用机打发票识别、二手车购车发票识别、商铺小票识别、公路客运发票识别、海关进出口货物报关单识别、票据分类、发票验真、银行回执单识别、增值税发票识别等。
  • 海外证件:
    • 马来西亚身份证识别:支持对马来西亚身份证中所有字段进行结构化识别,并提供切边头像。
    • 日本驾驶证识别:对日本驾驶证中姓名、住所、生日、交付日期、有效期、个人番号6个关键字段识别,输出结构化中文文本结果。
    • 菲律宾身份证识别:对菲律宾身份证全部7个字段进行结构化识别,支持单个或批量上传扫描件或拍照图像

此外,合合信息智能文档处理系统还具备数据回流功能,将实际业务中产生的标注信息数据回流进行训练,实现了在业务场景中越用越好用”的持续迭代效果,持续提升识别精度,真正做到了智能化和终身学习。


以上就是此次大会当中,我所收获的内容。 不知道有没有同样参会的小伙伴,或者 "图象图形领域" 的小伙伴有不同的意见啊,欢迎大家留言,让我们一起碰撞出思维上的火花,没准可以 “撞” 出可落地的新思路呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/572046.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

汇编基础知识

1.汇编工程流程: 汇编指令--->编译器--->机器码--->计算机 2.汇编语言组成: 1.汇编指令 2.伪指令 3.其他符号 3.存储器: 存放指令与数据的容器,也叫内存. 存储器被划分为多个单元,并且从0开始按钮顺序编号,这些编号视为存储器的存储单元的地址. 4.指令与…

《Cocos Creator游戏实战》老虎机抽奖效果实现思路

在线体验地址 Cocos Creator | SlotMachine Cocos Store 购买地址(如果没有显示,那就是还在审核): https://store.cocos.com/app/detail/4958微店购买地址: https://weidian.com/item.html?itemID6338406353运行效果…

平板用什么远程操控电脑

现在的第三方专业远程软件大部分支持跨平台连接,要使用平板电脑远程控制电脑,还是很简单的。一般来说按照以下步骤操作即可。 确保两台设备都连接到互联网 确保您要控制的电脑和平板电脑都通过 Wi-Fi 或移动数据连接到互联网。 安装远程控制应用程序 …

设计事务所项目管理指南

在数字化的浪潮下,各行各业都面临着升级转型的问题。对设计团队而言,传统的管理方式已经无法满足日益前进的团队需求。 设计事务所可能存在的管理问题: 1,项目过程中信息流通慢,成员工作进度无法及时同步; …

结构型设计模式01-装饰模式

✨作者:猫十二懿 ❤️‍🔥账号:CSDN 、掘金 、个人博客 、Github 🎉公众号:猫十二懿 装饰模式 1、 问题引入 要实现一个简单的个人形象系统,使用控制台输出的形式,简单说明搭配着装 Person pa…

【快应用】响应式布局适配横竖屏或折叠屏

【关键词】 响应式布局、折叠屏、横竖屏 【问题背景】 当前开发者在开发快应用时,往往将designWidth设置为设备屏幕的宽度,这时,应用的内容会随着设备宽度的变大而拉伸显示,导致在大屏、横屏、折叠屏展开时显示效果不好。 在折…

PMP考试应该要如何备考?如何短期通过PMP?

我从新考纲考完下来,3A通过了考试,最开始也被折磨过一段时间,但是后面还是找到了方法,也算有点经验,给大家分享一下吧。 程序猿应该是考PMP里面人最多的,毕竟有一个30大坎,大部分人还是考虑转型…

微信小程序button按钮设置宽度无效

button按钮设置宽度无效 背景: 在开发小程序的过程中,遇到了button按钮设置宽度无效的问题 微信客户端 7.0 开始,UI 界面进行了大改版。小程序也进行了基础组件的样式升级,涉及的组件有 button,icon,radio,checkbox,switch,sli…

手把手教你在昇腾平台上搭建PyTorch训练环境

PyTorch是业界流行的深度学习框架,用于开发深度学习训练脚本,默认运行在CPU/GPU上。在昇腾AI处理器上运行PyTorch业务时,需要搭建异构计算架构CANN(Compute Architecture for Neural Networks)软件开发环境&#xff0c…

《花雕学AI》36:探索Aski AI——集成问答、写作和绘画功能的强大AI平台

引言:人工智能是当今时代的最热门和最有前途的技术之一,它可以帮助人类解决各种复杂和有趣的问题,提高生活和工作的效率和质量。然而,人工智能的应用还面临着许多挑战和局限,比如数据的稀缺和质量、算法的复杂性和可解…

CompletableFuture详解-初遇者-很细

目录 一、创建异步任务 1. supplyAsync 2. runAsync 3.获取任务结果的方法 二、异步回调处理 1.thenApply和thenApplyAsync 2.thenAccept和thenAcceptAsync 2.thenRun和thenRunAsync 3.whenComplete和whenCompleteAsync 4.handle和handleAsync 三、多任务组合处理 1…

Git的安装及基础命令

一. 安装Git 首先请前往Git官网去下载最新的安装包:https://git-scm.com/download/win 运行下载好的 .exe 文件,一路next即可。 右击桌面出现以下两个就算是成功。 安装完成后,需要设定用户名和邮箱来区分不同的用户。右击屏幕,选择“Git Bash Here”…

​Lambda表达式详解​-初遇者-很细

目录 Lambda简介 对接口的要求 Lambda 基础语法 Lambda 语法简化 Lambda 表达式常用示例 lambda 表达式引用方法 构造方法的引用 lambda 表达式创建线程 遍历集合 删除集合中的某个元素 集合内元素的排序 Lambda 表达式中的闭包问题 Lambda简介 Lambda 表达式是 JD…

骑行,为日益冷漠的人际关系加点温度

随着社会的发展和人们生活水平的提高,越来越多的年轻人、老年人和中年人开始关注健康和运动。而骑行作为一种健康、环保、经济实惠的运动方式,受到越来越多人的喜爱。本文将从社会面探讨这些话题对于不同人群的影响。 首先,骑行对身体有着多方…

狂飙,从功能测试转到自动化测试,我的测试之路涨了20k...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 Python自动化测试&…

《四》Git 中的远程仓库

SSH 登录: 每个远程仓库都有两种地址:HTTPS 和 SSH。如果是 HTTPS 的地址,每次 push 的时候都要输入用户名和密码以校验身份。如果 SSH 的方式,就不再需要每次都输入用户名和密码了。 cd ~ 进入用户的家目录,执行 ss…

ChatGPT在智能外呼机器人领域的应用

随着人工智能技术的不断发展,自然语言处理(NLP)技术也逐渐成为各行各业的热门技术。其中,ChatGPT技术是近年来备受关注的技术之一。ChatGPT技术是一种基于自然语言处理和深度学习的人工智能技术,它可以处理自然语言文本,实现自动化…

Maven 概述及下载安装

一、为什么要学习 Maven 我们构建一个项目需要用到很多第三方的类库,就需要引入大量的jar包,并且Jar包之间的关系错综复杂,缺少任何一个Jar包都会导致项目编译失败。Maven 能帮助我们下载及管理依赖。 本地项目代码开发完成后,我…

如何在华为OD机试中获得满分?Java实现【字母组合】一文详解

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题(2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述…

Android:如何从源码编译OpenCV4Android库

原文摘自知乎网友稚晖的文章《如何从源码编译OpenCV4Android库》 https://blog.csdn.net/LateLinux/article/details/111149544 我在这里根据自己的经验,增加一些备注。 1.需要的工具和源码: opencv4.1(opencv4.6也可以编译通过&#xff09…