合合信息OCR支持30类国内常见票据一站式分类识别,支持医疗发票、数电票识别

news2024/11/25 16:28:53

合合信息TextIn平台明星产品——国内通用票据识别,重磅更新!

产品支持票据类型扩展到23大类、30小类,覆盖场景更全面,同时升级优化了多款票据识别模型,平均识别率较前版本提升11.5%,整体识别速度提升21.9%,识别更快更精准。

▶ 支持多种票据类型

国内通用票据识别依托合合信息多年积累的票据文字OCR识别能力,可识别包含增值税发票、医疗发票、数电票、火车票、出租车发票、飞机行程单、网约车行程单等在内的23大类、30小类国内通用票据,提取其中的信息,并以整理成标准结构化的Key/Value形式返回或导出。

· 医疗票据

国内通用票据识别支持电子医疗发票、纸质门诊发票、纸质住院发票的识别与信息抽取,兼容多种地区版式,精准识别复杂表格信息,助力医保报销、健康险理赔流程自动化。

· 数电票

全面数字化的电子发票(数电票)是与纸质发票具有同等法律效力的新型发票。2022年,国票信息发票通企业数字化税务协同管理平台全新升级数电票功能。2023年12月,数电票试点覆盖到西藏,彻底覆盖全部省/直辖市。

国内通用票据识别支持增值税电子普通发票、增值税电子专用发票、铁路电子客票、航空运输电子客票行程单、区块链电子发票等数电票的票面信息识别,为不满足乐企系统(数电票管理平台)接入条件的小微企业的财务数字化、自动化转型提供有力支持。

▶ 支持多种票据格式

国内通用票据识别支持识别jpg、png、bmp、tiff等多种通用图片格式,以及PDF、OFD格式。

其中,OFD格式作为我国电子学会牵头制定的国家标准,于2009年首次发布,2020年被指定为“增值税电子普通发票”标准文件格式。国内通用票据识别支持全票种多页OFD格式,为有强自动化、批处理需求的用户提供更好的体验。

· 自动分类票种

票据识别OCR多用于报销或审核场景,但具体票据类别难以预测。传统的票据分类方法通常针对某一票面提供单一的API接口,在高吞吐量、多票面场景下难以应对。国内通用票据识别经过深度优化,提供单接口调用服务,自动分类票种并返回识别结果,大幅简化集成难度。用户上传票据时无需手动选择类型,直接上传票据图像,系统即可智能识别类型。

· 图像智能处理,混贴切分

企业报销场景中,常常要求将报销票据黏贴在一页A4纸上。面对混贴多张票据的图像,国内通用票据识别可清晰区分票据,自动切边提取票面信息,智能识别票据类型,便捷切换展示分类识别结果,支持多类票据批量上传、混合扫描、切图、分类、识别。同时对旋转、角度不正的票据图像,也可自动旋转矫正图像,不影响识别效果。

▶ 产品亮点

· 识别准确率高:针对各类票据的打印方式和字体进行专项优化,对针式打印、油墨略微污损的文字提供更高的识别准确率。全票种平均识别率94%以上,增值税发票、电子医疗发票、数电票等常用票种平均识别率可达97%以上。

·识别速度快:平均0.6秒即可完成单次识别。

·适用范围广:支持23大类、30小类的国内主流通用票据类型,支持jpg、png、pdf、ofd等多种文件格式,支持单页、多页文件上传,能满足各类业务场景需求。

·简易集成:标准化API接口,支持智能分类,无需手动指定。

▶ 多种方式灵活部署

国内通用票据识别支持私有化部署、公有云API等多种部署方式,提供前端识别预览和标准化JSON结果。

传统OCR服务中,支持私有化服务的产品往往无法在线试用,而能在线试用的产品又难以原样部署到本地,导致在项目或业务中的不同阶段,验证OCR服务的性能和能力边界变得困难。

合合信息TextIn产品系列采用多端同步引擎架构,确保在线SaaS服务版本与私有化版本的引擎一致性,保障两者提供几乎一致的识别率和性能表现,让在线验证、线下部署成为可能。私有化部署支持CPU、GPU环境及国产化操作系统部署。

同时,SaaS版本和私有化版本还可以简单构成混合云架构,提供灵活的补位选择,满足复杂应用需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035805.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于k8s的Pod控制器

目录 1.Pod控制器及其作用 2.pod控制器类型 2.1 ReplicaSet: 2.2 Deployment 2.3 DaemonSet 2.4 StatefulSet 2.5 Job 2.6 Cronjob 3.Pod与控制器之间的关系 3.1 Deployment 3.2 SatefulSet 3.3 DaemonSet 3.4 job 3.5 cronjob 1.Pod控制器及其作用 Pod控制器&am…

北京某银行成功替换F5!更多实施细节曝光→

随着国家对金融行业技术创新的持续关注,金融行业的诸多用户正积极开展业务系统的数字化创新。 在这一领域,保障业务稳定性和连续性始终是最重要的议题。今天,为大家介绍的最佳实践来自北京某银行,他们通过积极探索和评估&#xf…

Python酷库之旅-第三方库Pandas(078)

目录 一、用法精讲 321、pandas.Series.str.len方法 321-1、语法 321-2、参数 321-3、功能 321-4、返回值 321-5、说明 321-6、用法 321-6-1、数据准备 321-6-2、代码示例 321-6-3、结果输出 322、pandas.Series.str.ljust方法 322-1、语法 322-2、参数 322-3、…

HMAC算法:构建安全认证的基石

在信息安全领域,数据完整性和认证是至关重要的。HMAC(Hash-based Message Authentication Code)算法作为一种基于哈希的消息认证码,广泛应用于数据传输过程中的安全认证。本文将带你了解HMAC算法的原理、特点及其应用场景。 HMAC算…

全方位解析RAG技术:从概念理论到代码实操,一文助你掌握检索增强生成的精髓!

一、LLMs 已经具备了较强能力了,为什么还需要 RAG(检索增强生成)? 尽管 LLM 已展现出显著的能力,但以下几个挑战依然值得关注: 幻觉问题:LLM 采用基于统计的概率方法逐词生成文本,这一机制内在地导致其可能出现看似…

Git基础使用教程

版本控制手册 本文中出现的 [ ] 为根据需求自行修改的变量。 基本命令 git init:将当前目录配置成git仓库,信息记录在隐藏的.git文件夹中。 git config --global user.name [xxx]:设置全局用户名,信息记录在~/.gitconfig文件中。…

厦门商家微信小程序、抖音、支付宝小程序同步上线

想要迅速在厦门开设微信小程序店铺?乔拓云网站提供了简便快捷的解决方案。只需四步,轻松复制模板,定制内容,即可上线专属小程序。 首先,访问乔拓云官网,完成免费注册,轻松获得您的专属账号。不论…

winform程序集的名称

1.更改程序集名称后 AssemblyInfo.cs中也要手动更改 2.鼠标放在程序集上右键,点击最后一栏 “属性” 3.更改Settings.Designer.cs中的名称 4.可能还有别的地方需要改,可以搜索旧名称来找到需要更改的地方进行更新。 PS: 当更改程序集名称时,…

图算法系列1: 图算法的分类有哪些?(上)

大约在公元9世纪上半叶,来自中亚古国花剌子模的波斯数学家花剌子米(al-Khwarizmi)先后出版了两本对数学界有深远影响的书籍《印度数字算术》与《代数学》​,前者在12世纪被翻译为拉丁文传入欧洲,十进制也因此传入欧洲,最终所形成的…

DLL文件损坏怎么办?10种DLL修复方法帮你搞定

在日常使用Windows电脑时,我们常常遇到应用程序无法打开、系统崩溃甚至蓝屏的问题,背后原因往往是DLL文件的损坏或丢失。DLL文件是系统和软件运行的关键部分,一旦出现问题,会严重影响我们的日常操作。为了避免这些困扰&#xff0c…

字符串 - 反转字符串

344. 反转字符串 方法一&#xff1a;双指针 /*** param {character[]} s* return {void} Do not return anything, modify s in-place instead.*/ var reverseString function(s) {let l -1, r s.length;while(l < --r) [s[l], s[r]] [s[r], s[l]]; };

车身域测试学习、CANoe工具实操学习、UDS诊断测试、功能安全测试、DTC故障注入测试、DBC数据库、CDD数据库、CAN一致性测试、ECU刷写测试

每日直播时间&#xff1a;&#xff08;直播方式&#xff1a;腾讯会议&#xff09;周一到周五&#xff1a;20&#xff1a;00-23&#xff1a;00周六与周日&#xff1a;9&#xff1a;00-17&#xff1a;00 进腾讯会议学习的&#xff0c;可以关注我并后台留言 直播内容&#xff1a;&…

HTB-Permx靶机笔记

Permx靶机笔记 概述 permx靶机是HTB的简单靶机&#xff0c;这台靶机整体考验渗透人员的信息搜集能力&#xff0c;可以收只有信息搜集的快速&#xff0c;才能快速拿到它的flag。 整体是比较简单的靶机 靶机连接&#xff1a;https://app.hackthebox.com/machines/PermX 一、…

B3-111-A 小型挂轨式巡检机器人:智能巡检的突破之

在现代工业自动化与智能化的浪潮中&#xff0c;巡检机器人的应用日益广泛&#xff0c;为各类复杂环境下的设备巡检与运维提供了强有力的支持。杭州旗晟智能科技有限公司推出的B3-111-A小型挂轨式巡检机器人&#xff0c;凭借其小巧的机身、精准的巡检能力和智能化的管理系统&…

无字母数字命令执行

目录 源码 PHP7版本 PHP5版本 发现的现象和思考 源码 <?php if(isset($_GET[code])){$code $_GET[code];if(strlen($code)>35){die("Long.");}if(preg_match("/[A-Za-z0-9_$]/",$code)){die("NO.");}eval($code); }else{highlight_…

重修设计模式-行为型-状态模式

重修设计模式-行为型-状态模式 先了解一下状态机的概念&#xff0c;状态机是软件编程中对一种状态场景的抽象表达&#xff0c;构成状态机三要素是&#xff1a;状态&#xff08;State&#xff09;、事件&#xff08;Event&#xff09;、动作&#xff08;Action&#xff09;&…

basic_pentesting_2靶机

靶机地址&#xff1a;Basic Pentesting: 2 ~ VulnHub 攻击机kali和靶机要设在同一网段&#xff0c;查看靶机MAC地址&#xff1a; 一、信息收集 扫描目标主机 arp-scan -l 使用nmap扫描靶机开放的端口&#xff1a; nmap -A -sS -sV -v -p- 192.168.7.127 浏览器访问80端口&a…

数据中心安全建设整体解决方案(DOC原件22页)

数据中心的安全体系建设并非安全产品的堆砌&#xff0c;它是一个根据用户具体业务环境、使用习惯、安全策略要求等多个方面构建的一套生态体系&#xff0c;涉及众多的安全技术&#xff0c;实施过程需要涉及大量的调研、咨询等工作&#xff0c;还会涉及到众多的安全厂家之间的协…

2024接口自动化测试高频面试题!

一、json和字典的区别&#xff1f; json就是一个文本、字符串&#xff1b;有固定的格式&#xff0c;格式长的像python字典和列表的组合&#xff1b;以key-value的键值对形式来保存数据&#xff0c;结构清晰&#xff0c;。可以说是目前互联网项目开发中最常用的一种数据交互格式…

如何判定一个加密软件是否可靠

一、加密算法的安全性 算法类型&#xff1a;选择采用公认的高安全性加密算法的软件&#xff0c;如AES&#xff08;高级加密标准&#xff09;、RSA等。这些算法经过广泛验证&#xff0c;具有强大的加密能力。 密钥长度&#xff1a;较长的密钥长度能够增加破解难度&#xff0c;…