玩转OCR | 腾讯云智能结构化OCR初体验

news2025/1/3 4:12:20

        随着数字化进程的加速,光学字符识别(OCR)技术已逐渐成为提高企业生产力、优化工作流的重要工具。腾讯云智能结构化OCR凭借其领先的技术、广泛的应用场景和灵活的定制化能力,正在帮助各行业客户更高效地进行文档处理与数据提取。本文将为您介绍腾讯云智能结构化OCR的功能特点、技术优势以及实际应用案例,帮助您快速掌握这一高效的文档自动化解决方案。

 

一、产品概述与核心优势

在信息爆炸的时代,企业每天需要处理大量的文档、发票、表单等数据。这些数据大多以纸质或图像的形式存在,而传统的人工录入不仅费时费力,而且容易出现误差。OCR技术作为一种能够自动识别文档内容的技术,逐渐成为了解决这一问题的有效方案。

腾讯云智能结构化OCR,作为一款面向各行业的智能文档处理工具,凭借其精准的识别能力和高效的数据提取能力,得到了各行各业客户的广泛应用。无论是企业日常的财务报表、医疗文档,还是法律合同、身份证件,腾讯云OCR均能实现高效的自动化识别与数据提取。

该产品采用了最先进的深度学习算法,通过多模态大模型技术,结合了图像识别、自然语言处理等多种技术,能够处理各种复杂的文档类型,确保高精度和高可靠性。

核心优势:

功能特点描述
高精度识别支持中英文、复杂排版、混合语言等多种格式,识别精度高达99%以上。
多场景支持适用于身份证、银行卡、发票、合同、票据等多种文档类型,覆盖财务、法律、医疗等多个行业。
灵活定制支持根据行业需求和企业特定场景进行定制化开发,满足各种应用场景。
快速集成提供丰富的API接口,支持快速集成到现有的业务系统中,帮助企业提高工作效率。

 

二、功能亮点

        腾讯云智能结构化OCR提供了强大的文档识别和数据提取能力,以下是几个核心功能模块:

1. 证件识别

        营业执照是企业经营合法性的证明,广泛应用于商业注册、财务审计等多个领域。腾讯云智能结构化OCR支持对营业执照的精准识别,能够提取企业名称、注册号、法定代表人、注册资本、成立日期等关键信息,极大提升了企业信息的自动化提取效率。

        我们以下面的营业执照为例,在线调用腾讯云OCR API 进行识别。

 我们先用在线工具,将图片转成base64编码

复制到腾讯云OCR API的请求参数中,进行识别。

识别结果如下:

 

我们也可以使用代码来调用腾讯云OCR API。

调用 API 代码示例:

import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.ocr.v20181119 import ocr_client, models
try:
    # 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密
    # 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305
    # 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
    cred = credential.Credential("SecretId", "SecretKey")
    # 实例化一个http选项,可选的,没有特殊需求可以跳过
    httpProfile = HttpProfile()
    httpProfile.endpoint = "ocr.tencentcloudapi.com"

    # 实例化一个client选项,可选的,没有特殊需求可以跳过
    clientProfile = ClientProfile()
    clientProfile.httpProfile = httpProfile
    # 实例化要请求产品的client对象,clientProfile是可选的
    client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)

    # 实例化一个请求对象,每个接口都会对应一个request对象
    req = models.BizLicenseOCRRequest()
    params = {
        "ImageBase64": "************testbase64**************"
    }
    req.from_json_string(json.dumps(params))

    # 返回的resp是一个BizLicenseOCRResponse的实例,与请求对象对应
    resp = client.BizLicenseOCR(req)
    # 输出json格式的字符串回包
    print(resp.to_json_string())

except TencentCloudSDKException as err:
    print(err)

2. 票据识别

在财务报销、物流发票、电子票据等领域,自动化票据识别是提高效率的关键。腾讯云OCR可以精确识别各类票据的内容,包括票号、日期、金额、税号等信息,且支持多种票据格式。

我们以下面的发票为例,在线调用腾讯云OCR API 进行识别。

 

 

这个发票的图片是在线的,我没直接复制链接到腾讯云OCR API的请求参数 URL 中,进行识别。

识别结果如下:

可以看到增值税发票的内容明细被轻松识别出来了。

同理,也可以用代码调用。

调用 API 代码示例:

try{
  Credential cred = new Credential("SecretId", "SecretKey");
  // 实例化一个http选项,可选的,没有特殊需求可以跳过
  HttpProfile httpProfile = new HttpProfile();
  httpProfile.setEndpoint("ocr.tencentcloudapi.com");
  // 实例化一个client选项,可选的,没有特殊需求可以跳过
  ClientProfile clientProfile = new ClientProfile();
  clientProfile.setHttpProfile(httpProfile);
  // 实例化要请求产品的client对象,clientProfile是可选的
  OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);
  // 实例化一个请求对象,每个接口都会对应一个request对象
  VatInvoiceOCRRequest req = new VatInvoiceOCRRequest();
  req.setImageUrl("https://pic1.zhimg.com/v2-062299d754ec02ffd96640802431f996_r.jpg");
  // 返回的resp是一个VatInvoiceOCRResponse的实例,与请求对象对应
  VatInvoiceOCRResponse resp = client.VatInvoiceOCR(req);
  // 输出json格式的字符串回包
  System.out.println(AbstractModel.toJsonString(resp));
} 
catch (TencentCloudSDKException e) {
  System.out.println(e.toString());
}

3. 表格识别

对于复杂的表格数据,传统的OCR技术往往难以高效处理。腾讯云智能结构化OCR通过表格识别技术,能够自动识别表格中的行列结构,并提取表格中的数据,支持多种复杂格式的表格,包括财务报表、库存清单等。

我们找到一个表格图片,使用腾讯云的表格识别API进行识别。

直接将图片上传,点击发起调用,瞬间这张表格的内容就被识别成功。

 

调用 API 代码示例:

using System;
using System.Threading.Tasks;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;

namespace TencentCloudExamples
{
    class RecognizeTableAccurateOCR
    {
        static void Main(string[] args)
        {
            try
            {
                // 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密
                // 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305
                // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
                Credential cred = new Credential {
                    SecretId = "SecretId",
                    SecretKey = "SecretKey"
                };
                // 实例化一个client选项,可选的,没有特殊需求可以跳过
                ClientProfile clientProfile = new ClientProfile();
                // 实例化一个http选项,可选的,没有特殊需求可以跳过
                HttpProfile httpProfile = new HttpProfile();
                httpProfile.Endpoint = ("ocr.tencentcloudapi.com");
                clientProfile.HttpProfile = httpProfile;

                // 实例化要请求产品的client对象,clientProfile是可选的
                OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);
                // 实例化一个请求对象,每个接口都会对应一个request对象
                RecognizeTableAccurateOCRRequest req = new RecognizeTableAccurateOCRRequest();
                req.ImageBase64 = "*************************testbase64******************************";
                // 返回的resp是一个RecognizeTableAccurateOCRResponse的实例,与请求对象对应
                RecognizeTableAccurateOCRResponse resp = client.RecognizeTableAccurateOCRSync(req);
                // 输出json格式的字符串回包
                Console.WriteLine(AbstractModel.ToJsonString(resp));
            }
            catch (Exception e)
            {
                Console.WriteLine(e.ToString());
            }
        }
    }
}

 

三、应用场景与行业案例

行业领域应用场景OCR 技术优势
金融行业银行、保险、证券等金融领域,身份验证、客户资料录入及合同审批等场景。提升业务办理效率,几秒钟内完成身份验证、银行卡信息提取、贷款合同识别,减少人工录入和核对的工作量。
物流行业包裹运单条形码识别、货物清单信息提取等场景。高效识别运单条形码和货物清单中的详细内容,提升货物追踪与运单处理的自动化程度。
医疗行业诊断报告、病历记录、医疗发票等数据管理与归档。准确识别病历文档、报告单和电子处方中的信息,帮助医院和医疗机构智能化管理病患数据,提升文档处理效率。
政府与公共服务身份证、户口本、驾驶证等证件的识别与验证。自动化证件识别与验证,减少人工验证的错误率,提高工作效率,支持政府部门数字化流程的优化。

 

 

四、总结

        腾讯云智能结构化OCR凭借其卓越的识别精度、广泛的行业应用和灵活的定制化能力,正在成为数字化转型的核心驱动力。无论是在身份验证、财务报销,还是在医疗文档处理、合同管理等领域,OCR技术的引入都极大提升了企业的工作效率,减少了人工成本,并优化了流程。随着技术的不断成熟和创新,腾讯云OCR的应用范围将不断扩展,未来将为更多行业提供智能化的解决方案,助力企业在这个信息化和自动化日益加速的时代中脱颖而出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2268784.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Boot教程之三十九: 使用 Maven 将 Spring Boot 应用程序 Docker 化

如何使用 Maven 将 Spring Boot 应用程序 Docker 化? Docker是一个开源容器化工具,用于在隔离环境中构建、运行和管理应用程序。它方便开发人员捆绑其软件、库和配置文件。Docker 有助于将一个容器与另一个容器隔离。在本文中,为了将Spring B…

模仿微信小程序wx.showModal自定义弹窗,内容可以修改

实现以下弹框样式功能 1.在components新建一个文件showModel.wpy作为组件&#xff0c;复制下面代码 <style lang"less" scoped> .bg_model {display: flex;justify-content: center;align-items: center;// 弹框背景.bg_hui {width: 100%;height: 100%;posi…

缓存管理自动化:JuiceFS 企业版 Cache Group Operator 新特性发布

近期&#xff0c;JuiceFS 企业版推出了 Cache Group Operator&#xff0c;用于自动化创建和管理缓存组集群。Operator 是一种简化 Kubernetes 应用管理的工具&#xff0c;它能够自动化应用程序的生命周期管理任务&#xff0c;使部署、扩展和运维更加高效。 在推出 Operator 之前…

零基础微信小程序开发——小程序的宿主环境(保姆级教程+超详细)

&#x1f3a5; 作者简介&#xff1a; CSDN\阿里云\腾讯云\华为云开发社区优质创作者&#xff0c;专注分享大数据、Python、数据库、人工智能等领域的优质内容 &#x1f338;个人主页&#xff1a; 长风清留杨的博客 &#x1f343;形式准则&#xff1a; 无论成就大小&#xff0c;…

GPU 进阶笔记(二):华为昇腾 910B GPU

大家读完觉得有意义记得关注和点赞&#xff01;&#xff01;&#xff01; 1 术语 1.1 与 NVIDIA 术语对应关系1.2 缩写2 产品与机器 2.1 GPU 产品2.2 训练机器 底座 CPU功耗操作系统2.3 性能3 实探&#xff1a;鲲鹏底座 8*910B GPU 主机 3.1 CPU3.2 网卡和网络3.3 GPU 信息 3.3…

微服务SpringCloud分布式事务之Seata

视频教程&#xff1a;https://www.bilibili.com/video/BV16P63Y3ESq 效果演示 准备的微服务项目调用的链路如下&#xff1a; 文字描述&#xff1a; gateway模块接收到请求&#xff0c;并发送到order订单模块order订单模块接收到请求&#xff0c;新增一个订单数据后发送一个…

HTML——13.超链接

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>超链接</title></head><body><!--超链接:从一个网页链接到另一个网页--><!--语法&#xff1a;<a href"淘宝网链接的地址"> 淘宝…

STM32 高级 WIFi案例1:测试AT指令

需求描述 测试AT指令是否能够正常控制ESP32的wifi&#xff0c;比如重启、读取设备信息等。 思路&#xff1a; stm32通过串口usart2向ESP32发布命令。ESP32通过串口1返回信息。 配置&#xff1a; 第一步&#xff1a;对ESP32芯片烧录可以读取stm32命令的固件&#xff08;fac…

GXUOJ-算法-第四次作业(圆排列、连续邮资、n皇后、符号三角形)

1.圆排列 问题描述 GXUOJ | 圆排列 代码解答 #include<bits/stdc.h>using namespace std;int n; int r[1000]; double x[1000]; double ans 0x3f3f3f3f;double calculate(){memset(x, 0, sizeof x);for(int i 0; i < n; i){for(int j 0; j < i; j)x[i] max(…

[创业之路-225]:《华为闭环战略管理》-4-华为的商业智慧:在价值链中探索取舍之道与企业边界

目录 一、在价值链中探索取舍之道与企业边界 价值链的深刻洞察 取舍之道&#xff1a;有所为&#xff0c;有所不为 垂直整合与横向整合的平衡 企业边界与活动边界的界定 采购与外包的智慧运用 结语 二、企业外部价值流&#xff1a;上游、中游、下游、终端 上游&#xf…

【从零开始入门unity游戏开发之——C#篇33】C#委托(`Delegate`)和事件(`event` )、事件与委托的区别、Invoke()的解释

文章目录 一、委托&#xff08;Delegate&#xff09;1、什么是委托&#xff1f;2、委托的基本语法3、定义自定义委托4、如何使用自定义委托5、多播委托6、C# 中的系统委托7、GetInvocationList 获取多个函数返回值8、总结 二、事件&#xff08;event &#xff09;1、事件是什么…

大模型—Ollama 结构化输出

Ollama 结构化输出 Ollama现在支持结构化输出,使得可以按照由JSON模式定义的特定格式来约束模型的输出。Ollama的Python和JavaScript库已经更新,以支持结构化输出。 结构化输出的用例包括: 从文档中解析数据从图像中提取数据结构化所有语言模型响应比JSON模式更可靠和一致开…

【Python】selenium 获取滑块和背景图在电脑屏幕的相对位置【解决滑块验证码问题】

在使用python模拟爬取的时候&#xff0c;解决滑动验证码是不可缺少的环节。怎么解决滑动验证码的问题呢&#xff0c;我们可以试着使用这样的方法&#xff1a; 我们在解决滑块验证码问题的时候&#xff0c;首先要找到滑块和在网页上的位置&#xff0c;定位好位置以后&#xff0…

微信小程序:定义页面标题,动态设置页面标题,json

1、常规设置页面标题 正常微信小程序中&#xff0c;设置页面标题再json页面中进行设置&#xff0c;例如 {"usingComponents": {},"navigationBarTitleText": "标题","navigationBarBackgroundColor": "#78b7f7","navi…

Visual Studio 中增加的AI功能

前言&#xff1a; 人工智能的发展&#xff0c;在现在&#xff0c;编程技术的IDE里面也融合了AI的基本操做。本例&#xff0c;以微软的Visual Studio中的人工智能的功能介绍例子。 本例的环境&#xff1a; Visual Studio 17.12 1 AI 智能变量检测&#xff1a; 上图展示了一…

后端开发-Maven

环境说明&#xff1a; windows系统&#xff1a;11版本 idea版本&#xff1a;2023.3.2 Maven 介绍 Apache Maven 是一个 Java 项目的构建管理和理解工具。Maven 使用一个项目对象模型&#xff08;POM&#xff09;&#xff0c;通过一组构建规则和约定来管理项目的构建&#xf…

BAPI_BATCH_CHANGE在更新后不自动更新批次特征

1、问题介绍 在CL03中看到分类特性配置了制造日期字段&#xff0c;并绑定了生产日期字段MCH1~HSDAT MSC2N修改批次的生产日期字段时&#xff0c;自动修改了对应的批次特性 但是通过BAPI&#xff1a;BAPI_BATCH_CHANGE修改生产日期时&#xff0c;并没有更新到批次特性中 2、BAPI…

ARM200~500部署

前提&#xff1a;数据库已经安装好&#xff0c;并且正常运行 1.修改hostname,将里面的AR-A 改为hzx vi /etc/hostname 2.重启网络服务 sudo systemctl restart NetworkManager 3.修改community-admin.service 文件&#xff0c;更改小区名称和IP&#xff0c;并将文件上传到/…

修改secure-file-priv参数-mysql5.7.26限制不允许导入或导出的解决方法

文章目录 前言secure_file_priv参数说明修改secure_file_priv参数的步骤 前言 本人是在sql注入的文件上传拿web shel 时所用到的写入文件权限遇到文件上传不成功的问题&#xff0c;记住修改后&#xff0c;重启mysql才生效&#xff0c;最后可以查看验证一下。 secure_file_priv…

Java编程规约:日期时间

文章目录 I 日期时间编程规约【强制】【推荐】II 知识扩展日期格式I 日期时间编程规约 【强制】 日期格式化时,传入 pattern 中表示年份统一使用小写的 y。说明:日期格式化时,yyyy 表示当天所在的年,而大写的 YYYY 代表是 week in which year(JDK7 之后引入的概念), 意…