腾讯云OCR - 降低客服财务运营成本

news2024/11/25 4:19:13

说明:参与中秋活动

一、 前言:

随着图片时代的飞速发展,大量的文字内容为了优化排版和表现效果,都采用了图片的形式发布和存储,这为内容的传播和安全性带来了很大的便利,需要做重复性劳动。

OCR文字扫描工具也逐渐的应运而生,主要是为了帮助用户解决了内容编辑的难题。

在这里插入图片描述


二、 OCR是什么?

OCR全称是Optical Character Recognition,意思是“光学字符识别技术”。

1. OCR的作用:

通过OCR 技术识别图像中的文字,提取出来转换成文本格式,输出一些结构化的文本数据。

在这里插入图片描述

2. OCR实现文字识别的过程:

OCR的原理就是通过扫描仪将汉字文稿通过电荷耦合器件CCD将文稿的光信号转换为电信号,经过模拟/数字转换器转化为数字信号传输给计算机。计算机接受的是文稿的数字图像,然后对这些图像中的汉字进行识别。

在这里插入图片描述

3. OCR的选择:

在这里插入图片描述

4. OCR在生活中的应用:

智能识别技术高速发展的今天,通过仔细回忆,发现生活中方方面面都应用了OCR识别技术,以下为本人实际在生活中实际应用场景,看看您是否也有同样的经历?

(1). 小孩做作业:

平时家里老人在辅导小孩做作业,遇到不会做的,会使用“作业帮”的软件。对不理解的题目进行拍照,上传到服务器,服务器识别到文字,并在题库中查找对应的题目,将查询的结果再返回到界面中。

在这里插入图片描述

(2). 自媒体运营:

经常需要去公众号发布一些文案、活动,在网上找的比较好的素材,大家应该经常会看到一些百度文库等这种付费的文案素材下载,有时,只能靠自己对着手敲形式。可以使用微信自带的“文字识别”功能进行识别。

在这里插入图片描述

(3). 支付付款:

在手机二维码支付之前,人们都还是用现金支付,而现在大街小巷都在用手机支付,这样一新的支付方式已经进入我们的生活并被逐渐被大众所接受。那我们打开扫一扫,往商家或者个人的二唯码扫一下,就能识别是谁?甚至更为先进的人脸识别扫码支付,这些其实都是OCR应用场景最广的一种方式吧。

(4). 共享单车:

上班离公司比较近,每天上下班都是扫一下共享单车,来回通勤。使用微信扫描共享单车上的二唯码,也是一种OCR的应用场景。
在这里插入图片描述

以下是OCR在生活的应用场景的一个总结:

在这里插入图片描述

接下来,结合公司的业务,进行流程优化,以达到公司节能降本提效的结果。


三、公司业务:

公司是做宠物相关业务的,公司秉承为宠物提供营养、健康、安全的食品为己任,专注于犬猫粮的研发、生产和销售。
在这里插入图片描述


四、公司业务痛点:

目前OCR技术正在被广泛的运用,腾讯云文字识别就是一款运用OCR的技术,可以帮助企业解决一些业务的痛点,为公司进行增效降本。

1.业务场景:

场景一:公司的地推业务员,需要去宠物店进行登记授权店铺可以销售本公司的产品,也可以为公司拓展客户的目的,公司客服部门专门需要对业务员地推的提交的信息进行审核,同时,也为业务的考核进行评定。

场景二:供应商在采购后,需要将开立的发票进行公司交账。

在这里插入图片描述

2. 业务痛点:

  • 商家认证时,上传的营业执照后,需要人工去审核,十分耗费人力,而且是一个十分枯燥重复的事情。
  • 发票提交后,需要财务人员人工去审核,财务的人员也经常加班。
  • 通过扩展人力 + 加班的形式,会导致公司的人力成本增大。

在这里插入图片描述

下面让我们通过对腾讯云文字识别实践,来降低客服财务运营成本.


五、腾讯云文字识别实践:

基于腾讯优图实验室的深度学习技术的文字识别,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。

在这里插入图片描述

基于腾讯优图实验室的深度学习技术的文字识别,在产品选型时,相对于其它产品提供了很大的优势。

基于腾讯自研的深度学习技术和海量的数据,提供卡证、票据类印刷体和手写体、自定义模板等多种场景和类型的文字识别服务。
在这里插入图片描述

腾讯云OCR是一款优秀的文字识别服务,具有高精度、低错误率、快速识别等特点,并可应用于不同的场景。使用腾讯云OCR可以帮助我们快速处理图像中的文字信息,提高工作效率,受到了广泛的应用。

1. 开通相关产品:

可以看到腾讯云的OCR的产品很多,可以看到在很多领域可以广泛的应用,成为高效生产力的辅助工具。

在这里插入图片描述

这里为了测试本文提到的2种场景,选择“通用文字识别”类型。

在这里插入图片描述

勾选“我已阅读并同意”,即可进行开通文字识别产品功能。

在这里插入图片描述

账号记得需要实名制,否则会提示需要进行实名制。审核通过后,可以看到我们首次开通“文字识别服务”,各个资源包有免费赠送的次数,让我们可以对产品进行一个调研与测试,十分的贴心。

在这里插入图片描述

首次开通会赠送250次免费机会,开通的类型也是有9种之多,可以灵活根据自己的业务需求进行测试。

在这里插入图片描述

2. 免费测试:

腾讯云文字识别产品家族包括通用文字识别、通用卡证识别、票据单据识别、文本图像增强、智能结构化识别、智能扫码以及特定场景识别等服务,开通后即可享受1,000次/月的免费调用额度。
在这里插入图片描述

3. 新手体验:

官方提供了多种途径,可以根据这些途径选择合适的使用方式。

在这里插入图片描述

  • 文字识别体验Demo
  • 可视化调用文字识别服务
  • 一分钟代码接入服务端 API

4. 在线文字识别体验Demo:

直接点击“上传本地文件”,选择一个营业执照,进行在线解析,可以看到返回的识别结果。

在这里插入图片描述

5. 可视化调用文字识别服务 - 官方调试工具:

先从官网提供的在线调试工具进行测试,先看看效果,在“签名串生成”中,点击“查看密钥”,去查看ID和密钥。

在这里插入图片描述

查看API的ID和密钥,显示密钥需要短信验证一下。

在这里插入图片描述

在“在线调用”中,输入参数里面,填入imageUrl,和刚刚生成的签名串,点击“发起调用”,可以看到响应结果有返回的数据了。

在这里插入图片描述


六、构建Node服务解析:

腾讯云OCR官方准备了多种方式,快速将该接口对应的腾讯云开发者工具套件(SDK) 集成到本地项目中,本文为了演示功能,使用的是Node的Koa框架进行开发。

在这里插入图片描述

序号作用
1koaKoa是Node.js的一个高级框架,它基于Node.js的中间件机制,提供了一个更简单、更灵活的框架,用于构建高效、可扩展的Web应用程序。
2koa-bodyparserKoa-bodyparser是一个Web框架koa的中间件,用于解析HTTP请求中的请求体,也就是把POST请求中的数据解析到ctx.request.body中。
3koa-routerkoa-router是koa的一个中间件,其内部也包含众多的中间件,这些中间件通过Layer对象根据路由路径的不同进行划分。
4tencentcloud-sdk-nodejs用于访问腾讯云服务的 SDK,可以帮助您使用 Node.js 语言在腾讯云上进行开发。

1. 初始化项目:

mkdir orc-test
cd orc-test
npm init
# 一路按回车即可初始化一个package.json

# 安装插件
yarn add tencentcloud-sdk-nodejs@4.0.673 koa@^2.14.2 koa-bodyparser@^4.4.1 koa-router@^12.0.0

2. 写入ocr识别的代码:

const tencentcloud = require("tencentcloud-sdk-nodejs")
const OCRClient = tencentcloud.ocr.v20181119.Client

const Koa = require('koa');
const Router = require('koa-router');
const bodyParser = require('koa-bodyparser');

const client = new OCRClient({
  credential: {
    secretId: "AKIDyxpjjmxxxxxxxFdtx",   # 使用自己的id
    secretKey: "eFh0961yxxxxAQ",   # 使用自己的密钥
  },
  // 产品地域
  region: "ap-guangzhou",
})

// 实例化Koa对象 => app
const app = new Koa();
// 实例化路由对象 => router
const router = new Router();

app.use(bodyParser())

// 测试接口
router.get('/', async (ctx, next) => {
  ctx.response.body = `<h1>Hello, Koa2</h1>`;
});

function getImg(ImageUrl) {
  return client.BizLicenseOCR(
    {
      ImageUrl,
    },
  )
}

// 获取营业执照结果
router.post('/api/getBusiness', async (ctx, next) => {
  const request = ctx.request.body
  let result = await getImg(request.url);
  ctx.response.type = 'application/json';
  ctx.response.body = {"code": '200', "message": '成功', "data": result };
});

app.use(router.routes()).use(router.allowedMethods());

// 在端口3000监听
app.listen(3000);
console.log('app started at port 3000...');

3. 构建测试url:

在postman中输入get请求的http://127.0.0.1:3000即可

在这里插入图片描述

4. 测试营业执照是否能正确解析:

在postman中,输入post请求的http://127.0.0.1:3000/api/getBusiness,post请求参数为url,可以看到能返回营业执照的信息。
在这里插入图片描述

5. 测试增值税发票是否能正确解析:

将请求图片的解析函数BizLicenseOCR,替换为函数VatInvoiceOCR。

function getImg(ImageUrl) {
  return client.VatInvoiceOCR(
    {
      ImageUrl,
    },
  )
}

这里方法的名称可以参考以下,不同的类型图片,使用不同的方法:

在这里插入图片描述

在postman中,输入post请求的http://127.0.0.1:3000/api/getBusiness,post请求参数为url,可以看到能返回增值税发票的信息。

在这里插入图片描述

6. 总结:

以下是我从0到1开始由入门到实战,花了不到半小时,就完成了整个OCR的体验流程,可以感受到腾讯云的产品确实简单易用,同时,也完成了对营业执照、增值税发票的一个调研完成。
在这里插入图片描述

7. 改善措施前后对比:

在这里插入图片描述


六、预计导入收益:

在这里插入图片描述

  • 采用腾讯云的OCR文字识别功能,可以大大的简化了业务的工作流程。
  • 由之前的纯人工操作,改为自动审核机制,将识别不出来或者识别有误的,再进行人工审核。
  • 极大的方便了客服、财务人员的工作量,也不需要经常下班后还要带电脑。

对公司的一个降本节流的策略,做了一个预计的评估,人力的成本约减少30%左右,工作提高的效率在50%以上,做成基础的公共服务,后续有新的业务场景也可以很快的上线。

当然,需要根据公司的实际情况进行调研,比如采购的成本如果远远大于人工的成本,可能就需要进行衡量一下。


七、总结:

OCR技术的成熟,使得图文时代的内容编辑更加轻松,对于经常和文字图片打交道的业务场景来说,基于OCR技术的文字识别和提取工具是必不可少的效率提升的利器。

在信息社会时代,每天会产生大量的票据、表单、证件数据,这些数据想要从人工处理转变到信息电子化,需要利用OCR技术进行提取录入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1022643.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

服务器数据恢复-UNIX类文件系统软件层级故障的数据恢复可能性分析

服务器数据恢复环境&#xff1a; 基于UNIX系统&#xff0c;软件层级的数据灾难。 服务器故障&#xff1a; 1、存储结构出错。 2、删除数据。 3、文件系统格式化。 4、其他原因导致的数据丢失。 服务器数据恢复的可能性分析&#xff1a; 1、存储结构出错。 无论错误出现在RAID还…

将el-table数据导出csv各式,纯前端实现

tableData数据&#xff1a;tableData: [{ column1: 值1-1, column2: 值1-2 },{ column1: 值2-1, column2: 值2-2 },{ column1: 值3-1, column2: 值3-2 }], exportToCSV() {// 将表格数据转化为CSV格式const csvContent this.convertArrayOfObjectsToCSV(this.tableData);// 创…

关于 firefox 不能访问 http 的解决

情景&#xff1a; 我在虚拟机 192.168.x.111 上配置了 DNS 服务器&#xff0c;在 kali 上设置 192.168.x.111 为 DNS 服务器后&#xff0c;使用 firefox 地址栏搜索域名 www.xxx.com &#xff0c;访问在 192.168.x.111 搭建的网站&#xff0c;本来经 192.168.x.111 DNS 服务器解…

无涯教程-JavaScript - ROUNDDOWN函数

描述 ROUNDOWN函数将数字向下舍入为零。 ROUNDDOWN是Excel舍入函数之一。 语法 ROUNDDOWN (number, num_digits)争论 Argument描述Required/OptionalNumberAny real number that you want rounded down.RequiredNum_digitsThe number of digits to which you want to round…

Linux Static Key原理与应用

文章目录 背景1. static-key的使用方法1.1. static-key定义1.2 初始化1.3 条件判断1.4 修改判断条件 2、示例代码参考链接 背景 内核中有很多判断条件在正常情况下的结果都是固定的&#xff0c;除非极其罕见的场景才会改变&#xff0c;通常单个的这种判断的代价很低可以忽略&a…

msvcp71.dll丢失的解决方法分享,全面分析msvcp71.dll丢失原因

msvcp71.dll 丢失的问题可能困扰着许多使用 Windows 操作系统的用户。msvcp71.dll 是微软 C运行时库中的一个动态链接库文件&#xff0c;负责提供一些基本的函数和类&#xff0c;例如字符串处理、数学运算、文件操作等。如果这个文件丢失或损坏了&#xff0c;那么在使用依赖于它…

【深度学习 | LSTM】解开LSTM的秘密:门控机制如何控制信息流

&#x1f935;‍♂️ 个人主页: AI_magician &#x1f4e1;主页地址&#xff1a; 作者简介&#xff1a;CSDN内容合伙人&#xff0c;全栈领域优质创作者。 &#x1f468;‍&#x1f4bb;景愿&#xff1a;旨在于能和更多的热爱计算机的伙伴一起成长&#xff01;&#xff01;&…

计算机视觉与深度学习-全连接神经网络-训练过程-批归一化- [北邮鲁鹏]

文章目录 思想批归一化操作批归一化与梯度消失经过BN处理 算法实现 思想 直接对神经元的输出进行批归一化 批归一化&#xff1a;对输出值进行归一化&#xff0c;将归一化结果平移缩放作为输出。 批归一化操作 小批量梯度下降算法回顾&#xff1a;每次迭代时会读入一批数据&am…

工信部将制定虚拟宇宙标准

中国工业和信息化部(MIIT)周一表示&#xff0c;随着北京寻求成为新技术的全球标准制定者&#xff0c;中国将成立一个工作组来制定虚拟宇宙行业的标准。 周一&#xff0c;该部发布了一份提案草案&#xff0c;旨在组建一个虚拟宇宙工作组&#xff0c;该工作组可以通过互联网访问共…

CHATGPT中国免费网页版有哪些-CHATGPT中文版网页

CHATGPT中国免费网页版&#xff0c;一个强大的人工智能聊天机器人。如果你曾经感到困惑、寻求答案&#xff0c;或者需要一些灵感&#xff0c;那么CHATGPT国内网页版可能会成为你的好朋友。 CHATGPT国内免费网页版&#xff1a;你的多面“好朋友” 随着人工智能技术的不断发展&a…

Java学习day04:数组

声明&#xff1a;该专栏本人重新过一遍java知识点时候的笔记汇总&#xff0c;主要是每天的知识点题解&#xff0c;算是让自己巩固复习&#xff0c;也希望能给初学的朋友们一点帮助&#xff0c;大佬们不喜勿喷(抱拳了老铁&#xff01;) Java学习day04&#xff1a;数组 一、开发…

C++:new 和 delete

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》《C》 文章目录 前言一、C内存管理1.内置类型2.自定义类型3.delete 与 new不匹配使用问题(VS平台下) 二、operator new 与 operator delete函数三、 new 和delete的实现原理内置类型自定义类型 四…

【前端知识】Three 学习日志(十)—— 常见几何体(长方体、球体、圆柱、矩形平面、圆形平面)

Three 学习日志&#xff08;十&#xff09;—— 常见几何体&#xff08;长方体、球体、圆柱、矩形平面、圆形平面&#xff09; 一、构建常用几何体 const geometry_list []// BoxGeometry&#xff1a;长方体 const geometry_box new THREE.BoxGeometry(100, 100, 100); geo…

CPU性能优化

在进行CPU性能优化的时候&#xff0c;我们经常先需要分析出来我们的应用程序中的CPU资源在哪些函数中使用的比较多&#xff0c;这样才能高效地优化。一个非常好的分析工具就是《性能之巅》作者 Brendan Gregg 发明的火焰图。 我们今天就来介绍下火焰图的使用方法&#xff0c;以…

GeoServer地图服务器权限控制

目录 1下载相关软件 2部署软件 3配置鉴权环节 4Java工程 5测试鉴权 6测试鉴权结果分析 本文章应该会后面试验一个鉴权功能就会发布一系列测试过程&#xff08;GeoServer有很多鉴权方式&#xff09; 1Download - GeoServer 1下载相关软件 进入geoserver官网的下载页面 …

如何为你的Python程序配置HTTP/HTTPS爬虫IP

在编写Python程序时&#xff0c;有时候我们需要使用HTTP或HTTPS爬虫ip来实现网络请求和访问外部资源。本文将向您介绍如何快速入门&#xff0c;为您的Python程序配置HTTP/HTTPS爬虫ip&#xff0c;以便您能够轻松地处理爬虫ip设置并顺利运行您的程序。 一、了解HTTP/HTTPS爬虫ip…

Python Opencv实践 - ORB特征匹配

参考资料&#xff1a; ORB特征笔记_亦枫Leonlew的博客-CSDN博客 python opencv3 基于ORB的特征检测和 BF暴力匹配 knn匹配 flann匹配 - 知乎 Python OpenCV中的drawMatches()关键点匹配绘制方法详解_cv2.drawmatches_乔卿的博客-CSDN博客 import cv2 as cv import numpy as…

mysql 多个字段 like 同一个值怎么实现

1&#xff0c;需求&#xff1a;前端一个输入框 输入的内容要和数据库中多个字段进行匹配 前端输入内容需要和 username&#xff0c;realname&#xff0c;age&#xff0c;bh 这四个字段匹配 方法1&#xff08;可优化&#xff09;&#xff1b;select * from rzt_user where user…

爱惨了,这个听书神器APP

我喜欢听书的原因&#xff0c;第一个是比较省时间&#xff0c;而且很方便&#xff0c;看小说需要花费时间&#xff0c;看久了&#xff0c;眼睛又很疼。听书的话&#xff0c;刷牙听、走路听、开车听、睡前听等等都可以。 最近狂爱这个爱屁屁&#xff1a;听书神器 1、全网资源&…

nodejs项目实战(带源码)

nodejs项目实战 主要实现功能用户模块文章分类模块文章模块核心代码 数据库完整代码 主要实现功能 本项只适合新手&#xff0c;是一个接口类的项目&#xff0c;主要涉及一些增删改查功能以及三方包的使用&#xff0c;主要包括用node实现写用户登录注册&#xff0c;添加删除文章…