深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用

news2024/11/28 10:52:06

OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实现了与AI视觉的有效融合,在工业领域的实际生产应用中发挥着越来越重要的作用,包括在食品、医药、电力、消费电子等众多行业中具备良好的应用效果。

字符识别流程

图像预处理

目的:提高图像质量,从而提高OCR的准确性。

常见的图像预处理操作包括灰度化、二值化、降噪和图像增强等。

文字分割

目的:将图像中的文字区域切割出来,便于后续的文字识别。

文字分割可通过基于连通区域的方法或基于深度学习的方法实现。

文字识别

目的:将区域中的文字内容转化为计算机可识别的字符编码。

文字识别可以通过模版匹配的方法或基于深度学习的方法实现。

后处理

目的:进一步提高OCR的准确性,去除识别结果中的错误信息。

常见的后处理操作包括纠错、排版和格式化等。

场景复杂多样 字符识别难题凸显

在实际生产中,众多场景需要用OCR技术实现对印刷字符的检测,包括自动化设备控制、产品品质控制和物流控制等识别场景,但由于这些识别场景复杂多样,想要进一步提升字符识别应用效果往往面临困难。

高效率难题

由于生产工艺的影响,字符标签往往存在印刷模糊、歪斜、污染、破损等问题,导致检测效率较低。

高通用性难题

对于字符的检测包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制。

生产环境难题

识别过程容易受生产环境、产品品质和工艺、拍摄角度等影响,从而出现字符图像不清晰、畸形、缺失等情况。

研发难题

OCR在复杂场景的应用部署需要研发人员的深度参与,还需要字符样本深度学习训练、反复调参,操作门槛较高。

综上所述,在复杂多样的识别场景中,传统OCR技术面临多重难题,为实现缺陷字符的进一步检出,各制造厂商开始运用AI+机器视觉检测技术,对出厂前产品进行更严格检测,包括根据不同的产品材料、缺陷情况和客户需求,使用不同的光源、不同照射角度和不同像素的工业相机,对被识别字符的缺陷和复杂背景进行区分,最后利用缺陷图像的颜色、灰度、形状、大小等来识别。

技术革新升级 深度学习与OCR有效融合

随着字符识别技术加速渗透工业领域,作为机器视觉前沿技术的引领者,深眸科技坚持对OCR技术的革新升级,通过将深度学习与字符识别技术有效融合,全面赋能各行业应用。

深眸科技创新研发的轻辙标注训练平台,通过字符识别模块配合具备较高精度的工业相机拍摄取图,集推、训、测、转一体,能够在字符复杂、环境干扰等情况下,实现全场景、复杂条件下的字符识别。

通过深度学习算法,轻辙标注训练平台能够助力OCR技术能实现更高的识别精度和速度,并精准且快速完成因生产工艺导致的字符标签印刷模糊、歪斜、污染、破损等缺陷的检出,从而满足字符识别的高效率要求;轻辙标注训练平台还能通过自主学习各类工业场景中不同类型的字符,包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制,进一步提升了在字符识别场景中的通用能力。

深眸落地案例 OCR技术在各行业的应用

医药行业 · 药盒OCR检测

项目背景:

对于小盒装产品医药行业往往会将数个产品用透明塑料薄膜先包裹在进行装箱。塑料薄膜存在反光、多层堆叠(降低了字符的对比度)现象,会对字符识别产生严重的干扰。

检测难点:

· 多个产品多行字符

· 需要实现较高的识别准确率

· 塑料薄膜存在反光、堆叠对识别产生影响

解决方案:

深眸科技在此项目中,通过工业相机拍摄取图,以OCR技术加持,系统能够排除反光、堆叠等因素的干扰,提取分析并比较药盒生产日期、二维码等字符的完整性、正确性和是否存在缺失,当检测到问题时,发出信号给剔除装置并警报提示。

医药行业 · 药盒OCR检测项目

电力行业 · 电力线路杆号牌分拣

项目背景:

线路塔杆的杆号牌是线路杆塔的“身份证”,担负着宣传电力知识、安全警示的作用,杆号牌的字迹模糊、脱落等现象,给线路巡视检修、故障抢修等工作带来许多潜在隐患。

检测难点:

· 杆号牌字符不确定,无法预置字符库方式建立图像字符模版

· 字符方向与来料多样,存在相近字符的干扰

· 字符存在挤压变形,影响字符输出

解决方案:

深眸科技自研的轻辙标注训练平台,能够通过搭配文本检测算法与优化SVTR文本识别、文本方向分类器、文本尺度修正等算法,规范字符在尺度处理上的统一性。同时满足客户快速换型生产要求,在部分字符缺损、漏检、小数点符号干扰的情况下,对所有字符联想检出。

电力行业 · 电力线路杆号牌分拣项目

消费电子行业 · OCR错漏检测

项目背景:

空调内机外壳的品牌LOGO以及商标丝印在生产时会有缺损和错误的情况,同时装配阶段也会发生混料现象。由于生产量巨大,人工质检已经不能满足生产效率。

检测难点:

· 多种不同型号产品

· 商标丝印各不相同,软件切换时间短

· 单位检测时间需要判断多个图像特征

· 缺陷类型多样,产品成像角度不稳定

解决方案:

深眸科技的轻辙标注训练平台通过自研算法,能够秒级切换不同产品型号生产,还能动态判断产品字符内容,并以高性能软件架构实现效率提升,实现空调内机外壳品牌LOGO和商标丝印等字符的精准识别。

消费电子行业 · OCR错漏检测项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1216226.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据毕业设计选题推荐-机房信息大数据平台-Hadoop-Spark-Hive

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

北邮22级信通院数电:Verilog-FPGA(9)第九周实验(4)实现寄存器74LS374

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章,请访问专栏: 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 目录 一.代码部分 1.1 reg_74LS374.v 1.2 reg_LS3…

渗透测试——1

1.计算机地址 计算机在网络中的地址有以下3类: (1)物理地址 物理地址相当于现实生活中的人脸,是不可改变的,独一无二的。每张网卡的物理地址是固定不变的。 物理地址由六个十六进制数组成,如&…

chatGPT API中参数temperature的含义是什么

在 ChatGPT API 中,temperature 参数用于控制回答的确定性和创造性。temperature 的值范围通常是从 0 到 1。这个参数影响模型生成回答时的随机性: 低温度值(如 0 或接近 0):会导致模型生成更确定、更一致、更少出乎意…

C++面向对象编程(3)——常用关键字介绍(TODO)

本篇会逐步添加一些C的关键字,持续更新... 一. default 1.1 场景 如果对构造函数进行了重载,则编译器不会隐式的生成一个默认的构造函数,此时如果调用了默认构造函数会在编译时报错,但是很多时候我们是需要默认构造函数的。如何…

sqli-labs(2)

7. 输入?id1 --显示格式错误 ?id1" --正常 测试 ?id1“ and sleep(5) -- 发现并没有成功 ?id1) --显示格式错误继续尝试 ?id1)) -- 显示正常 测试 ?id1“ and sleep(5) -- 发现sleep执行 对于语句闭合的尝试主要从 " ()来测试 报错语句尝试发现不回显报错信息…

如何利用自动发现将现网的进程纳入到监控系统中?

进程监控是一项关键任务,旨在监测系统中运行的进程的性能和状态。通过有效的进程监控,可以实时了解进程的运行情况,及时发现问题并采取措施,确保系统的稳定性和性能。 本期EasyOps产品使用最佳实践,我们将为您揭晓&am…

数据结构与算法之美学习笔记:19 | 散列表(中):如何打造一个工业级水平的散列表?

目录 前言如何设计散列函数?装载因子过大了怎么办?如何避免低效的扩容?如何选择冲突解决方法?工业级散列表举例分析解答开篇内容小结 前言 本节课程思维导图: 今天,我们就来学习一下,如何设计一…

FPGA模块——IIC协议(FPGA做主机操作24C64)

FPGA模块——IIC协议(FPGA做主机操作24C64) EEPROM(24C64)向器件写数据时序向器件读数据时序 IIC协议FPGA主机代码IIC驱动 EEPROM(24C64) 掉电不丢失,采用固定的读写协议。数据的稳定性和可重复…

2023.11.16 hivesql高阶函数之开窗函数

目录 1.开窗函数的定义 2.数据准备 3.开窗函数之排序 需求:用三种排序方法查询学生的语文成绩排名,并降序显示 4.开窗函数分组 需求:按照科目来分类,使用三种排序方式来排序学生的成绩 5.聚合函数与分组配合使用 6.聚合函数同时和分组以及排序关键字配合使用 --需求1&…

JavaWeb Day10 案例-部门管理

目录 一、查询部门 (一)需求 (二)思路 (三)查询部门 (四)、前后端联调 二、删除 (一)需求 (二)思路 (三&#xf…

如何深度了解汤泉场所?VR全景给你答案

天气逐步转凉,温泉、水会这些室内汤泉场所开始登上消费的主战场。伴随着人们物质生活水平的提高,人们对休闲养生会馆的要求也愈发旺盛,汤泉场所也逐渐从单一的洗浴开始向休闲、娱乐、保健、桑拿等多种业态形式发展,那么大家如何深…

安全狗云安全体系为高校提升立体化纵深防御能力

客户情况 某高校有服务器500台,对外站点200个,核心交换流量20G。 客户痛点 校园网系统分类较多,并且每类网站中安全级重要程度又各不相同,同时有多个网络出口(如:教育网、电信网、移动网等),二级学院存在…

【java学习—十五】Thread类的有关方法(3)

文章目录 1. 基本方法2. 线程的优先级3. 进阶方法3.1. 举例3.1.1. 线程让步3.1.2. join() 方法3.1.3. sleep()方法3.1.4. stop() 方法3.1.4. isAlive() 方法 1. 基本方法 方法名作用void start()启动线程,并执行对象的 run() 方法run()线程在被调度时执行的操作Str…

电脑提示d3dcompiler43.dll缺失怎么解决?四种方法帮你轻松搞定!

d3dcompiler_43.dll是一个与DirectX相关的动态链接库(DLL)文件,它主要用于Windows操作系统上的图形和游戏应用程序。这个文件的主要作用是编译和解析DirectX应用程序中的图形代码。 DirectX是一个强大的图形API(应用程序编程接口&…

flutter项目中使用阿里图标库自定义图标步骤,5分钟搞定

因为flutter自带的图标可能并不能满足业务需求,所以需要加入图标非常丰富的阿里图标库的支持,阿里图标库的地址:iconfont-阿里巴巴矢量图标库,先看一下使用阿里图标库后的效果图:网页端和手机端都是可以正常运行的&…

Centos7安装frps作内网穿透--实现外部访问家里群晖

实现在外可访问家用群晖 需要在外界访问家里的局域网设备,正常情况是需要有公网IP,而IPV4作为家用,运营商基本不给,除非钞能力,IPV6可以用,但是有缺陷,需要互访的两端都是IPV6才能访问。选择fr…

关于400G光模块的常见问题解答

最近在后台收到了很多用户咨询关于400G光模块的信息,那400G光模块作为当下主流的光模块类型,有哪些问题是备受关注的呢?下面来看看小易的详细解答! 1、什么是400G QSFP-DD光模块? 答:400G光模块是指传输速…

Ubuntu16.04上安装Docker

Ubuntu16.04上安装Docker 更新 apt 包索引: sudo apt-get update安装依赖包,以便使用 HTTPS 仓库 sudo apt-get install apt-transport-https ca-certificates curl software-properties-common添加 Docker GPG 密钥 curl -fsSL https://download.docker.com/linux/ubuntu…

rabbitMQ的direct模式的生产者与消费者使用案例

消费者C1的RoutingKey 规则按照info warn 两种RoutingKey匹配 绑定队列console package com.esint.rabbitmq.work03;import com.esint.rabbitmq.RabbitMQUtils; import com.rabbitmq.client.Channel; import com.rabbitmq.client.DeliverCallback;/*** 消费者01的消息接受*/ p…