基于paddelOCR的车票识别以及在PCB板上应用

基于paddelOCR的车票识别以及在PCB板上应用

news2025/4/8 14:03:11

基于paddelOCR的车票识别

在这里插入图片描述

任务简介

车牌识别就是从图片或者视频中提取车牌信息
在这里插入图片描述

任务难点

在这里插入图片描述

尺度差异大，悬挂位置不固定；
角度倾斜，图片模糊，光照不足，过曝等问题；
边缘和端测场景应用对模型大小有限制，推理速度有要求；

数据集介绍

在这里插入图片描述

CCPD数据集2019（25w）
CCPD数据集2020（5k）

解决方案流程

在这里插入图片描述

车牌检测
车牌识别（PP-OCR）
模型量化剪枝（PaddleSlim）
推理（PaddleLite）

PaddleOCR

在这里插入图片描述
PaddleOCR是一个领先的OCR使用工具库。

在这里插入图片描述
PaddleOCR的结构：

文本检测
- LK-PAN：大感受野的PAN结构
- DML：教师模型互学习策略
- RSE-FPN：残差注意力机制的FPN结构
文本识别
- SVTR_LCNet：轻量级文本识别网络
- GTC：Attention指导CTC训练策略
- TextConAug：挖掘上下文信息的数据增广策略
- TextRotNet：自监督的预训练模型
- UDML：联合互学习策略
- UIM：无标注数据挖掘方案

知识蒸馏

在这里插入图片描述

车牌识别方案

在这里插入图片描述

检测优化结果

在这里插入图片描述

识别优化结果

在这里插入图片描述
评价指标：

acc：整个字符串是否相等
norm_edit_dis：归一化的编辑距离，整张图片上的文字对了几个

识别case分析

在这里插入图片描述

识别优化结果

在这里插入图片描述
finetune会提升垂类场景效果

End2End结果

将检测和识别结合到一起：
在这里插入图片描述
case分析

检测框倾斜角度不对
字符长度不符合车牌规则

解决上述问题方法：
在这里插入图片描述

检测框dilation and flip（缩放和反转）
识别结果长度限制

方向不对就上下翻转一下 dilation放大或者缩小方框

在这里插入图片描述
处理之后，精度提升了许多。

动手实践

在这里插入图片描述
微调是在预训练模型上跑10个epoch左右

微调

在这里插入图片描述
学习率设置为之前的1/20

量化训练

在这里插入图片描述

在这里插入图片描述

手写体不好收集， text render生成
基于业务场景做后处理，ppstruct vqa

在这里插入图片描述
检测 2000张

https://live.polyv.cn/watch/3110906

PCB板上应用

在这里插入图片描述

在这里插入图片描述

https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=7380176421&source=h5pre

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/734428.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

C++之装饰器适配器模式

C++之装饰器适配器模式

目录一、装饰器模式模式思想模式简介模式优点模式缺点代码实现情景模拟代码实现运行结果二、适配器模式模式简介介绍优点缺点代码实现情景模拟一、装饰器模式模式思想模式简介装饰器模式（Decorator Pattern）允许向…

阅读更多...

前端基础（三十六）：读取本地音视频设备并进行播放

前端基础（三十六）：读取本地音视频设备并进行播放

效果 navigator.mediaDevices.enumerateDevices 请求媒体输入和输出设备的列表，例如麦克风，摄像机，耳机设备等 navigator.mediaDevices.getUserMedia 会提示用户给予使用媒体输入的许可，媒体输入会产生一个MediaStream&#xff0c…

阅读更多...

伺服系统行业发展

伺服系统行业发展

伺服系统行业发展 1 介绍1.1 概述1.2 一般应用1.3 分类按系统功率分类按动力来源分类 1.4 工业控制中的伺服系统1.5 数字信号驱动与模拟信号驱动对比1.6 发展历史 2 伺服系统厂家工业机械臂移动AMR 3 关键指标及难点4 三相交流逆变器（直流电转换为交流电&#xff09…

阅读更多...

创建 Code Interpreter Demo: 一次实践的探索

创建 Code Interpreter Demo: 一次实践的探索

好消息，好消息，Code Interpreter可以测试使用了！！！ 在这篇文章中，我们将探索如何创建一个 Code Interpreter Demo。提交一个2023年1-5月份的融资记录数据，让它来帮我们分析一下这些数据。执行…

阅读更多...

TCP 重传机制滑动窗口流量控制拥塞控制学习总结！

TCP 重传机制滑动窗口流量控制拥塞控制学习总结！

大家好，我是三叔，很高兴这期又和大家见面了，一个奋斗在互联网的打工人。这篇博客主要记录 tcp 的基础知识的学习总结相关内容！备注：图片均来自作者：小林哥 tcp 的三大特性 tcp 大家都不陌生&#xff0c…

阅读更多...

Python制作gif表情包生成工具，斗图再也不会输啦

Python制作gif表情包生成工具，斗图再也不会输啦

在当前无表情包不会聊天的时代，怎么也不能输在表情包数量不足上啊，今天咱们就来制作一个 gif 生成工具，用来制作表情包也太好用啦先来看看整体效果技术交流技术要学会分享、交流，不建议闭门造车。一个人可以走的很快、一堆人…

阅读更多...

如何解决PostgreSQL执行语句长时间卡着不动，不报错也不执行的问题？

如何解决PostgreSQL执行语句长时间卡着不动，不报错也不执行的问题？

1 问题现象执行SQL语句，卡着不动，不成功也不执行，就像挂住了一样。 truncate table simple; 2 原因分析一般来说，语句呈现卡着的状态，主要会是两种原因比较多， 原因1：SQL语句是一个耗时操…

阅读更多...

Java8新特性——lambda表达式、函数式接口、方法引用、Stream API与Optional类

Java8新特性——lambda表达式、函数式接口、方法引用、Stream API与Optional类

目录一、lambda表达式 (一)lambda相关概念 (二)lambda示例 (三)lambda用法 1.语法格式一：无参，无返回值 2.语法格式二：有参数，无返回值 3.数据类型可以省略，因为可由编译器推断得出，称为”类型推断…

阅读更多...

统计数据记录

统计数据记录

分红20% 分红22% 分红25%

阅读更多...

手把手教大家实现 npm 包，并发布 npm 仓库，搭建文档（二）

手把手教大家实现 npm 包，并发布 npm 仓库，搭建文档（二）

昨天写了第一篇文章，反响平平一个 NPM 包，帮助数十万程序员提高数十倍效率，难道不开源出来？（一）首先贴下我们的官网【预览页】 https://kennana.github.io/toolkit-use/ 我们的推特【toolkituse】 https://twitter.com/Toolkituse 我们的github 【toolkit-u…

阅读更多...

实现一个周选择器组件

实现一个周选择器组件

1、需求： 默认每个月的第一个周一为该月的第一周开始，规则如图所示 2、使用到的工具： vue2vant2momentjs 3、父组件： data中定义涉及到的参数 minDate: new Date(this.$moment().subtract(12,month)) maxDate: new Date(),…

阅读更多...

OpenCV 入门教程：全局阈值处理

OpenCV 入门教程：全局阈值处理

OpenCV 入门教程：全局阈值处理导语一、全局阈值处理二、示例应用2.1 图像二值化2.2 图像去噪总结导语全局阈值处理是图像处理中常用的技术之一，用于将图像转换为二值图像，从而提取感兴趣的目标区域。在 OpenCV 中，全局阈值处…

阅读更多...

Mathtype公式编号，章节号修改

Mathtype公式编号，章节号修改

正常插入公式时，选择有编号没有任何问题，但是，当需要根据章节编号时，这个如何处理呢，这个时候需要公式编号-章节-修改分隔符，然后会弹出一个对话框，这时可以修改章节开始序号。此外&#xff…

阅读更多...

【力扣周赛】第 353 场周赛

【力扣周赛】第 353 场周赛

文章目录 Q1：6451. 找出最大的可达成数字（脑筋急转弯？）思路竞赛时代码 Q2：6899. 达到末尾下标所需的最大跳跃次数（DP）思路竞赛时代码 Q3：6912. 构造最长非递减子数组（DP&…

阅读更多...

Openssh升级方法

Openssh升级方法

文章目录 Openssh升级方法一.安装openssh模拟未升级版本二.查看当前的ssh服务版本三.启动telnet、安装rzsz工具、创建普通账号，防止因为卸载openssh而导致无法登录主机四.卸载openssh的rpm安装包（备注：此处未卸载ssl安装包）&…

阅读更多...

【WebGIS初学到入职】（15）入职一年的总结与分享

【WebGIS初学到入职】（15）入职一年的总结与分享

题外话看看大纲可以怎么写，问问ChatGPT： ……算了，还是随便写写吧。所以时间过得也是有够快的，这就一年了。平淡入职一年，已经看到好些位女同事结婚了（男同事一个没有）。领导和同事都挺…

阅读更多...

汽车网站建设：开启汽车行业数字化转型的大门

汽车网站建设：开启汽车行业数字化转型的大门

随着科技的进步和互联网的普及，越来越多的汽车企业开始意识到一个强大的在线存在的重要性。汽车网站的兴起为汽车行业带来了新的机遇和好处。本文将简要介绍什么是汽车网站，探讨汽车网站的好处，并提供一些快速制作搭建汽车网站的方法。汽车网…

阅读更多...

@JsonFormat(pattern = “yyyy-MM-dd“, timezone = “GMT+8“) 日期格式

@JsonFormat(pattern = “yyyy-MM-dd“, timezone = “GMT+8“) 日期格式

前端去掉时分秒 ： /*** 出生日期*/ JsonFormat(pattern "yyyy-MM-dd", timezone "GMT8")// 解决后端到前端显示问题 DateTimeFormat(pattern "yyyy-MM-dd")// 解决前端到后端保存问题 TableField(value "birthday") A…

阅读更多...

Django_静态资源配置和ajax（九）

Django_静态资源配置和ajax（九）

目录一、静态资源配置二、AJAX ajax作用使用ajax 1、环境配置 2、创建html模板文件 3、编写视图函数并添加路由 4、运行django开发服务器进行验证源码等资料获取方法一、静态资源配置静态资源的相关配置都在项目目录下的 settings.py 文件中进行配置。配置参数如…

阅读更多...

架构训练营笔记系列：模块 1-2课

架构训练营笔记系列：模块 1-2课

郭东白老师的架构课偏理论，属于道层级。李云华老师的课偏实践，属于术层级。没有理论不会举一反三，只有理论，就是纸上谈兵，两个课都很好。架构与程序思维的区别程序逻辑实现架构判断取舍架构设计的关键不只…

阅读更多...

推荐文章

最新文章