基于paddelOCR的车票识别以及在PCB板上应用

news2024/11/17 10:54:25

基于paddelOCR的车票识别

在这里插入图片描述

任务简介

车牌识别就是从图片或者视频中提取车牌信息
在这里插入图片描述

任务难点

在这里插入图片描述

  • 尺度差异大,悬挂位置不固定;
  • 角度倾斜,图片模糊,光照不足,过曝等问题;
  • 边缘和端测场景应用对模型大小有限制,推理速度有要求;

数据集介绍

在这里插入图片描述

  • CCPD数据集2019(25w)
  • CCPD数据集2020(5k)

解决方案流程

在这里插入图片描述

  • 车牌检测
  • 车牌识别 (PP-OCR)
  • 模型量化剪枝(PaddleSlim)
  • 推理(PaddleLite)

PaddleOCR

在这里插入图片描述
PaddleOCR是一个领先的OCR使用工具库。

在这里插入图片描述
PaddleOCR的结构:

  • 文本检测
    • LK-PAN: 大感受野的PAN结构
    • DML:教师模型互学习策略
    • RSE-FPN:残差注意力机制的FPN结构
  • 文本识别
    • SVTR_LCNet: 轻量级文本识别网络
    • GTC:Attention指导CTC训练策略
    • TextConAug:挖掘上下文信息的数据增广策略
    • TextRotNet:自监督的预训练模型
    • UDML:联合互学习策略
    • UIM:无标注数据挖掘方案

知识蒸馏

在这里插入图片描述

车牌识别方案

在这里插入图片描述

检测优化结果

在这里插入图片描述

识别优化结果

在这里插入图片描述
评价指标:

  • acc:整个字符串是否相等
  • norm_edit_dis:归一化的编辑距离,整张图片上的文字对了几个

识别case分析

在这里插入图片描述

识别优化结果

在这里插入图片描述
finetune会提升垂类场景效果

End2End结果

将检测和识别结合到一起:
在这里插入图片描述
case分析
在这里插入图片描述

  • 检测框倾斜角度不对
  • 字符长度不符合车牌规则

解决上述问题方法:
在这里插入图片描述

  • 检测框dilation and flip(缩放和反转)
  • 识别结果长度限制

方向不对就上下翻转一下 dilation放大或者缩小方框

在这里插入图片描述
处理之后,精度提升了许多。

动手实践

在这里插入图片描述
微调是在预训练模型上跑10个epoch左右
在这里插入图片描述

微调

在这里插入图片描述
学习率设置为之前的1/20
在这里插入图片描述

量化训练

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

手写体不好收集, text render生成
基于业务场景做后处理,ppstruct vqa

在这里插入图片描述
检测 2000张

  • https://live.polyv.cn/watch/3110906

PCB板上应用

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=7380176421&source=h5pre

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/734428.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++之装饰器适配器模式

目录 一、装饰器模式 模式思想 模式简介 模式优点 模式缺点 代码实现 情景模拟 代码实现 运行结果 二、适配器模式 模式简介 介绍 优点 缺点 代码实现 情景模拟 一、装饰器模式 模式思想 模式简介 装饰器模式(Decorator Pattern)允许向…

前端基础(三十六):读取本地音视频设备并进行播放

效果 navigator.mediaDevices.enumerateDevices 请求媒体输入和输出设备的列表,例如麦克风,摄像机,耳机设备等 navigator.mediaDevices.getUserMedia 会提示用户给予使用媒体输入的许可,媒体输入会产生一个MediaStream&#xff0c…

伺服系统行业发展

伺服系统行业发展 1 介绍1.1 概述1.2 一般应用1.3 分类按系统功率分类按动力来源分类 1.4 工业控制中的伺服系统1.5 数字信号驱动与模拟信号驱动对比1.6 发展历史 2 伺服系统厂家工业机械臂移动AMR 3 关键指标及难点4 三相交流逆变器(直流电转换为交流电&#xff09…

创建 Code Interpreter Demo: 一次实践的探索

好消息,好消息,Code Interpreter可以测试使用了!!! 在这篇文章中,我们将探索如何创建一个 Code Interpreter Demo。提交一个2023年1-5月份的融资记录数据,让它来帮我们分析一下这些数据。 执行…

TCP 重传机制 滑动窗口 流量控制 拥塞控制 学习总结!

大家好,我是三叔,很高兴这期又和大家见面了,一个奋斗在互联网的打工人。 这篇博客主要记录 tcp 的基础知识的学习总结相关内容!备注:图片均来自作者:小林哥 tcp 的三大特性 tcp 大家都不陌生&#xff0c…

Python制作gif表情包生成工具,斗图再也不会输啦

在当前无表情包不会聊天的时代,怎么也不能输在表情包数量不足上啊,今天咱们就来制作一个 gif 生成工具,用来制作表情包也太好用啦 先来看看整体效果 技术交流 技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人…

如何解决PostgreSQL执行语句长时间卡着不动,不报错也不执行的问题?

1 问题现象 执行SQL语句,卡着不动,不成功也不执行,就像挂住了一样。 truncate table simple; 2 原因分析 一般来说,语句呈现卡着的状态,主要会是两种原因比较多, 原因1:SQL语句是一个耗时操…

Java8新特性——lambda表达式、函数式接口、方法引用、Stream API与Optional类

目录 一、lambda表达式 (一)lambda相关概念 (二)lambda示例 (三)lambda用法 1.语法格式一:无参,无返回值 2.语法格式二:有参数,无返回值 3.数据类型可以省略,因为可由编译器推断得出,称为”类型推断…

统计数据记录

分红20% 分红22% 分红25%

手把手教大家实现 npm 包,并发布 npm 仓库,搭建文档(二)

昨天写了第一篇文章,反响平平 一个 NPM 包,帮助数十万程序员提高数十倍效率,难道不开源出来?(一) 首先贴下我们的官网 【预览页】 https://kennana.github.io/toolkit-use/ 我们的推特 【toolkituse】 https://twitter.com/Toolkituse 我们的github 【toolkit-u…

实现一个周选择器组件

1、需求: 默认每个月的第一个周一为该月的第一周开始,规则如图所示 2、使用到的工具: vue2vant2momentjs 3、父组件: data中定义涉及到的参数 minDate: new Date(this.$moment().subtract(12,month)) maxDate: new Date(),…

OpenCV 入门教程:全局阈值处理

OpenCV 入门教程:全局阈值处理 导语一、全局阈值处理二、示例应用2.1 图像二值化2.2 图像去噪 总结 导语 全局阈值处理是图像处理中常用的技术之一,用于将图像转换为二值图像,从而提取感兴趣的目标区域。在 OpenCV 中,全局阈值处…

Mathtype公式编号,章节号修改

正常插入公式时,选择有编号没有任何问题,但是,当需要根据章节编号时,这个如何处理呢,这个时候需要 公式编号-章节-修改分隔符,然后会弹出一个对话框,这时可以修改章节开始序号。 此外&#xff…

【力扣周赛】第 353 场周赛

文章目录 Q1:6451. 找出最大的可达成数字(脑筋急转弯?)思路竞赛时代码 Q2:6899. 达到末尾下标所需的最大跳跃次数(DP)思路竞赛时代码 Q3:6912. 构造最长非递减子数组(DP&…

Openssh升级方法

文章目录 Openssh升级方法一.安装openssh模拟未升级版本二.查看当前的ssh服务版本 三.启动telnet、安装rzsz工具、创建普通账号,防止因为卸载openssh而导致无法登录主机四.卸载openssh的rpm安装包(备注:此处未卸载ssl安装包)&…

【WebGIS初学到入职】(15)入职一年的总结与分享

题外话 看看大纲可以怎么写,问问ChatGPT: ……算了,还是随便写写吧。 所以时间过得也是有够快的,这就一年了。 平淡 入职一年,已经看到好些位女同事结婚了(男同事一个没有)。领导和同事都挺…

汽车网站建设:开启汽车行业数字化转型的大门

随着科技的进步和互联网的普及,越来越多的汽车企业开始意识到一个强大的在线存在的重要性。汽车网站的兴起为汽车行业带来了新的机遇和好处。本文将简要介绍什么是汽车网站,探讨汽车网站的好处,并提供一些快速制作搭建汽车网站的方法。 汽车网…

@JsonFormat(pattern = “yyyy-MM-dd“, timezone = “GMT+8“) 日期格式

前端去掉时分秒 : /*** 出生日期*/ JsonFormat(pattern "yyyy-MM-dd", timezone "GMT8")// 解决后端到前端显示问题 DateTimeFormat(pattern "yyyy-MM-dd")// 解决前端到后端保存问题 TableField(value "birthday") A…

Django_静态资源配置和ajax(九)

目录 一、静态资源配置 二、AJAX ajax作用 使用ajax 1、环境配置 2、创建html模板文件 3、编写视图函数并添加路由 4、运行django开发服务器进行验证 源码等资料获取方法 一、静态资源配置 静态资源的相关配置都在项目目录下的 settings.py 文件中进行配置。配置参数如…

架构训练营笔记系列: 模块 1-2课

郭东白老师的架构课偏理论,属于道层级。李云华老师的课偏实践,属于术层级。没有理论不会举一反三,只有理论,就是纸上谈兵,两个课都很好。 架构与程序思维的区别 程序 逻辑实现 架构 判断 取舍 架构设计的关键不只…