智能驾驶车牌检测和识别（三）《CRNN和LPRNet实现车牌识别（含车牌识别数据集和训练代码）》

1. 前言

2. 车牌识别的方法

3. 车牌检测+识别数据集

4. 车牌检测模型训练

5. 车牌识别模型训练

（1）项目框架说明

（2）构建Train和Test车牌识别数据

（3）构建模型

（4）修改配置文件：config_crnn.yaml

（5）开始训练

（6）可视化训练过程

（7）一些说明和优化建议

6. 车牌识别效果（Python版本）

7. 车牌识别效果（Android版本）

8. 车牌识别项目源码下载

1. 前言

这是项目《智能驾驶车牌检测和识别》系列之《CRNN和LPRNet实现车牌识别（含车牌识别数据集和训练代码）》；项目将搭建一个智能的支持多车牌的车牌检测和识别系统；整套项目主要包含两大算法：

（1）车牌检测：项目使用YOLOv5进行车牌检测，轻量化后的模型可以部署到Android平台或者开发板上，在多线程或者GPU下，可以达到实时车牌检测效果

（2）车牌识别：项目基于CRNN或LPRNet模型构建车牌识别算法，支持绿牌和蓝牌识别；为方便后续工程化，项目对CRNN模型进行魔改，提出一个PlateNet模型，用于支持部署到Android平台或者开发板上

整套智能车牌检测和识别系统，在普通Android手机上可以达到实时的检测效果，CPU(4线程)约30ms左右，GPU约25ms左右，基本满足业务的性能需求。下表格给出CRNN，LPRNet和PlateNet模型的计算量和参数量以及其车牌识别的准确率：

模型	input-size	params(M)	GFLOPs	Accuracy
LPRNet	94×24	0.48M	0.147GFlops	0.9393
CRNN	160×32	8.35M	1.06GFlops	0.9343
PlateNet	168×48	1.92M	1.25GFlops	0.9583

车牌识别Demo效果展示：

【整套项目下载地址】：

【Android Demo体验】https://download.csdn.net/download/guyuealian/87400593

【尊重原创，转载请注明出处】《CRNN和LPRNet实现车牌识别（含车牌识别数据集和训练代码）》：https://blog.csdn.net/guyuealian/article/details/128704209

更多项目《智能驾驶车牌检测和识别》系列文章请参考：

智能驾驶车牌检测和识别（一）《CCPD车牌数据集》：https://blog.csdn.net/guyuealian/article/details/128704181
智能驾驶车牌检测和识别（二）《YOLOv5实现车牌检测（含车牌检测数据集和训练代码）》：https://blog.csdn.net/guyuealian/article/details/128704068
智能驾驶车牌检测和识别（三）《CRNN和LPRNet实现车牌识别（含车牌识别数据集和训练代码）》：https://blog.csdn.net/guyuealian/article/details/128704209
智能驾驶车牌检测和识别（四）《Android实现车牌检测和识别（可实时识别车牌）》：https://blog.csdn.net/guyuealian/article/details/128704242
智能驾驶车牌检测和识别（五）《C++实现车牌检测和识别（可实时识别车牌）》：https://blog.csdn.net/guyuealian/article/details/128704276
智能驾驶红绿灯检测（一）《红绿灯(交通信号灯)数据集》：https://blog.csdn.net/guyuealian/article/details/128222850
智能驾驶红绿灯检测（二）《YOLOv5实现红绿灯检测(含红绿灯数据集+训练代码)》：https://blog.csdn.net/guyuealian/article/details/128240198
智能驾驶红绿灯检测（三）《Android实现红绿灯检测(含Android源码可实时运行)》：https://blog.csdn.net/guyuealian/article/details/128240334
智能驾驶车辆检测（一）《UA-DETRAC BITVehicle车辆检测数据集》：https://blog.csdn.net/guyuealian/article/details/127907325
智能驾驶车辆检测（二）《YOLOv5实现车辆检测(含车辆检测数据集+训练代码)》：https://blog.csdn.net/guyuealian/article/details/128099672
智能驾驶车辆检测（三）《Android实现车辆检测(含Android源码可实时运行)》：https://blog.csdn.net/guyuealian/article/details/128190532

2. 车牌识别的方法

传统的车牌识别的方法主要采用字符分割的方法实现车牌识别，即先将车牌图像按照预定的规则将车牌的字符一个一个切割，并按照模式匹配的方法识别车牌字符；显然该方法效率低，准确率也不高；

目前，车牌识别的研究方向是基于深度学习的无分割的车牌识别方法，即将车牌识别问题转化为字符序列标记问题，如项目使用的CRNN，LPRNet和PlateNet等模型都是无分割的车牌识别方法。

上述介绍的几种车牌识别方法，都需要进行车牌定位，然后才能进行车牌识别；当然也存在无需车牌定位(车牌检测)的方法，即将定位和识别放在了一个网络上，真正实现了一个网络端到端的车牌识别《Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks》

项目将搭建一个车牌检测和识别系统；整套项目主要包含两大算法：

（1）车牌检测：项目使用YOLOv5进行车牌检测，轻量化后的模型可以部署到Android平台或者开发板上，在多线程或者GPU下，可以达到实时车牌检测效果

（2）车牌识别：项目基于CRNN或LPRNet模型构建车牌识别算法，支持绿牌和蓝牌识别；为方便后续工程化，项目对CRNN模型进行魔改，提出一个PlateNet模型，用于支持部署到Android平台或者开发板上

3. 车牌检测+识别数据集

目前收集了约30W+的车牌检测数据集（含蓝牌和绿牌），主要使用开源的CCPD车牌数据集，关于CCPD车牌数据集说明，请参考智能驾驶车牌检测和识别（一）《CCPD车牌数据集》：https://blog.csdn.net/guyuealian/article/details/128704181

4. 车牌检测模型训练

项目使用YOLOv5进行车牌检测，轻量化后的模型可以部署到Android平台或者开发板上，在多线程或者GPU下，可以达到实时车牌检测效果，关于车牌检测模型训练的说明，请参考智能驾驶车牌检测和识别（二）《YOLOv5实现车牌检测（含车牌检测数据集和训练代码）》：https://blog.csdn.net/guyuealian/article/details/128704068

5. 车牌识别模型训练

（1）项目框架说明

.
├── configs
├── core
├── data
├── docs
├── modules
├── output
├── README.md
├── demo.py
├── demo.sh
├── train.py
└── train.sh

（2）构建Train和Test车牌识别数据

车牌识别数据，主要来源于CCPD数据集，训练数据和测试数据的数据格式，要求非常简单：

对车牌进行裁剪时，请尽量保证车牌号的完整性，其他车身等非车牌区域尽量去除，仅裁剪车牌区域即可
一张图片仅包含一个车牌，可以绿牌也可以蓝牌
车牌图片文件命名规则：车牌号_序号ID ；如【沪AD07225_00798_000.jpg】，其中【沪AD07225】表示这个张图片的真实车牌号，【00798_000】是序号ID，这个序号ID是为了避免车牌号重复，序号ID可以是任意字符；模型训练时，仅取车牌号作为label进行训练，序号ID会被忽略。
如果，你需要新增自己的车牌识别数据集，请按照上面的要求制作即可

以下是车牌识别数据的样本数据，请参考格式制作即可；项目源码已经附带了制作好的CCPD车牌识别数据集，可以直接用于车牌识别模型训练：

（3）构建模型

项目实现了三个车牌识别模型：CRNN，LPRNet和PlateNet，其计算量和参数量参考如下：

CRNN：最经典的OCR模型了，采用CNN+RNN的网络结构，提出CTC-Loss对齐算法解决不定长序列对齐问题；原始源码是用于文字识别的，稍微改成车牌数据集，即可用于车牌识别了
LPRNet：相比经典的CRNN模型，LPRNet 没有采用RNN结构；是专门设计用于车牌识别的轻量级的模型，整个网络结构设计高度轻量化，参数量仅有0.48M
PlateNet：LPRNet网络结构中存在MaxPool3d等算子，在端上部署时，会存在OP不支持等问题，PlateNet模型去除MaxPool3d，改成使用MaxPool2d，保证模型可端上部署成功。

模型	input-size	params(M)	GFLOPs
LPRNet	94×24	0.48M	0.147GFlops
CRNN	160×32	8.35M	1.06GFlops
PlateNet	168×48	1.92M	1.25GFlops

（4）修改配置文件：config_crnn.yaml

准备好数据好，下一步是修改配置文件config_crnn.yaml的数据路径：

修改train_data和test_data为你自己的数据路径
其他参数保持默认即可

train_data:
  - 'dataset/CCPD2020-voc/train/plates'
  - 'dataset/CCPD2020-voc/val/plates'
  - 'dataset/CCPD2019-voc/ccpd_base/plates-train'
  - 'dataset/CCPD2019-voc/ccpd_blur/plates'
  - 'dataset/CCPD2019-voc/ccpd_challenge/plates'
  - 'dataset/CCPD2019-voc/ccpd_db/plates'
  - 'dataset/CCPD2019-voc/ccpd_fn/plates'
  - 'dataset/CCPD2019-voc/ccpd_rotate/plates'
  - 'dataset/CCPD2019-voc/ccpd_tilt/plates'
  - 'dataset/CCPD2019-voc/ccpd_weather/plates'

test_data:
  - 'dataset/CCPD2020-voc/test/plates'
  - 'dataset/CCPD2019-voc/ccpd_base/plates-test'

class_name: "data/plates_table.txt"
train_transform: "train"
test_transform: "test"
batch_size: 128
net_type: 'CRNN'
flag: "Perspective"
input_size: [ 160, 32 ]
rgb_mean: [ 0.5, 0.5, 0.5 ]
rgb_std: [ 0.5, 0.5, 0.5 ]
resample: True
work_dir: "work_space"
num_epochs: 200
optim_type: 'Adam'
lr: 0.001
weight_decay: 0.0
milestones: [ 100,150,170 ]
momentum: 0.0
gpu_id: [ 0 ]
num_workers: 8
log_freq: 10
pretrained: "data/pretrained/CRNN/CRNN.pth"

配置文件每个参数含义如下：

参数	类型	参考值	说明
train_data	str, list	-	训练数据文件，可支持多个文件
test_data	str, list	-	测试数据文件，可支持多个文件
class_name	str	-	类别文件
train_transform	str	train	训练数据数据处理方法
test_transform	str	test	测试数据数据处理方法
work_dir	str	work_space	训练输出工作空间
net_type	str	CRNN	骨干网络,支持CRNN,LPRNe和PlateNet等模型
intput_size	list	[160,32]	模型输入大小
rgb_mean	list	[0.5,0.5,0.5]	图像归一化均值
rgb_std	list	[0.5,0.5,0.5]	图像归一化方差
resample	bool	True	进行样本均衡
batch_size	int	128	批训练大小
lr	float	0.001	初始学习率大小
optim_type	str	Adam	优化器，{SGD,Adam}
milestones	list	[30,80,100]	降低学习率的节点
momentum	float	0.9	SGD动量因子
num_epochs	int	200	循环训练的次数
num_workers	int	8	DataLoader开启线程数
weight_decay	float	5e-4	权重衰减系数
gpu_id	list	[ 0 ]	指定训练的GPU卡号，可指定多个
log_freq	int	10	显示LOG信息的频率
pretrained	str	model.pth	pretrained的模型

（5）开始训练

整套训练代码非常简单操作，项目源码已经给出CRNN，LPRNet和PlateNet的配置文件；用户只需要修改好配置文件的的数据路径，即可开始训练了。

训练CRNN模型

python train.py -c  configs/config_crnn.yaml

训练LPRNet模型

python train.py -c  configs/config_lprnet.yaml

训练PlateNet模型

python train.py -c  configs/config_platenet.yaml

（6）可视化训练过程

训练过程可视化工具是使用Tensorboard，使用方法：

# 基本方法
tensorboard --logdir=path/to/log/
# 例如（请修改自己的训练的模型路径）
tensorboard --logdir=data/weight/CRNN_Perspective_20230113174750/log

下表格给出CRNN，LPRNet和PlateNet模型的计算量和参数量以及其车牌识别的准确率：

模型	input-size	params(M)	GFLOPs	Accuracy
LPRNet	94×24	0.48M	0.147GFlops	0.9393
CRNN	160×32	8.35M	1.06GFlops	0.9343
PlateNet	168×48	1.92M	1.25GFlops	0.9583

（7）一些说明和优化建议

数据长尾问题：CCPD车牌数据集拍摄的车牌照片的环境复杂多变，包括了倾斜、模糊、雨天、雪天等多个场景的数据，并且大部分图片有且仅含有一个车牌；由于采集人员主要在安徽省城市的停车场进行采集，导致大部分数据都是含【皖】的车牌图片，而其他省份（如宁，藏省份）的车牌比较少，而一些特殊车牌的数据就几乎没有，比如【挂使领民航危险品】这些车牌几乎没有。数据长尾问题这会导致模型识别结果偏向于数据较多的样本类别，车牌省份经常被误识别为【皖】。CCPD数据各个省份的车牌数据统计：

样本均衡：为了减小数据长尾问题的影响，建议实现Re-Sampling机制，或者增加【新吉青琼宁藏】车牌，警用车牌，武警车牌，使馆车牌，民航车牌和危险品车牌等数据集，提高模型的泛化性；项目已经实现Re-Sampling机制，配置文件设置resample=True即可
车牌倾斜的问题：现实场景中，由于摄像头角度安装位置，车牌位置等因素，抓拍的车牌图片往往是倾斜的，这会影响车牌识别的效果；建议对车牌进行倾斜矫正，可以采用opencv的霍夫变换 cv2.HoughLines()进行倾斜矫正，提高识别准确率。项目实现了车牌矫正工具：core/utils/image_correction.py：

双层车牌：项目暂不支持双层车牌识别，一种简单可行的双层车牌识别方法是采用拼接成单层车牌的方式进行识别，如：
车牌颜色问题：普通蓝牌共有7位字符；新能源车牌有8位字符，蓝绿车牌可以通过车牌个数进行判断；当然后续优化，也可以修改模型增加一个分支用于预测车牌的颜色

6. 车牌识别效果（Python版本）

demo.py文件用于推理和测试模型的效果，填写好模型文件以及测试图片即可运行测试了

```
测试CRNN模型
```

image_dir='data/test_image'
model_file='data/weight/CRNN_Perspective_20230113174750/model/best_model_146_0.9343.pth'
net_type="CRNN"
python demo.py --image_dir $image_dir --model_file $model_file --net_type $net_type --use_detector

```
测试LPRNet模型
```

image_dir='data/test_image'
model_file='data/weight/LPRNet_Perspective_20230104142632/model/best_model_011_0.9393.pth'
net_type="LPRNet"
python demo.py --image_dir $image_dir --model_file $model_file --net_type $net_type --use_detector

```
测试PlateNet模型
```

image_dir='data/test_image'
model_file='data/weight/PlateNet_Perspective_20230104102743/model/best_model_186_0.9583.pth'
net_type="PlateNet"
python demo.py --image_dir $image_dir --model_file $model_file --net_type $net_type --use_detector

```
测试视频文件
```

video_file="data/test-video.mp4" # path/to/video.mp4 测试视频文件，如*.mp4,*.avi等
model_file='data/weight/PlateNet_Perspective_20230104102743/model/best_model_186_0.9583.pth'
net_type="PlateNet"
python demo.py --video_file $video_file --model_file $model_file --net_type $net_type --use_detector

```
测试摄像头
```

video_file=0 # 测试摄像头ID
model_file='data/weight/PlateNet_Perspective_20230104102743/model/best_model_186_0.9583.pth'
net_type="PlateNet"
python demo.py --video_file $video_file --model_file $model_file --net_type $net_type --use_detector

车牌识别Demo效果展示：

7. 车牌识别效果（Android版本）

已经完成Android版本车牌检测和识别算法开发，APP在普通Android手机上可以达到实时的检测和识别效果，CPU(4线程)约30ms左右，GPU约25ms左右，基本满足业务的性能需求。详细说明请查看：智能驾驶车牌检测和识别（四）《Android实现车牌检测和识别（可实时识别车牌）》：https://blog.csdn.net/guyuealian/article/details/128704242

Android Demo体验：https://download.csdn.net/download/guyuealian/87400593

8. 车牌识别项目源码下载

整套项目源码内容包含：车牌识别数据集 +车牌识别训练代码和测试代码（Pytorch）

整套项目下载地址：

（1）CCPD车牌识别数据集：

智能驾驶车牌检测和识别（一）《CCPD车牌数据集》_AI吃大瓜的博客-CSDN博客

CCPD2019：官方原始数据，主要是蓝牌数据，约34W；
CCPD2020：官方原始数据，主要是新能源绿牌数据，约1万
CCPD2019-voc：将数据集CCPD2019转换为VOC数据格式（数据在Annotations，JPEGImages文件夹），可直接用于目标检测模型训练
CCPD2020-voc：将数据集CCPD2020转换为VOC数据格式（数据在Annotations，JPEGImages文件夹），可直接用于目标检测模型训练
为了方便后续训练车牌识别模型，数据集提供已经裁剪好的车牌图片，并放在plates文件夹

（2）车牌识别训练代码和测试代码（Pytorch）

车牌识别训练代码，backbone支持CRNN，LPRNet和PlateNet模型，提供pretrained模型
train.py训练简单，简单配置config文件，即可开始训练
项目支持Re-Sampling机制，配置文件设置resample=True即可，可减小数据长尾问题的影响
demo.py支持图片，视频和摄像头测试；
demo.py支持导出onnx文件（export=True）
demo.py支持车牌倾斜矫正（ alignment=True）
提供已经训练好的车牌检测YOLOv5模型(modules/yolov5)，可直接用于车牌检测