第四十七章 MNIST实验
在上一章节中,介绍了利用maix.KPU模块实现了车牌的检测和识别,本章将继续介绍利用maix.KPU模块实现的MNIST识别。通过本章的学习,读者将学习到MNIST识别应用在CanMV上的实现。
本章分为如下几个小节:
47.1 maix.KPU模块介绍
47.2 硬件设计
47.3 程序设计
47.4 运行验证
47.1 maix.KPU模块介绍
有关maix.KPU模块的介绍,请见第39.1小节《maix.KPU模块介绍》。
47.2 硬件设计
47.2.1 例程功能
- 获取摄像头输出的图像,对图像进行预处理后,送入KPU进行MNIST手写数字识别,然后在LCD上显示识别出的数字和其对应的得分。
47.2.2 硬件资源
本章实验内容,主要讲解maix.KPU模块的使用,无需关注硬件资源。
47.2.3 原理图
本章实验内容,主要讲解maix.KPU模块的使用,无需关注原理图。
47.3 程序设计
47.3.1 maix.KPU模块介绍
有关maix.KPU模块的介绍,请见第47.1小节《maix.KPU模块介绍》。
47.3.2 程序流程图
图47.3.2.1 人脸识别实验流程图
47.3.3 main.py代码
main.py中的脚本代码如下所示:
import lcd
import sensor
import gc
from maix import KPU
lcd.init()
sensor.reset()
sensor.set_framesize(sensor.QVGA)
sensor.set_pixformat(sensor.RGB565)
sensor.set_hmirror(False)
构造并初始化MNIST识别KPU对象
mnist_recognizer = KPU()
mnist_recognizer.load_kmodel(“/sd/KPU/uint8_mnist_cnn_model.kmodel”)
while True:
# 获取摄像头输出图像
img = sensor.snapshot()
roi = ((img.width() - img.height()) // 2, 0, img.height(), img.height())
img.draw_rectangle(roi, color=(0, 255, 0))
# 对图像进行预处理
gray_img = img.copy(roi)
gray_img.to_grayscale()
gray_img.resize(112, 112)
gray_img.invert()
gray_img.strech_char(1)
gray_img.pix_to_ai()
# 将图像送入卷积神经网络进行识别,并获取识别结果
output = mnist_recognizer.run_with_output(gray_img, getlist=True)
number = output.index(max(output))
score = KPU.sigmoid(max(output))
img.draw_string(2, 2, str(number), color=(255, 0, 0), scale=1.5)
img.draw_string(2, 16 + 2, str(score), color=(255, 0, 0), scale=1.5)
del gray_img
lcd.display(img)
gc.collect()
可以看到一开始是先初始化了LCD和摄像头,并分别构造并初始化了用于MNIST手写数字识别的KPU对象。
然后便是在一个循环中不断地获取摄像头输出的图像,在对图像进行预处理后,将图像送入卷积神经网络中进行计算和识别,最后将识别出的结果在图像上进行绘制,然后在LCD上显示图像。
47.4 运行验证
将DNK210开发板连接CanMV IDE,点击CanMV IDE上的“开始(运行脚本)”按钮后,将摄像头对手写数字,让其采集到手写数字图像,接着便可以看到LCD上显示了MNIST手写数字识别的结果,显示了识别出的数字结果及其对应的得分,如下图所示:
图47.4.1 LCD显示MNIST识别实验结果