【官方框架地址】
https://github.com/WongKinYiu/yolov7.git
【框架介绍】
Yolov7是一种目标检测算法,全称You Only Look Once version 7。它是继Yolov3和Yolov4之后的又一重要成果,是目标检测领域的一个重要里程碑。
Yolov7在算法结构上继承了其前作Yolov3和Yolov4的设计思想,但在许多方面进行了优化和改进。它采用了深度学习技术,利用卷积神经网络对图像进行特征提取,并通过一系列的算法步骤,实现对目标物体的检测和识别。
相比于之前的版本,Yolov7在检测精度和速度上都有了显著的提升。它采用了更深的网络结构,增加了更多的特征层次,提高了特征提取的精度。同时,Yolov7还采用了多尺度特征融合技术,将不同尺度的特征进行融合,增强了模型对不同大小目标的检测能力。
此外,Yolov7还引入了一些新的技术手段,如注意力机制和上下文信息编码等,进一步提高了检测的准确性和鲁棒性。这些技术的引入,使得Yolov7在各种复杂场景下都能表现出色,成为目标检测领域的一个重要里程碑。
总的来说,Yolov7是一种高效、准确的目标检测算法,它在速度和精度上都达到了较高的水平。随着深度学习技术的不断发展,我们有理由相信,Yolov7将继续引领目标检测领域的发展,为人们的生活和工作带来更多的便利和价值
CRNN(Convolutional Recurrent Neural Network)是一种常用于序列化文本识别的深度学习模型,由卷积神经网络(CNN)、循环神经网络(RNN)和转录层(CTC)组成。CRNN模型通过结合CNN和RNN的优点,能够有效地处理图像中的序列化文本,包括识别、转录和校正等任务。
CRNN模型的主要结构包括三个部分:卷积神经网络(CNN)、循环神经网络(RNN)和转录层(CTC)。
- 卷积神经网络(CNN)用于提取输入图像的特征。通过卷积操作,CNN能够从图像中提取局部特征,并通过池化操作降低特征图的维度,从而减少计算量并提高模型的泛化能力。
- 循环神经网络(RNN)用于处理序列化数据。在CRNN模型中,RNN通常采用LSTM(Long Short-Term Memory)或GRU(Gated Recurrent Unit)等变体,能够有效地捕获序列中的长期依赖关系。
- 转录层(CTC)用于将RNN的输出转换为文本序列。CTC通过动态规划算法,将RNN的输出序列转换为最可能的文本序列。
CRNN模型在文本识别任务中具有广泛的应用,包括车牌识别、路标识别、光学字符识别等。此外,CRNN模型还可以与其他技术相结合,如注意力机制、Transformer等,进一步提高模型的性能和准确率。
【效果展示】
【实现部分代码】
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Diagnostics;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using OpenCvSharp;
namespace FIRC
{
public partial class Form1 : Form
{
Bitmap bmp = null;
PlateManager pm = new PlateManager();
public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
OpenFileDialog openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "图文件(*.*)|*.jpg;*.png;*.jpeg;*.bmp";
openFileDialog.RestoreDirectory = true;
openFileDialog.Multiselect = false;
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
if(bmp!=null)
{
bmp.Dispose();
}
bmp = new Bitmap(openFileDialog.FileName);
pictureBox1.Image = bmp;
}
}
private void button2_Click(object sender, EventArgs e)
{
if(pictureBox1.Image==null)
{
return;
}
Stopwatch sw = new Stopwatch();
sw.Start();
var result = pm.Inference(bmp);
sw.Stop();
this.Text = "耗时" + sw.Elapsed.TotalSeconds + "秒";
var resultImg = pm.DrawImage(bmp,result);
pictureBox2.Image = resultImg;
}
private void Form1_Load(object sender, EventArgs e)
{
pm.LoadWeights();
}
private void btn_video_Click(object sender, EventArgs e)
{
VideoCapture capture = new VideoCapture(0);
if (!capture.IsOpened())
{
Console.WriteLine("video not open!");
return;
}
Mat frame = new Mat();
var sw = new Stopwatch();
int fps = 0;
while (true)
{
capture.Read(frame);
if (frame.Empty())
{
Console.WriteLine("data is empty!");
break;
}
sw.Start();
var bmp = OpenCvSharp.Extensions.BitmapConverter.ToBitmap(frame);
var result = pm.Inference(bmp);
var resultImg = pm.DrawImage(bmp, result);
var resultMat = OpenCvSharp.Extensions.BitmapConverter.ToMat(resultImg);
sw.Stop();
fps = Convert.ToInt32(1 / sw.Elapsed.TotalSeconds);
sw.Reset();
Cv2.PutText(resultMat, "FPS=" + fps, new OpenCvSharp.Point(30, 30), HersheyFonts.HersheyComplex, 1.0, new Scalar(255, 0, 0), 3);
//显示结果
Cv2.ImShow("Result", resultMat);
int key = Cv2.WaitKey(10);
if (key == 27)
break;
}
capture.Release();
}
}
}
【视频演示】
https://www.bilibili.com/video/BV1i5411y7FK/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee
【源码下载】
https://download.csdn.net/download/FL1623863129/88781345
【测试环境】
VS2019.netframework4.7.2