MATLAB基于深度学习的车辆检测系统

news2025/1/8 4:41:18

   如今机器视觉领域深度学习算法已经大行其道,也让人工智能的实现不再那么遥不可及,但是在目标检测领域,让计算机超越人类还需让更多的人参与进来继续努力。如今众多的高校,甚至中小学已经将人工智能纳入了学习科目,这确实能让人感受到AI的魅力以及社会对其重视程度。印象中玩深度学习仿佛用的都是Python,但其实现在MATLAB也是可以的,并且玩得也不赖。由于高校几乎普遍青睐MATLAB,恐怕很多人最熟悉的编程语言要属它了。在网上查阅了很久,利用MATLAB实现的这类程序属实不多,因此用它来写一个Demo就有必要了。

1. 效果演示

详细介绍前还是先看看整体效果吧,毕竟质量不高的资源网上多得是,没啥吸引力的恐怕大家看都不想看了。先上几个动图看看界面了,界面中默认装载了博主训练好的模型,选择一张图片可标记出目标并显示标记框位置、识别类型及置信度值,GUI界面如下图所示:

识别出的图片结果可通过显示界面右上角上的菜单栏选择另存为图片文件,将带有识别框的图片保存到自己的电脑上。另外界面可实现缩放、拖动等常见图片处理功能,展示界面如下:

选择一个视频格式的文件可对视频进行逐帧检测,在视频中标注出检测结果显示在界面上,最终检测完成的视频文件默认保存在当前文件夹下,该功能的展示界面如下:

本项目所有功能在MATLAB R2020b中已测试通过,想要更多详细展示信息的朋友可以去博主的B站视频中查看,在下面的章节中将介绍如何实现以上展示的功能。


2. 车辆数据集

2.1 BDD 100k数据集

车辆检测的数据集目前有很多,常见的大型开源数据集当属BDD 100K十分好用了,作为自动驾驶常用大型多样化数据集,其标注超过100,000张图像,类别包含公共汽车,行人,自行车,卡车,小汽车,火车和骑手等,用于目标检测、全帧分割等。该数据集的截图如下:

若要下载该数据集,可访问它的官网地址下载,但官网国内的下载速度较慢,这里已将其整理至百度网盘,需要下载的朋友也可通过博主的博文《深度学习常见数据集介绍与下载》获取下载链接。下载后的文件目录如下:

这个数据集确实很大(约10G),训练的时间实在太长了,因此这个项目里面不使用全部的数据,而是选择其中的验证集“bdd100k_val”文件夹下的文件用于训练。要使用全部数据集的朋友可将程序中的路径修改为完整数据集文件夹。

为了使得该数据集能够方便用MATLAB处理,从原数据集的标注文件“bdd100k_labels_images_val.json”文件中抽取了小汽车的类别,并重新写入到mat文件中。筛选和处理部分图片后,标注文件的信息包括图片路径和标注框的坐标,其数据文件的信息如下:

2.2 自定义数据集

若要使用自行定义的数据集可按照以上的格式进行处理,通过脚本将标注文件保存为mat格式,如下图所示为自定义的数据集的图片文件截图和标注文件:

这两个数据集都已放在文件夹中,后者只有几百张图片,因此对于想要学习和调试代码的朋友会很方便。如果不是特别注重准确率,建议使用第二个数据集,在训练和测试的时候速度会快很多,最后的结果其实也还可以,不妨一试。


3. 搭建并训练网络

3.1 加载数据集

首先载入准备好的数据集,查看并显示数据信息。其次,对于图片数据集需要为训练器指定好每张图片的绝对路径,以方便读取:

clearclc

doTraining = true; % 是否进行训练

% 解压数据% data = load('./data/carDatasetGroundTruth.mat');% vehicleDataset = data.carDataset; % table型包含文件路径和groundTruthdata = load('./data/vehicleDatasetGroundTruth.mat');vehicleDataset = data.vehicleDataset; % table型包含文件路径和groundTruth

% 添加绝对路径至vehicleDataset中vehicleDataset.imageFilename = fullfile([pwd, '/data/'],vehicleDataset.imageFilename);

% 显示数据集中的一个图像以了解它包含的图像的类型vehicleDataset(1:4,:) % 显示部分数据情况

以上代码首先载入了标注文件,然后通过fullfile函数将当前文件夹位置添加到图片路径中,运行可以查看到部分标注信息如下:

ans =

  4×2 table

                                   imageFilename                                     vehicle   

    ___________________________________________________________________________    ____________

    {'E:\Works\code\VehicleDetection\train\data\vehicleImages\image_00001.jpg'}    {1×4 double}

    {'E:\Works\code\VehicleDetection\train\data\vehicleImages\image_00002.jpg'}    {1×4 double}

    {'E:\Works\code\VehicleDetection\train\data\vehicleImages\image_00003.jpg'}    {1×4 double}

    {'E:\Works\code\VehicleDetection\train\data\vehicleImages\image_00004.jpg'}    {1×4 double}

将数据集分成两部分:一个是用于训练检测器的训练集,一个是用于评估检测器的测试集,这里选择70%的数据进行训练,其余数据用于评估。该部分代码如下:

% 将数据集分成两部分一个是用于训练检测器的训练集一个是用于评估检测器的测试集% 选择70%的数据进行训练其余数据用于评估rng(0); % 控制随机数生成shuffledIndices = randperm(height(vehicleDataset));idx = floor(0.7 * length(shuffledIndices) );trainingDataTbl = vehicleDataset(shuffledIndices(1:idx),:);testDataTbl = vehicleDataset(shuffledIndices(idx+1:end),:);

将划分出的训练和验证数据集数据和标签进行转存,实现代码如下:

% 保存数据和标签imdsTrain = imageDatastore(trainingDataTbl{:,'imageFilename'}); % 路径bldsTrain = boxLabelDatastore(trainingDataTbl(:,'vehicle')); % 真实框和类别

imdsTest = imageDatastore(testDataTbl{:,'imageFilename'});bldsTest = boxLabelDatastore(testDataTbl(:,'vehicle'));

联合文件路径和真实框,整理训练和测试集,这部分实现代码如下:

% 整理训练测试集trainingData = combine(imdsTrain,bldsTrain); % 联合文件路径和真实框testData = combine(imdsTest,bldsTest);

为了帮助了解标注信息的使用,可读取trainingData中的图片数据及真实框,通过insertShape函数在图像中进行标注并显示:

% 显示数据data = read(trainingData); % data包括图片数据真实框坐标类别I = data{1};bbox = data{2};annotatedImage = insertShape(I,'Rectangle',bbox); % 在数据矩阵中标出真实框annotatedImage = imresize(annotatedImage,2);figureimshow(annotatedImage) % 显示图像

显示标注图像如下图所示:

3.2 创建YOLO目标检测器

搭建YOLO v2目标检测网络:YOLO v2由特征提取网络和检测网络两个子网络组成。特征提取网络通常是预训练的CNN,这里特征提取网络使用的是ResNet-50,当然还可以使用其他经过预训练的网络,例如MobileNet v2ResNet-18,一般根据应用场景和问题的复杂程度选择合适的网络。与特征提取网络相比,检测网络是一个小的CNN,它由一些卷积层和YOLO v2特有的层组成。MATLAB中提供了yolov2Layers函数,其中给定了预训练的ResNet-50特征提取网络,可使用该功能自动创建YOLO v2对象检测网络。

yolov2Layers要求指定几个输入来参数化YOLO v2网络,详细使用方法可参考其官方文档,其参数主要有:

  • 网络输入大小
  • 锚框
  • 特征提取网络

在目标检测中网络的输入尺寸一定程度上会影响检测结果,因此需要评估网络输入大小和数据的类别数选定。在选择网络输入大小时,应先考虑网络本身所需的最小尺寸、训练图像的大小以及在选定大小下处理数据所产生的计算量。一般情况下,倾向于选择一个接近于训练图像大小且大于网络所需输入大小的网络输入,这里为了减少运行程序的计算成本,指定网络输入大小为[224 224 3](运行网络所需的最小尺寸)。

% 创建yolo网络inputSize = [448 448 3];numClasses = width(vehicleDataset)-1; % 通过table的列数计算类别数

开始训练之前需要估算锚框,这要考虑图像的调整大小,调整训练数据的大小以估计锚框。好在MATLAB中提供了estimateAnchorBoxes函数,根据训练数据中对象的大小来估计锚框。根据transform函数预处理的训练数据,然后确定锚框个数并估计锚框。使用内置的函数preprocessData将训练图像数据调整为网络规定的输入大小。

% 用于评估锚框个数trainingDataForEstimation = transform(trainingData,@(data)preprocessData(data,inputSize));numAnchors = 7;[anchorBoxes, meanIoU] = estimateAnchorBoxes(trainingDataForEstimation, numAnchors)

输出结果如下:

inputSize = [448 448 3];anchorBoxes =

    14    10

    34    25

   226   176

   218   114

   124    75

   132   122

    65    53meanIoU =

    0.6960

设置特征提取层网络为resnet50,选择‘activation_40_relu’作为特征提取层。该特征提取层输出的特征图经过16倍下采样,这样的下采样量算是空间分辨率与所提取特征强度之间的一个折中,因为经过网络提取的特征可能会在网络上显示出更强的图像特征。一般地,空间分辨率的成本以及选择最佳特征提取层需要依据经验分析。搭建网络的代码如下:

% 特征提取层采用resnet50featureExtractionNetwork = resnet50;

featureLayer = 'activation_40_relu';

% 设置yolo网络lgraph = yolov2Layers(inputSize,numClasses,anchorBoxes,featureExtractionNetwork,featureLayer);

3.3 数据增强

数据扩充通过在训练过程中随机转换原始数据来提高网络训练的准确性。通过使用数据增强,我们可以大大扩充训练集的大小,而无需增加实际标记的训练样本的数量。可使用transform通过随机水平翻转图像和关联的框标签来增强训练数据。值得注意的是,理想情况下测试和验证数据应尽可能代表原始数据,未作修改的数据可以较好地评估模型,因此数据扩充不适用于测试和验证数据。进行数据增强的代码如下:

% 进行数据增强augmentedTrainingData = transform(trainingData,@augmentData);

% 可视化增强后的图片augmentedData = cell(4,1);for k = 1:4

    data = read(augmentedTrainingData);

    augmentedData{k} = insertShape(data{1},'Rectangle',data{2});

    reset(augmentedTrainingData);endfiguremontage(augmentedData,'BorderSize',10)

可视化增强后的图片如下:

预处理训练数据:对增强后的训练数据和验证数据进行预处理,准备进行训练。然后读取预处理的训练数据,这里显示一张处理后的图像并标注边界框,帮助我们瞧一下喂给训练器的是何方神圣:

% 对增强数据进行预处理preprocessedTrainingData = transform(augmentedTrainingData,@(data)preprocessData(data,inputSize));

data = read(preprocessedTrainingData);

% 显示一下I = data{1};bbox = data{2};annotatedImage = insertShape(I,'Rectangle',bbox);annotatedImage = imresize(annotatedImage,2);figureimshow(annotatedImage)

显示图像如下:

3.4 训练目标检测网络

训练目标检测器:这里可以使用trainingOptions容器指定网络的训练参数,设置‘ValidationData’作为预处理的验证数据;设置‘CheckpointPath’为一个临时位置,这样能够保证在训练过程中及时保存训练的结果,如果培训因电源中断或系统故障而中断,则可以从保存的检查点恢复训练。训练部分的代码如下:

% 训练参数options = trainingOptions('sgdm', ...

        'MiniBatchSize', 100, ....

        'InitialLearnRate',1e-3, ...

        'MaxEpochs',30,...

        'CheckpointPath', tempdir, ...

        'Shuffle','never');

if doTraining       

    % 训练YOLOv2检测器

    [detector,info] = trainYOLOv2ObjectDetector(preprocessedTrainingData,lgraph,options);else

    % 载入预训练模型

    pretrained = load('yolov2ResNet50.mat');

    detector = pretrained.detector;end

以上代码设置了doTraining决定是否执行训练,当该值为true时开始进行训练,反之则开始进行测试评估。接下来测试训练好的模型并显示测试结果:

% 测试训练好的模型并显示I = imread(testDataTbl.imageFilename{4});I = imresize(I,inputSize(1:2));[bboxes,scores] = detect(detector,I);

I = insertObjectAnnotation(I,'rectangle',bboxes,scores);figureimshow(I)

显示检测结果如下:

3.5 评估网络性能

利用测试集对检测器进行评估:对于训练好的目标检测器有必要在大量图像上进行评估以测试其性能。MATLAB中的Computer Vision Toolbox提供了目标检测器的评估功能,可以测量一些通用指标,例如平均精度(evaluateDetectionPrecision)和对数平均未命中率(evaluateDetectionMissRate)。在本项目中,我们使用平均精度来评估性能,平均精度中包含了检测器做出正确分类的能力(精度)和检测器找到所有相关目标的能力(召回率)。我们将测试数据进行和训练数据相同的预处理操作,最终用来评估检测器,这部分代码如下:

% 预处理测试集preprocessedTestData = transform(testData,@(data)preprocessData(data,inputSize));% 对测试集数据进行测试detectionResults = detect(detector, preprocessedTestData);% 评估准确率[ap,recall,precision] = evaluateDetectionPrecision(detectionResults, preprocessedTestData);

figureplot(recall,precision)xlabel('Recall')ylabel('Precision')grid ontitle(sprintf('Average Precision = %.2f',ap))

精度/召回率(PR)曲线突出显示了在不同召回水平下检测器的精确度,最理想的情况是每处的精度均为1。要想提高平均精度,可以使用更多的训练数据来提高训练效果,但这也需要更多的训练时间。这里使用的是一个数据量较小的数据集,通过以上代码绘制的PR曲线如下图所示:

作为一个演示项目以上的平均精度还算可以了,可以提升的地方首当是训练数据量了,因为只选取了一部分数据这使得模型的泛化性能不高,对于拟合效果也没有作太多的优化,建议大家多做调整优化了。另外,前面代码中涉及到的调用函数这里列出一下:。

% 图像预处理function data = preprocessData(data,targetSize)% 调整图片和Bbox大小至targetSizescale = targetSize(1:2)./size(data{1},[1 2]);data{1} = imresize(data{1},targetSize(1:2));% disp(data{2})data{2} = bboxresize(data{2},scale);end% 图像增强function B = augmentData(A)% 应用随机水平翻转和随机X/Y缩放图像% 如果重叠大于0.25则在边界外缩放的框将被裁减% 变换图像颜色B = cell(size(A));

I = A{1};sz = size(I);if numel(sz)==3 && sz(3) == 3

    I = jitterColorHSV(I,...

        'Contrast',0.2,...

        'Hue',0,...

        'Saturation',0.1,...

        'Brightness',0.2);end

% 随机翻转和缩放图像tform = randomAffine2d('XReflection',true,'Scale',[1 1.1]);rout = affineOutputView(sz,tform,'BoundsStyle','CenterOutput');B{1} = imwarp(I,tform,'OutputView',rout);

% 对锚框进行相同的变换[B{2},indices] = bboxwarp(A{2},tform,rout,'OverlapThreshold',0.25);B{3} = A{3}(indices);

% 当框的数据不存在时返回原始数据if isempty(indices)

    B = A;endend


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2043485.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

排序(基数,堆,归并)

基数排序 定义0-9十个桶,先排序个数,在排序十位,依次向下(桶就是二维数组) 按照个位先排一次 个位已经有序了,桶内遵循先进先出 没有十位放到0里 取出 百位 这样排序就完成了。放进取出几次,取…

多线程执行的3种场景示例代码

1.环境 语言:java jdk版本:1.8 2.三种线程池场景使用 2.1 固定线程数执行,每个线程只执行1次,最后全部执行完毕后再进入最终方法处理收尾 public static void testEveryThreadFixedExecuteOne() {int threadNum 4;ThreadPoolExe…

C++ | 探索C++多态:虚函数与抽象类的奥秘

目录 二、多态:统一接口下的行为多样性 1、多态的概念 2、多态的实现和构成条件 1、虚函数(Virtual Function) 2、虚函数重写 3、抽象类与接口继承 4、重载、覆盖(重写)、隐藏(重定义)的对比 重载(Overloading) 覆盖&a…

vulnhub靶机 W34KN3SS(渗透测试详解)

一、靶机信息收集 1、靶机下载地址 https://download.vulnhub.com/w34kn3ss/W34KN3SS.ova 2、扫描靶机IP 3、探测靶机端口、主机、服务版本信息 nmap -sS -sV -A -p- 192.168.31.160 4、进行目录扫描 二、web渗透测试 1、访问靶机IP 没什么发现 2、进行目录拼接访问 拼接…

【鸿蒙学习】HarmonyOS应用开发者基础 - 构建更加丰富的页面(一)

学完时间:2024年8月14日 一、前言叨叨 学习HarmonyOS的第六课,人数又成功的降了500名左右,到了3575人了。 二、ArkWeb 1、概念介绍 ArkWeb是用于应用程序中显示Web页面内容的Web组件,为开发者提供页面加载、页面交互、页面调…

Your local changes would be overwritten by merge git

方法二 直接覆盖本地的代码,放弃自己本地的改动,只保留服务器端代码 直接回退到上一个版本,再进行pull。 【步骤】 直接 VCS -> Git -> Reset HEAD… 选择需要的reset模式:hard(即放弃本地代码,新修…

Unity引擎加密方案解析

据悉,Unity引擎的全球市场占有率已经超过50%,而在全球排名前1000的手游当中,这一数据更是高达73%。不止如此,Unity在中国拥有高达350万的注册用户,《崩坏星穹铁道》、《王者荣耀》等爆款游戏均为Unity引擎开发。 庞大…

使用 LabVIEW 编程更改 IMAQ/IMAQdx 接口的相机文件

问题详情 可能需要通过编程方式更改与 IMAQ/IMAQdx 接口关联的相机文件。这种需求通常发生在图像采集系统中,例如使用 PCIe-1433 硬件时,可能需要动态切换不同的相机配置文件来适应不同的应用场景。 解决方案 当前在 Measurement & Automation Ex…

博出精彩,向新而行!2024海博思创应届毕业生集训营圆满结营

近日,海博思创迎来了一群充满活力的新海博人,他们带着对未来的憧憬与梦想,即将在这里开启自己职业生涯的首个篇章。7月26日,公司为2024年应届毕业生举行了集中培训结营仪式,标志着他们正式完成了“职场第一课”。 本次…

html+css+js网页设计 移动端 京东6个页面

htmlcssjs网页设计 移动端 京东6个页面 网页作品代码简单,可使用任意HTML编辑软件(如:Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作)。 获取源码 1&#…

【已解决】windows如何修改MAC地址

问题介绍: 在公司的电脑上使用另一个网口连接网线,无法使用网络。原因是因为使用公司网络需要向公司申请,公司需要通过MAC地址开通上网权限。解决办法:通过将可以该网口的MAC地址绑定为可以上网的MAC地址 电脑系统 windows11 打开…

卫星直击俄乌前线:俄罗斯在库尔斯克地区修筑防御工事

俄罗斯武装力量军事政治总局副局长阿普季阿劳季诺夫14日说,约1.2万名乌克兰及其他国家士兵近日进入俄罗斯库尔斯克州。 乌克兰总统弗拉基米尔泽连斯基同一天表示,乌军在库尔斯克地区“进展顺利”。 卫星图像显示,俄罗斯在库尔斯克利戈夫地区…

ArcGIS简单介绍

ArcGIS体系结构 (1)GIS Server 宿主各种GIS资源,将他们封装为服务提供给客户端应用。GIS Server分为两部分:Server Object Manager(SOM)和Server Object Containers(SOCs)。一个SO…

数据在内存中的存储(了解大小端字节序浮点数在内存中存储)详细~

目录 1、整数在内存中的存储 2、了解大小端字节序 2.0 为什么有大小端之分呢? 3、练习题 3.1 练习01 3.2 练习02 3.3 练习03 3.4 练习04 3.5 练习05 3.6 练习06 4、浮点数在内存中的存储 4.0 浮点数在计算机内部的表示方法 4.1 浮点数存的过程 4.2 浮点数取的过…

FreeRTOS——优化系统(基于百问网FreeRTOS教学视频)

文章目录 一、精细调整栈大小二、打印所有任务的栈信息三、统计CPU占比找出有问题的任务 一、精细调整栈大小 在创建任务时分配了栈,可以填入固定的数值比如 0xa5,以后可以使用以下函数查看" 栈的高水位",也就是还有多少空余的栈空…

完美解决RTX5源码工程+最新emWin6.40的编译兼容问题,使能C编译器使用C11可解决

最新的emWin6.40仅提供了.a格式库,这个库兼容MDK,IAR和GCC,但是在MDK AC6下使用需要做如下操作 -fno-short-wchar -fshort-enums 他这个操作,正好跟RTX5源码工程添加的一个设置冲突了,通过搜索资料,发现使…

性能测试 —— linux服务器搭建JMeter+Grafana+Influxdb监控可视化平台!

前言 在当前激烈的市场竞争中,创新和效率成为企业发展的核心要素之一。在这种背景下,如何保证产品和服务的稳定性、可靠性以及高效性就显得尤为重要。 而在软件开发过程中,性能测试是一项不可或缺的环节,它可以有效的评估一个系…

优先级队列的实现

什么是优先级队列 优先级队列是一种特殊的数据结构,它类似于队列或栈,但是每个元素都关联有一个优先级或权重。在优先级队列中,元素的出队顺序不是简单地按照它们进入队列的先后顺序(先进先出,FIFO)&#…

vulnhub靶机 DC-9(渗透测试详解)

一、靶机信息收集 1、靶机下载 https://download.vulnhub.com/dc/DC-9.zip 2、靶机IP扫描 3、探测靶机主机、端口、服务版本信息 4、靶机目录扫描 二、web渗透测试 1、访问靶机IP 查看页面功能点,发现一个搜索框和登录框 2、测试一下是否存在sql注入 查看当前数…

快速解析数据挖掘,最短时间明白什么是数据挖掘------下

信息损失函数 (Information Loss Function)是衡量在数据转换或处理过程中信息丢失的程度的函数。在数据科学、机器学习和统计学中,信息损失是一个重要的概念,尤其是在数据降维、特征选择、数据压缩和隐私保护等领域。 信息损失函…