基于深度学习的卷积神经网络十二生肖图像识别系统(PyQt5界面+数据集+训练代码)

news2024/11/30 12:21:55

本研究提出了一种基于深度学习的十二生肖图像识别系统,旨在利用卷积神经网络(CNN)进行图像分类,特别是十二生肖图像的自动识别。系统的核心采用了两种经典的深度学习模型:ResNet50和VGG16,进行图像的特征提取和分类。为了提高系统的用户体验,本研究还设计了一个图形用户界面(GUI),使得用户能够通过简单的操作进行图像上传、模型选择、分类检测及结果展示。

系统的实现主要基于PyTorch深度学习框架,并使用了ResNet50和VGG16这两种预训练的模型。首先,对于输入图像进行预处理,包括尺寸调整和归一化,使其符合网络的输入要求。接着,利用这两种模型进行特征提取和图像分类,并将预测结果展示在界面上。系统还提供了一个下拉框,允许用户选择不同的模型(ResNet50或VGG16),并基于选择的模型加载相应的权重文件进行预测。

在模型性能的比较方面,实验表明,ResNet50在准确率和推理速度上优于VGG16。通过对多个图像数据集的测试,ResNet50展示出了更强的鲁棒性,尤其在复杂图像背景下,能够保持较高的分类精度。而VGG16在某些特定场景下,虽然分类精度稍逊一筹,但仍具有较好的表现,且模型结构较为简单,适合在计算资源有限的环境下使用。

此外,系统还实现了用户友好的交互功能,支持实时的图像上传和分类结果展示。用户只需选择图像文件,系统即可自动进行分类并显示相应的结果和分类置信度,极大地方便了非技术用户的使用。为了确保系统的高效性和可扩展性,模型的推理部分进行了优化,以适应不同设备和平台上的实时应用需求。

通过对比ResNet50和VGG16的性能,本研究还探讨了在实际应用中如何根据需求选择适合的模型。在实时分类和处理要求较高的场景中,ResNet50凭借其更深的网络结构和更快的推理速度,显然是一个更合适的选择。与此同时,VGG16作为一个经典模型,仍在许多低延迟应用中发挥着重要作用。

本研究的系统不仅为十二生肖图像识别提供了一个可操作的解决方案,还为未来多类别图像分类任务提供了借鉴。通过优化深度学习模型的推理过程和结合图形用户界面的设计,能够为相关领域的图像识别系统开发提供有价值的参考。此外,未来的工作还可以在系统中集成更多的模型和功能,进一步提高分类精度,拓展系统的应用范围,满足更广泛的商业和科研需求。

算法流程

项目数据

传统的机器学习算法对图像进行识别等研究工作时,只需要很少的图像数据就可以开展工作。而在使用卷积神经网络解决研究的十二生肖识别问题的关键其一在于搭建合适的神经网络,其二更需要具备大量优质的训练数据集,在大量的有标签数据不断反复对模型进行训练下,神经网络才具备我们所需要的分类能力,达到理想的分类效果。因此有一个质量较好的图像数据集至关重要。

数据集介绍:
本研究使用的十二生肖数据集包含8508张图像,涉及中国传统文化中的十二生肖类别:鼠、牛、虎、兔、龙、蛇、马、羊、猴、鸡、狗、猪。每个类别的图像代表了不同的生肖形象,可能是艺术作品、卡通图像或动物照片。该数据集为图像分类任务提供了丰富的多样性,既包括不同风格的生肖图像,又覆盖了不同的拍摄角度和光照条件。

数据集已被预先标注,每个类别的图像数量基本均衡,为训练和验证提供了稳定的基准。数据集被划分为训练集和测试集,其中每类生肖图像的数量分别如下:
(1)训练集:每类600张图像,共7200张图像。

(2)测试集:每类55张图像,共660张图像。

这种划分方式保证了数据的多样性和代表性,同时通过验证集和测试集的独立性,能够有效评估模型的泛化能力。

数据预处理
为了提高模型的泛化能力并防止过拟合,我们对数据集进行了数据预处理。具体步骤如下:
(1)尺寸标准化:所有图像被调整为统一的224×224像素,以适配VGG16和ResNet50等模型的输入要求。
(2)归一化:对图像进行归一化处理,标准化RGB通道的像素值,使其均值为[0.485, 0.456, 0.406],标准差为[0.229, 0.224, 0.225]。这些参数是基于ImageNet数据集计算得出的,适用于VGG16和ResNet50的预训练模型。

数据增强
1.训练集增强:
(1)随机裁剪:随机裁剪图像并调整为224×224的尺寸,增加数据的多样性,帮助模型更好地学习到不同的尺度和视角。
(2)随机水平翻转:随机对训练图像进行水平翻转,进一步增加数据集的变异性,提高模型的鲁棒性。

2.验证集增强:
(1)Resize和CenterCrop:将验证图像的长边调整为256像素,然后从中心裁剪224×224区域,确保数据统一性。

通过数据增强和标准化处理,能有效提高模型对各种变换的适应能力,从而提升其在不同场景下的分类效果。

数据集划分
数据集已预先划分为两个部分:训练集和测试集,具体如下:
(1)训练集:每类600张图像,共7200张图像,用于模型训练,通过最小化损失函数优化参数。
(2)测试集:每类55张图像,共660张图像,用于评估模型在未见数据上的表现

这种数据集划分方式有助于保证模型训练和评估的可靠性,确保各数据集独立,避免数据泄露和过拟合。

实验硬件
本实验的硬件环境设置如下:
(1)计算平台:NNVIDIA GeForce RTX 3070 Ti。(8GB显存),支持CUDA加速
(2)CPU:12th Gen Intel(R) Core(TM) i9-12900H 2.50 GHz 14核处理器
(3)内存:32GB RAM
(4)存储:1TB SSD,用于存储数据集和模型权重

该硬件环境提供了足够的计算资源,能够支持大规模图像数据的训练和高效计算,尤其在使用GPU进行加速时,训练时间得到了显著缩短。

实验超参数设置
本实验中的主要超参数设置如下:
(1)学习率:0.0001,使用Adam优化器,能够自适应调整学习率,表现较好。
(2)批次大小:训练时为32,验证时为64,较小的批次大小有助于稳定训练并提高计算效率。
(3)优化器:使用Adam优化器,适用于稀疏数据和非凸问题。
(4)损失函数:采用交叉熵损失函数(CrossEntropyLoss),适用于多分类任务。
(5)训练轮数:设定为15轮,帮助模型逐渐收敛。
(6)权重初始化:使用预训练的VGG16和ResNet50权重进行迁移学习,加速收敛并提高分类性能。

这些超参数设置经过反复调试,以确保模型在验证集上表现良好。

实验过程与结果分析

Tipps:分析VGG16和ResNet50两种模型在十二生肖图像分类任务中的实验结果。包括训练过程中的损失与准确率变化、模型性能对比、混淆矩阵(热力图)分析、过拟合与欠拟合的讨论,以及训练时间与计算效率的分析。

训练过程中的损失与准确率变化
为了评估模型在训练过程中的表现,我们记录了每个epoch的训练损失、训练准确率以及验证损失、验证准确率。通过这些指标,我们可以观察到模型是否能够有效收敛,以及是否存在过拟合或欠拟合的情况。

1.1 VGG16模型训练过程
VGG16模型在训练过程中的损失和准确率曲线如下所示:
 


(1)训练损失:VGG16的训练损失随着epoch的增加逐渐降低。在前几个epoch中,训练损失下降较快,表明模型能够迅速适应训练数据。随着训练的进行,损失的下降幅度逐渐减小,表明模型逐渐接近其在训练数据上的最优表现。
(2)训练准确率:训练准确率从0.845开始逐渐上升,接近1的准确率表明模型在训练集上逐步取得了较好的分类效果。在最终的训练过程中,VGG16模型达到了较高的训练准确率,约为0.92。
(3)验证损失与验证准确率:验证集的损失和准确率表现出一定的波动,但总体呈现稳定向好的趋势。验证准确率略低于训练准确率,约为0.89,说明模型在训练集上的表现较好,但在验证集上仍有一定的提升空间。

1.2 ResNet50模型训练过程
ResNet50模型在训练过程中的损失和准确率曲线如下所示:
 


(1)训练损失:ResNet50的训练损失在前期下降迅速,随后趋于平稳,表明该模型在训练数据上逐渐达到最优。与VGG16相比,ResNet50的损失下降速度较快,且在整个训练过程中较为稳定,最终的训练损失较低,接近0.24。
(2)训练准确率:ResNet50的训练准确率从0.92开始逐渐上升,最终达到了0.94左右,说明模型在训练集上取得了较高的分类效果,且稳定性较好。
(3)验证损失与验证准确率:与训练准确率和损失一致,ResNet50在验证集上的准确率也保持较高,最终验证准确率接近0.91,验证损失相对较低,表现出模型具有较强的泛化能力。

从损失和准确率的曲线来看,ResNet50在训练过程中的收敛速度和稳定性都优于VGG16,表明其更适合处理复杂的分类任务。

模型性能对比
1.VGG16与ResNet50的准确率比较
在训练和验证过程中,ResNet50模型表现出了更高的准确率,尤其是在验证集上的表现更为突出。VGG16的最终训练准确率为0.92,验证准确率为0.89,而ResNet50的训练准确率为0.94,验证准确率为0.91。
(1)训练准确率:ResNet50模型的训练准确率始终高于VGG16模型,且在后期没有出现明显的过拟合现象。
(2)验证准确率:ResNet50的验证准确率也明显高于VGG16,表明ResNet50在未见过的数据上表现出更强的泛化能力。

2.损失函数与准确率曲线分析
(1)从损失函数和准确率的曲线图中可以观察到,ResNet50的损失下降速度较快,且整体上低于VGG16,验证准确率也优于VGG16。VGG16在训练过程中虽然表现不错,但其验证准确率波动较大,且未能如ResNet50一样稳定提升。
(2)在训练集上,VGG16和ResNet50的准确率差距并不大,但在验证集上,ResNet50的表现明显优于VGG16。这表明ResNet50能够更好地从训练数据中提取特征,并具备更强的泛化能力。

混淆矩阵分析(热力图)
为了更全面地分析模型的分类性能,我们生成了混淆矩阵并将其可视化为热力图,帮助我们直观地了解模型在哪些类别上表现较好,在哪些类别上存在误分类。

1.VGG16的热力图:VGG16模型在一些类别之间(如“牛”和“马”)存在较高的混淆,尤其是这两类生肖在视觉特征上较为相似,导致模型在这些类别的分类上出现错误。

2.ResNet50的热力图:相比之下,ResNet50的混淆矩阵显示出较少的误分类,尤其是在复杂类别的区分上,表现出更好的分类能力。ResNet50通过残差连接和更深的网络结构,能够有效提取更多的特征,从而减少了类别之间的混淆。

通过混淆矩阵的分析,ResNet50展示了在类别区分上的优势,尤其是在处理视觉特征相似的类别时。

过拟合与欠拟合分析
(1)过拟合:在VGG16的训练过程中,训练准确率远高于验证准确率,尤其在训练后期,模型开始出现过拟合的迹象。虽然训练准确率接近1,但验证准确率始终低于0.9,表明模型对训练数据的拟合过度,而在验证数据上表现不佳。
(2)欠拟合:ResNet50在训练过程中没有表现出明显的欠拟合情况。尽管验证准确率略低于训练准确率,但两者的差距较小,且验证集准确率稳定提升,表明ResNet50具有较强的泛化能力。

ResNet50能够有效避免过拟合问题,并在多次训练中保持较高的验证准确率,而VGG16则需要进一步优化,可能通过增加正则化(如Dropout)来缓解过拟合问题。

模型训练时间与计算效率分析
(1)训练时间:由于ResNet50比VGG16具有更多的层和更复杂的架构,因此在相同的训练轮数下,ResNet50的训练时间明显长于VGG16。ResNet50模型的训练时间约为VGG16的1.5倍。
(2)计算效率:虽然ResNet50训练时间较长,但其较低的训练损失和较高的验证准确率表明其训练效率相对较高,能够在更短的时间内提供更好的分类结果。VGG16尽管训练速度较快,但在处理复杂任务时未能提供相同的性能。

尽管ResNet50的训练时间较长,但其表现出的优越性能和较高的验证准确率,使其成为本任务中更为理想的选择。而VGG16则适合在计算资源较为有限且任务较简单的情况下使用。

运行效果

– 运行 MainProgram.py
1.ResNet50模型运行:
(1)主界面

(2)生肖牛

(3)生肖鸡

(4)生肖龙

(5)生肖羊

(6)生肖马

(7)生肖猴

(8)生肖鼠

(9)生肖猪

(10)生肖兔

(11)生肖蛇

(12)生肖虎

(13)生肖狗

2.VGG16模型运行:
(1)主界面

(2)生肖牛

(3)生肖鸡

(4)生肖狗

(5)生肖龙

(6)生肖羊

(7)生肖马

(8)生肖猴

(9)生肖鼠

(10)生肖猪

(11)生肖兔

(12)生肖蛇

(13)生肖虎

– 运行 train_resnet50.py
这段代码的主要目的是在直接运行该脚本时,加载指定路径下的训练集和测试集,初始化一个 MainProcess 实例并训练模型(ResNet50),设置训练的轮数为 15 轮。

数据集路径设置:
(1)train_dir = r”D:\ZodiacDataset\train”:设置训练集数据的路径。
(2)test_dir = r”D:\ZodiacDataset\test”:设置测试集数据的路径。

模型路径设置:
(1)model_name0 = r”models/resnet50.pth”:指定训练模型的文件路径,这里是 resnet50.pth 模型的路径,用于加载预训练的 ResNet50 权重或保存训练后的模型。

实例化MainProcess类:
(1)cnn = MainProcess(train_dir, test_dir, model_name0):通过传入训练集路径、测试集路径和模型路径,创建 MainProcess 类的实例 cnn,这个类负责数据加载、模型训练、验证等操作。

调用主函数main进行训练:
(1)cnn.main(epochs=15):调用 cnn 对象的 main 方法,开始训练模型。epochs=15 表示模型训练将进行 15 轮(每轮遍历整个训练集一次)。该方法将包括模型的训练过程、损失计算、验证等步骤

训练日志结果
ResNet50日志结果

这张图展示了使用ResNet50进行模型训练的详细过程和结果。

配置信息:
(1)模型在训练了15轮后,总共耗时18分钟。
(2)本次训练使用了GPU设备,具体是CUDA设备0。

训练过程:
训练过程记录了15个 epoch,每个 epoch 的训练损失和验证准确率都有输出:
(1)训练损失(train_loss)在每个epoch结束时有所下降(从0.948下降到0.244)。
(2)验证准确率(val_accuracy)从0.921提升到0.926,说明模型的性能在不断提高。

训练速度:
训练的速度在3.93it/s到4.38it/s之间,表示每秒钟处理大约4个批次。
(1)每个epoch的训练时间约为51秒到57秒。
(2)每个验证批次的处理时间大约是17秒到23秒。

完成信息:
(1)Process finished with exit code 0:表示整个验证过程顺利完成,没有报错。

总结:
从日志中可以看出,RESNET50模型在本次图像分类任务中展现了良好的性能,验证准确率和训练损失均显示出积极的优化趋势。通过进一步优化数据预处理、超参数调整和模型正则化,未来有潜力进一步提升分类效果。

– 运行 train_vgg16.py
这段代码的主要目的是在直接运行该脚本时,加载指定路径下的训练集和测试集,初始化一个 MainProcess 实例并训练模型(VGG16),设置训练的轮数为 15 轮。

数据集路径设置:
(1)train_dir = r”D:\ZodiacDataset\train”:设置训练集数据的路径。
(2)test_dir = r”D:\ZodiacDataset\test”:设置测试集数据的路径。

模型路径设置:
(1)model_name0 = r”models/vgg16.pth”:指定训练模型的文件路径,这里是 vgg16.pth 模型的路径,用于加载预训练的 VGG16 权重或保存训练后的模型。

实例化 MainProcess 类:
(1)cnn = MainProcess(train_dir, test_dir, model_name0):通过传入训练集路径、测试集路径和模型路径,创建 MainProcess 类的实例 cnn,这个类负责数据加载、模型训练、验证等操作。

调用主函数main进行训练:
(1)cnn.main(epochs=15):调用 cnn 对象的 main 方法,开始训练模型。epochs=15 表示模型训练将进行 15 轮(每轮遍历整个训练集一次)。该方法将包括模型的训练过程、损失计算、验证等步骤

训练日志结果
VGG16日志结果

这张图展示了使用VGG16进行模型训练的详细过程和结果。

配置信息:
(1)模型在训练了15轮后,总共耗时27分钟。
(2)本次训练使用了GPU设备,具体是CUDA设备0。

训练过程:
训练过程记录了15个epoch,每个epoch的训练损失和验证准确率都有输出:
(1)训练损失(train_loss)在每个epoch结束时有所下降(从0.948下降到0.328)。
(2)验证准确率(val_accuracy)从0.845提升到0.894,说明模型的性能在不断提高。

训练速度:
训练的速度在2.5it/s到2.73it/s之间,表示每秒钟处理大约2.5到2.7个批次。
(1)每个epoch的训练时间约为1分20秒到1分30秒。
(2)每个验证批次的处理时间大约是19秒到23秒。

完成信息:
(1)Process finished with exit code 0:表示整个验证过程顺利完成,没有报错。

总结:
从训练日志来看,VGG16模型在十二生肖图像分类任务中取得了良好的训练效果,验证准确率为0.894,显示出该模型在实际应用中的潜力。未来可以通过调整数据处理和训练策略,进一步优化模型,提升其对不同类别的识别能力,并减少过拟合的风险。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2250417.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

kali linux 装 virtual box 增强工具 Guest Addition

kali linux 装 virtual box 增强工具 Guest Addition install Virtual Box Guest Addition in kali linux 搞了一下午,最终发现是白折腾。 kali linux 自带 virtual box 的增强工具。 kali linux 2021.3 之后的版本都是自带virtual box 增强工具 解决方法 直接…

vue3请求接口报错:Cannot read properties of undefined (reading ‘data‘)

文章目录 报错内容解决方案 报错内容 Cannot read properties of undefined (reading ‘data’) 解决方案 响应未按预期返回 确保服务器返回的数据结构符合预期。例如,服务器可能返回了一个错误响应,而不是预期的 JSON 数据。 检查响应 在 response 拦…

RocketMQ rocketmq-tools管理主题

RocketMQ rocketmq-tools管理主题 环境和软件版本增删改查 环境和软件版本 Win10、IDEA、Jdk1.8、rocketmq 5.1.3、rocketmq-tools 5.1.3 引入依赖 <dependency><groupId>org.apache.rocketmq</groupId><artifactId>rocketmq-tools</artifactId&g…

《datawhale2411组队学习 模型压缩技术7:NNI剪枝》

文章目录 一、NNI简介二、 NNI剪枝快速入门2.1 加载并训练模型2.2 模型剪枝2.3 模型加速&#xff08;剪枝永久化&#xff09;2.4 微调压缩模型2.5 Slim Pruner测试 三、 使用NNI3.0进行Bert压缩&#xff08;剪枝、蒸馏)3.1 数据预处理3.2 训练模型3.3 设置模型蒸馏函数3.4 修剪…

C#学写了一个程序记录日志的方法(Log类)

1.错误和警告信息单独生产文本进行记录&#xff1b; 2.日志到一定内存阈值可以打包压缩&#xff0c;单独存储起来&#xff0c;修改字段MaxLogFileSizeForCompress的值即可&#xff1b; 3.Log类调用举例&#xff1a;Log.Txt(JB.信息,“日志记录内容”,"通道1"); usi…

Java设计模式——职责链模式:解锁高效灵活的请求处理之道

嘿&#xff0c;各位 Java 编程大神和爱好者们&#xff01;今天咱们要一同深入探索一种超厉害的设计模式——职责链模式。它就像一条神奇的“处理链”&#xff0c;能让请求在多个对象之间有条不紊地传递&#xff0c;直到找到最合适的“处理者”。准备好跟我一起揭开它神秘的面纱…

安装SQL Server 2022提示需要Microsoft .NET Framework 4.7.2 或更高版本

安装SQL Server 2022提示需要Microsoft .NET Framework 4.7.2 或更高版本。 原因是&#xff1a;当前操作系统版本为Windows Server 2016 Standard版本&#xff0c;其自带的Microsoft .NET Framework 版本为4.6太低&#xff0c;不满足要求。 根据报错的提示&#xff0c;点击链接…

高德地图 Readme GT 定制版 10.25.0.3249 | 极致简洁

这款定制版高德地图去除了广告&#xff0c;运行速度更快。虽然没有车道级导航、打车功能和红绿灯倒计时等功能&#xff0c;但支持正常登录和收藏功能。检测更新始终为最新版本。 大小&#xff1a;82.5M 下载地址&#xff1a; 百度网盘&#xff1a;https://pan.baidu.com/s/1Y…

Admin.NET框架使用宝塔面板部署步骤

文章目录 Admin.NET框架使用宝塔面板部署步骤&#x1f381;框架介绍部署步骤1.Centos7 部署宝塔面板2.部署Admin.NET后端3.部署前端Web4.访问前端页面 Admin.NET框架使用宝塔面板部署步骤 &#x1f381;框架介绍 Admin.NET 是基于 .NET6 (Furion/SqlSugar) 实现的通用权限开发…

Excel中根据某列内容拆分为工作簿

简介&#xff1a;根据A列的内容进行筛选&#xff0c;将筛选出来的数据生成一个新的工作簿(可以放到指定文件夹下)&#xff0c;且工作簿名为筛选内容。 举例&#xff1a; 将上面的内容使用VBA会在当前test1下生成5个工作簿&#xff0c;工作簿名分别为TEST1.xls TEST2.xls TEST3…

JavaWeb实战(1)(重点:分页查询、jstl标签与jsp、EL表达式、Bootstrap组件搭建页面、jdbc)

目录 一、jstl标签。 &#xff08;1&#xff09;基本概念。 &#xff08;2&#xff09;使用前提。 &#xff08;3&#xff09;"<%...%>"与"<%%>"。 &#xff08;4&#xff09;使用jstl标签的步骤。 1、导入对应jar包。 2、引入核心标签库。&am…

Linux:makefile的使用

makefile小结&#xff1a; makefile的应用&#xff1a; 一个简单的 Makefile 文件包含一系列的“规则”&#xff0c;其样式如下&#xff1a; 目标(target)…: 依赖(prerequiries)… 命令(command) 目标(target)通常是要生成的文件的名称&#xff0c;可以是可执行文件或OBJ文件…

springboot中使用mongodb完成评论功能

pom文件中引入 <!-- mongodb --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-mongodb</artifactId> </dependency> yml中配置连接 data:mongodb:uri: mongodb://admin:1234561…

TCGA 编码格式解读 | 怎么区分是不是肿瘤样品?

最权威参考资料 https://docs.gdc.cancer.gov/Encyclopedia/pages/TCGA_Barcode/ "-"分割符的第四位是Sample type&#xff1a; Tumor types range from 01 - 09,normal types from 10 - 19and control samples from 20 - 29. See Code Tables Report for a compl…

百度 文心一言 vs 阿里 通义千问 哪个好?

背景介绍&#xff1a; 在当前的人工智能领域&#xff0c;随着大模型技术的快速发展&#xff0c;市场上涌现出了众多的大规模语言模型。然而&#xff0c;由于缺乏统一且权威的评估标准&#xff0c;很多关于这些模型能力的文章往往基于主观测试或自行设定的排行榜来评价模型性能…

【linux学习指南】Linux进程信号产生(二)软件中断

文章目录 &#x1f4dd; 由软件条件产⽣信号&#x1f320; 基本alarm验证-体会IO效率问题&#x1f309;设置重复闹钟 &#x1f320;如何理解软件条件&#x1f309;如何简单快速理解系统闹钟 &#x1f6a9;总结 &#x1f4dd; 由软件条件产⽣信号 SIGPIPE 是⼀种由软件条件产⽣…

蓝桥杯每日真题 - 第24天

题目&#xff1a;&#xff08;货物摆放&#xff09; 题目描述&#xff08;12届 C&C B组D题&#xff09; 解题思路&#xff1a; 这道题的核心是求因数以及枚举验证。具体步骤如下&#xff1a; 因数分解&#xff1a; 通过逐一尝试小于等于的数&#xff0c;找到 n 的所有因数…

python学opencv|读取图像

【1】引言 前序学习了使用matplotlib模块进行画图&#xff0c;今天开始我们逐步尝试探索使用opencv来处理图片。 【2】学习资源 官网的学习链接如下&#xff1a; OpenCV: Getting Started with Images 不过读起来是英文版&#xff0c;可能略有难度&#xff0c;所以另推荐一…

ROS2教程 - 2 环境安装

更好的阅读体验&#xff1a;https://www.foooor.com 2 环境安装 下面以 ROS2 的 humble 版本为例&#xff0c;介绍 ROS2 的安装。 ROS1 只能在 ubuntu 系统上安装&#xff0c;ROS2全面支持三种平台&#xff1a;Ubuntu、MAC OS X、Windows10&#xff0c;下面在 Ubuntu22.04 …

神经网络入门实战:(六)PyTorch 中的实用工具 SummaryWriter 和 TensorBoard 的说明

(一) SummaryWriter 这里先讲解 SummaryWriter &#xff0c;TensorBoard 会在第二大点进行说明。 SummaryWriter 是 PyTorch 中的一个非常实用的工具&#xff0c;它主要用于将深度学习模型训练过程中的各种日志和统计数据记录下来&#xff0c;并可以与 TensorBoard 配合使用&am…