车辆重识别(关于卷积神经网络一些资料)2024/9/11

news2025/1/11 18:50:54

关于卷积神经网络的介绍
一,全连接神经网络
1,全连接神经网络的整体结构
请添加图片描述
X代表左边输入的数据(向量或者矩阵等等),Y代表模型对数据处理之后的结果,中间的节点都可以算作为隐藏层。请添加图片描述
2,全连接神经网络的单元结构
请添加图片描述
x1,x2,x3是输入的数据,w1,w2,w3是权重,b1是偏置项,h是激活函数,a是输出。以此图为例,节点是一个求和函数,它负责把x1w1,x2w2,x3*w3,b1这几项加起来,得到的结果再通过激活函数的处理,最终得到输出a。
假如x1,x2,x3是一张图片的数据,如果输出a为1,那么这张图片是狗,如果为0,那么这张图片是猫。对于这张图片来说,我们现在的目的就是为了找一组w和b,使得这张图片的数据经过处理,要么为1,要么为0,从而能够对这张图片进行分类,那么这个模型就暂时被训练完成。但是现在这个模型仅仅能够识别这一张图片,而对于不同的多组图片来说,我们的目的是能够尽量地找到一组w和b,使得这个模型对于不同的多组图片的识别尽量地贴合输出结果a,那这样这个模型就能够暂时的对图片进行识别。

3,激活函数
激活函数的功能其实和寻找一组w和b的用途一样,也是为了对输入数据处理后的结果进行调整,使其能够贴合预期输出的结果a。另外,激活函数分为线性和非线性的,对于线性的激活函数,存在的问题就是客观上可能会减少神经网络的层数(一般情况下神经网络层数越深,模型效果越好)。
请添加图片描述
具体的激活函数的优缺点暂时不做解释,等全部内容学完之后,再解释为什么不同的激活函数有不同的优缺点或者说为什么这种激活函数会有这种优缺点。

4,神经网络的前向传播
所谓前向传播就是输入数据经过每一层网络不断计算的过程。

5,损失函数
如果一个模型的预测值为连续的值,那么每一轮预测结束,结果都会与真实值之间存在误差。但是误差的计算绝对不能让预测值与真实值进行简单的相减,这样会出现一些问题,所以在这种情况下采取均方误差的方式来计算误差。
损失函数还有一种用途:通过绘制损失和训练轮数的图表,可以看到当训练达到一定轮数后,损失就会稳定在一个值左右,这表明模型在某轮之后达到收敛,再训练已经无法提升模型的性能了。
这告诉了我们模型训练的一系列步骤,先前向传播传递输入数据,计算结果,再计算误差。如果误差比较大,那就反向传播调整w权重和b偏置项,然后再前向传播重复此过程。

6,梯度下降法
在这里插入图片描述
那么梯度下降法如何对w和b进行更新呢?首先观察这个误差公式可以看出(在假定w只有一个):在每一次传输图片数据时,x是确定的。数据通过前向传播最终得到的结果也是确定的,然后y’(真实值)也是确定的,那么唯一不确定的就是w和b,最终这个误差函数其实是关于w和
b的二元二次函数。既然知道了这个函数那么我们就可以绘制出这个函数图像,通过图像可以看出,我们可以使得w和b在梯度方向上不断减少,最终可以得到误差的最小值。
在这里插入图片描述
在这里插入图片描述
既然理论上已经可行了,我们该如何确定具体的w和b呢?
首先我们还是要看这个误差函数,当我们只针对w时,b暂且可以看做常量,那么这个函数就是关于w的一元二次函数(对于多个w时也是一样,只是把w1、w2、w3等看做常量而已)。但是这时候想要求最小的loss值不能用求根公式,因为w不只是一个变量,也有可能时一个矩阵,所以这时候只能用梯度下降的方式来接近w1(得到最小loss值的w),所以对于w的更新公式如图所示,w(旧)一步步地走,直到接近w1。而对于b,也是一样的理论。
另外,图上的a也叫做学习率。对于a来说,不能太大也不能太小。如果a太小,那么w接近w1的速度会很慢,也就是说可能训练很多轮,w变化不大。如果a太大,那么w有可能会走过头,直接越过
w1导致训练效果没有变化或者变差。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2133868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++二分查找 容斥原理】1201. 丑数 III

本文涉及的基础知识点 C二分查找 容斥原理:组合数学汇总 LeetCode1201. 丑数 III 丑数是可以被 a 或 b 或 c 整除的 正整数 。 给你四个整数:n 、a 、b 、c ,请你设计一个算法来找出第 n 个丑数。 示例 1: 输入:n …

读构建可扩展分布式系统:方法与实践03分布式系统要点

1. 通信基础 1.1. 每个分布式系统都包含通过网络进行通信的软件组件 1.2. 硬件 1.2.1. 全球互联网就是一台异构机器,由不同类型的网络通信通道和设备组成,它们每秒将数百万条消息通过网络传送到预定目的地 1.2.2. 对于单个光纤链路,可以提…

使用gzexe保护Kylin Linux Shell脚本安全

使用gzexe保护Kylin Linux Shell脚本安全 1、加密脚本2、解密脚本3、注意事项 💖The Begin💖点点关注,收藏不迷路💖 在Kylin Linux中,若需保护shell脚本内容不被直接查看,可以使用gzexe工具进行加密。 1、…

R语言机器学习算法实战系列(一):XGBoost算法(eXtreme Gradient Boosting)

介绍 XGBoost(eXtreme Gradient Boosting)是一种基于梯度提升决策树(GBDT)的优化算法,它在处理大规模数据集和复杂模型时表现出色,同时在防止过拟合和提高泛化能力方面也有很好的表现。以下是XGBoost算法的原理和应用方向的详细介绍: 算法原理 目标函数:XGBoost的目标…

Android 测试机

要测手机应用,直接挂电脑上跑虚拟机的话,怀疑电脑都要起火了。 eBay 上买了个新的机器,也才 100 美元多点,机器都没有拆过,电池是完全无电的状态。 操作系统是 Android 12 的版本,升级到 Android 14 后&am…

从用户数据到区块链:Facebook如何利用去中心化技术

在数字化时代,用户数据的管理和保护已成为科技公司面临的重大挑战。作为全球最大的社交网络平台之一,Facebook不仅在用户数据的处理上积累了丰富的经验,也在探索如何利用去中心化技术,如区块链,来改进其数据管理和用户…

怎么使用ai 免费生成ppt?这4个工具可以帮忙

随之AI工具的流行,网络上也涌现了一批 AIPPT 工具,可以在办公上帮助我们节省很多制作PPT的时间。通常它们的操作也比较简单,所以适合很多人使用。为了可以帮助大家提高办公效率,我在这里跟大家分享4款可以免费使用的AIPPT制作工具…

STM32——看门狗通俗解析

笔者在学习看门狗的视频后,对看门狗仍然是一知半解,后面在实际应用中发现它是一个很好用的检测或者调试工具。所以总结一下笔者作为初学小白对看门狗的理解。 主函数初始化阶段、循环阶段和复位 众所周知,程序的运行一般是这样的&#xff1…

解决项目启动时报“找不到符号”问题

前言 在Java开发过程中,遇到“找不到符号”的错误是非常常见的现象。这种错误往往意味着编译器无法识别你所引用的某个类、方法或变量。本文旨在提供一套详细的排查和解决思路,帮助开发者快速定位并解决此类问题。 问题描述 “找不到符号”错误通常出…

K8S - Volume - NFS 卷的简介和使用

在之前的文章里已经介绍了 K8S 中两个简单卷类型 hostpath 和 emptydir k8s - Volume 简介和HostPath的使用 K8S - Emptydir - 取代ELK 使用fluentd 构建logging saidcar 但是这两种卷都有同1个限制, 就是依赖于 k8s nodes的空间 如果某个service pod中需要的vol…

2024年职场人士都在用的PDF转换工具大赏

PDF文件已经变得越来越常见了,是不是不知不觉你收到的或者发出去的文件都是这个格式。它可以巩固格式,但是编辑起来还是有一定难度的。这篇文章我来分享一些可以从pdf转换器免费版官网下载的工具。 1.Foxit PDF转换大师 链接一下>>https://www.p…

sqlgun靶场漏洞挖掘

进入首页首先看到一个搜索框,那么我们试一下xss 用script弹了个一 接下来我们尝试一下sql注入 这里我们使用联合查询查到了他的数据库名,那么这里也就存在SQL注入了 这里存在SQL注入那么我们就尝试一下是否可以注入木马来getshell 首先我们扫描目录&…

YOLO介绍—datawhale

速度快:YOLO的设计目标是实现快速的对象检测,它在保持相对高准确度的同时,能够实现高帧率的实时检测。 易于实现:YOLO的架构相对简单,易于理解和实现,这使得它在学术和工业界都得到了广泛的应用。 版本迭…

机器学习(西瓜书)第 14 章 概率图模型

14.1 隐马尔可夫模型 机器学习最重要的任务,是根据一些已观察到的证据(例如训练样本)来对感兴趣的未知变量(例如类别标记)进行估计和推测。概率模型(probabilistic model)提供了一种描述框架&a…

快讯丨深蓝L07将于9月20日正式上市

9月13日获悉,继第二十七届成都车展首发亮相后,深蓝汽车全新“科技智享中型轿车”——深蓝L07,将于9月20日迎来正式上市! 作为深蓝汽车旗下第二款轿车力作,深蓝L07携#左手深蓝超级增程,右手华为乾崑智能#两…

自动驾驶:LQR、ILQR和DDP原理、公式推导以及代码演示(六、ILQR正则化和line search)

(六)ILQR正则化和line search 1. ILQR正则化 在iLQR中,我们通常线性化系统动力学并对目标函数进行二阶近似。在反向传播步骤中,我们需要计算逆矩阵(控制变量对目标函数的二阶导数矩阵),用以更…

通信工程学习:什么是FDMA频分多址

FDMA:频分多址 FDMA(Frequency Division Multiple Access,频分多址)是一种在无线通信领域广泛应用的多址技术。该技术通过将可用的频谱资源按频率划分,把传输频带划分为若干较窄且互不重叠的子频带(或称信道…

IP-Adapter学习

参考:https://baijiahao.baidu.com/s?id1803373544569190578&wfrspider&forpc IP-Adapter 是 SD中比较重要的controlnet,由腾讯公司出品。主要原理:提取图像特征,并嵌入预训练文本,最终加入到扩散图像中。简…

阿里云社区领积分自动打卡Selenium IDE脚本

脚本 感觉打卡比较麻烦,要点开点按钮这种机械化的操作。 所以就自己整了个脚本: { “id”: “f9999777-9ad6-40e0-9435-4f105919c982”, “version”: “2.0”, “name”: “aliyun”, “url”: “https://developer.aliyun.com”, “tests”: [{ “id”…

bp的模块被隐藏了

看我们现在没有代理那个模块了 我们点击查看 这里有被我们隐藏的模块,比如代理等,把前面的眼睛点一下 这个模块就出来了,如果想把他固定在任务栏里 拖动这个位置 就好了,如果有其他问题可以留言,看到可进我的努力给你…