深度学习(概念相关)

news2024/11/28 19:55:15

深度学习(论文相关)

深度学习一些概念

在这里插入图片描述
通过阅读论文可以理解提取数据特征的重要性
在这里插入图片描述
在这里插入图片描述
深度学习=学习怎么去提取特征

应用领域

在这里插入图片描述
深度学习应用:
输入:图像输入或者文字输入
算法:还是基础的模块计算
神经网络中的参数几千万几亿,所以优化神经网络很困难
(深度学习的速度可能会很慢,创新点!!!提速)
有很多图像的数据集,以后可用!
https://image-net.org/
在这里插入图片描述
也就是我们数据规模越大,深度学习算法的优势越明显

计算机视觉任务

在这里插入图片描述
在这里插入图片描述
之所以表示为3维的,是图像的长像素,宽像素,和点的颜色(颜色0-255,颜色越深数值越大)
在这里插入图片描述
在这里插入图片描述
神经网络也会识别到有无遮挡

视觉任务中遇到的问题

在这里插入图片描述

K临近算法

在这里插入图片描述
物以类聚,人以群分
这个算法的主要思想就是:
划出不同的范围,比如第一个圈里面三角比较多,那我就认为圆点的位置可能是一个三角,假如第二个圈内比较,此时蓝色方块数量比较多,那我就认为,此时的绿点可能是一个方块
(但是这么认为还是有点主管臆断了,我们应该用更加客观的方式)
在这里插入图片描述
这个算法用的并不多,主要是了解了不能主观臆断,基本都需要综合考虑数据(关于异常数据后续在看看具体情况)
在这里插入图片描述
在这里插入图片描述
这个做减法就是灰度做减法,通俗一点就是
颜色形状差不多的
在这里插入图片描述
在这里插入图片描述
到这里都是K算法的应用,物以类聚,这里就按照大致颜色和形状进行判断了,而不是物体本身

得分函数

在这里插入图片描述
猫是由很多像素点组成的,但是我们要思考一下前面的K算法也是单独考虑了每个像素点,但是最后结果差强人意。
所以在得分函数里,我们还是关注每一个像素点,但是对不同的像素点对应不同的权重
在这里插入图片描述
!!注意:这里面几乘几都表示的是矩阵

(视频中通俗的讲解是:上面的10是10个种类,也就是我可以定义猫,狗,兔子等10个种类,然后依然是对每一个像素点进行检测,判断这个像素点是那个类别)
最后来一张图片,判断猫40%,狗30%,飞机10%(总的概率加起来应该是100%懒得写了)最后得出结论这个图片可能是个猫

b偏执参数微调
每一个种类都有各自的偏执参数(不同)
这样就能看出来这不是简单的线性函数

损失函数

在这里插入图片描述
这个图的详细讲解:
首先视频作者是画个十字将图片简单分为四个像素点先(多了不好懂)
第一行红色代表猫的权重,第二行绿色代表狗的权重,第三行紫色代表船的权重,
白色部分代表像素点的灰度
计算方式举例:
0.2X56+(-0.5)X231+0.1X24+2.0X2=1.1
也就是这四个都是每个像素点的权重(以-0.5那个权重为例:那个24的像素点我就不认为它是猫,所以我给一个低的权重)至于这个权重怎么来的(好像说是机器训练中得出的)
在这里插入图片描述
但是发现最后的结果把猫判断成狗了
思考:哪里出了问题
我们白色灰度那一块是不会变的,是最原始的数据
也就是我们的前面权重出现了问题
注意:我们是仅仅把像素点取了4个,应该选的更多会好点
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这里的损失函数就是计算,你这个计算结果算的有多不好,或者有多好的(评价体系)
公式讲解
Sj是错误类别
Syi是正确类别
在猫里面错误类别就是青蛙和车的数据,正确类别就是猫数据
然后看计算详情就ok
损失函数当值为0的时候认为没有损失(也就是评估正确的意思)
所以需要1给拉一下(我的判断正确的数值至少比你判断出来的错误高1以上才是没有损失的)
这个函数数值越大越不准(损失越大)

向前传播整体流程()

在这里插入图片描述

发现模型A和B都是一样的损失,但是A一定会产生过拟合(只关注局部)而B就比较平稳
在这里插入图片描述
兰姆达数值越大,证明越不想过拟合(减小这种邪门数据的影响)
在这里插入图片描述
神经网络是一个过于强大的模型,越强大的过拟合的风险越大,我们在研究中希望神经网络弱一点
在这里插入图片描述
捋一遍:
x输入数据
W权重
*得分值(得分函数计算得出)
hinge loss损失函数
R(W)防止过拟合的参数
说到底我得到的还是一个分数(评价是不是猫的分数)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
上面的公式看起来很麻烦,但是配合例子就比较简单了
下面还是之前算出的判断猫是不是猫的成绩
猫:3.2 车:5.1 青蛙:-1.7
先进行e的x次方操作:
ex不仅放大了差异,还将所有的负数变成了正数
把大家的差距变大了,然后平均化计算是:
24.5/24.5+164+0.18=0.13得出的
剩下两个计算方式同理
在这里插入图片描述
然后在0-1之间的数值在坐标轴上是负的,所以我们要在公式前面再加上一个负数,让最终结果变成正的

返向传播计算方式

在这里插入图片描述
就相当于我有一个猫的图片,ABC步骤先后找出比较重要的部分(也就是蓝色,绿色和黄色圈出来的部分)
这个等待后续补充(视频半截)
下面这个链接的上一节,4,5P
https://www.bilibili.com/video/BV1K94y1Z7wn/?p=9&spm_id_from=pageDriver&vd_source=6ebf7a12e4cd4cf6f7d36b3d14621c4e

神经网络整体架构

在这里插入图片描述
仅仅看看数学模型啥样子就行
在这里插入图片描述
神经网络是一层一层办事的
有输入端和输出端
全连接:相当于一开始我传输了三个数据,然后这三个数据与后面的特征都进行了链接(1连4)
我也就将三个输入数据转换为了四个特征
在这里插入图片描述
权重是计算机生成的,因为计算机比较喜欢数据
在这里插入图片描述
仔细看下面这个绿色弹幕,说的很好
在这里插入图片描述
感觉前面应该是41的矩阵
4
1 14 得出一个44的矩阵
先把三个特征变成了四个特征,然后在来四个特征(现在应该是16个把)
在神经网络中,参数是最重要的也就是黑盒子里面的w,需要不断训练得到
在这里插入图片描述
wx前面得分函数
max出现过
一直堆叠

神经元个数对结果的影响

在这里插入图片描述
中间一个一个小圆圈就是神经元
神经元越多,过拟合程度越大,效果越好,但是运行效率会低
经典的几个演示神经网络的网页或者项目
很可惜ConvNetJS不维护了,找找代餐把
疑似ConvnetJS
在这里插入图片描述
惩罚力度加大,就比较平滑
就是我们平常训练,到最后测试
训练集要是数据产生一些比较大的波动会让计算机有一种习以为常的感觉,导致到最后真正测试的时候感觉不到那些比较大的波动了,所以我们还是希望测试机效果比较好的,就像图一效果那么好

正则化和激活函数

在权重计算过后要进行一组非线性变换,就是激活函数(非线性变换)
在这里插入图片描述
在这里插入图片描述
一开始这个Sigmoid函数只要有一个神经元是0,因为做乘法,后面的数据都是0了,也就是图像上显示的梯度不变了(函数没有斜率了)
后面基本上Relu函数是用的比较多的
而且还没有梯度消失的现象
主要就是知道Relu用的很多就行了,还有S那个不常用了

数据预处理,数据初始化

在这里插入图片描述
数据预处理:(就是上面显示的两个公式)
第一步:中心化:减去均值
第二步:标准化:除以标准差
在这里插入图片描述
参数初始化后面D,H哪里是数组
前面0.01*的意思是让数据都波动不是太大(尽量避免过拟合)这个0.01很显然对大数(也就是峰值高的地方影响比较大)

dropout

在这里插入图片描述
想让过拟合效果降低,舍弃部分来降低这个
在这里插入图片描述
下面的一层一层就相当于神经网络黑盒子里面的神经元,我随机割舍一部分(这里的不用不是永远不用,假如永远不用你一开始设置一层只有三个不就完了)
这里舍弃是随机舍弃
我每次不一定舍弃那几个
同时每一轮(好多次迭代)也不一定和上一轮舍弃的就完全一样
(类似运动员随机上场)
在这里插入图片描述
补一条:到最后test的时候也是右边的模型,不需要再恢复到之前的模型再进行测试了
在这里插入图片描述

卷积神经网络

在这里插入图片描述
计算机视觉已经达到预期了(可以看出来已经超过human了)
在这里插入图片描述
在这里插入图片描述
神经网络是用来做特征提取的,卷积神经网络也是
上面这不就和我们淘宝识图找衣服一样吗
在这里插入图片描述
可以看到也是有输入输出,将模糊图像变的清晰
在这里插入图片描述
和论文里面说的串起来了,当时就说DeepNovo可以在GPU和CPU上面都能跑
GPU:图像处理单元(打游戏基本在这上面)
游戏觉得卡就是连接慢,处理速度慢

卷积网络与传统网路的区别

在这里插入图片描述
相当于CNN提升了一个维度
输入的图像有了深度(空间)
在这里插入图片描述
卷积:提取特征
池化:压缩特征
在这里插入图片描述
这个举得例子和实际情况不是很贴合5X5和3X3,可以了解一下
实际上是3X3X1的小块拿出来进行的提取特征,我们也能看出来圈出来的三个进行计算就是后面3X3矩阵(绿色的)的第一行的数据
然后依次往下取得到第二行的(具体的计算交给代码实现和计算机)
在这里插入图片描述
正常情况下应该是酱紫的
长X宽X灰度

卷积特征值计算方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1961429.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[JavaScript] 动态获取方法参数名

JavaScript(简称“JS”)是一种具有函数优先的轻量级,解释型或即时编译型的编程语言。虽然它是作为开发Web页面的脚本语言而出名,但是它也被用到了很多非浏览器环境中,JavaScript基于原型编程、多范式的动态脚本语言&am…

Java导出Excel给每一列设置不同样式示例

Excel导出这里不讲,方法很多,原生的POI可以参照 Java原生POI实现的Excel导入导出(简单易懂) 这里只说怎么给Excel每一列设置不同的样式,比如下面这样的 直接上代码 Overridepublic void exportTemplate(HttpServletRe…

昇思25天学习打卡营第23天|CV-ResNet50迁移学习

打卡 目录 打卡 迁移学习 实战练习 数据准备 数据处理 数据处理函数 数据处理流程 数据可视化 训练模型 构建Resnet50网络 固定特征进行训练 network 的输出 训练和评估 可视化模型预测 通过本文,了解迁移学习的重点在于,了解你的模型结构…

LGA-4500激光气体分析仪说明手册

目 录 阅 读 说 明 I 用户须知 I 概况 I 注意和警示信息 I 供货和运输 III 质保和维修 III 联系方式 III 一、简介 1 1.1概要 1 1.2测量原理 1 1.2.1单线光谱技术 1 1.2.2激光频率扫描技术 2 1.2.3谱线展宽自动修正技术 2 1.3系统组成 2 1.4系统特点 3 1.5系统指标 4 1.6激光产…

决策树可解释性分析

决策树可解释性分析 决策树是一种广泛使用的机器学习算法,以其直观的结构和可解释性而闻名。在许多应用场景中,尤其是金融、医疗等领域,模型的可解释性至关重要。本文将从决策路径、节点信息、特征重要性等多个方面分析决策树的可解释性&…

Thymeleaf(看这一篇就够了)

目录: Thymeleaf变量输出操作字符串&时间条件判断迭代遍历使用状态变量获取域中的数据URL写法相关配置 Thymeleaf Thymeleaf是一款用于渲染XML/HTML5内容的模板引擎,类似JSP。它可以轻易的与SpringMVC等Web框架进行集成作为Web应用的模板引擎。Spri…

暄桐林曦老师推荐书单——《菜根谭》

暄桐是一间传统美学教育教室,创办于2011年,林曦是创办人和授课老师,教授以书法为主的传统文化和技艺,皆在以书法为起点,亲近中国传统之美,以实践和所得,滋养当下生活。      在暄桐教室的课…

机械运动、工控机概念整理

Signal : 信号 pul 【pulse】是驱动脉冲信号,发一个脉冲,电机走一步。 dir是方向控制信号,控制电机正转或反转。 ena是使能信号,这个信号必须开启,才能驱动电机。 voltage: 电压 VCC&#…

Python软件开发:AI毕业设计生成器引领未来

🌟 革新软件开发:Python毕业设计生成器引领未来 🚀 目录 🌟 革新软件开发:Python毕业设计生成器引领未来 🚀🎓 课题简介🌟 开发目的📈 开发意义 📚 研究方法&…

[ BLE4.0 ] 伦茨ST17H66开发-串口UART0的接收与发送

目录 一、前言 二、实现步骤 1.设置回调函数 2.关闭睡眠模式 三、效果展示 四、工程源代码 一、前言 串口通信在任何一款单片机开发中都是尤为重要的。本文涉及的开发所使用的例程依然是基于[ BLE4.0 ] 伦茨ST17H66开发-OSAL系统中添加自己的Task任务文章的工程源码&#x…

进程间通信--套接字socket

前面提到的管道、消息队列、共享内存、信号和信号量都是在同一台主机上进行进程间通信,那要想跨网络与不同主机上的进程之间通信,就需要Socket通信了。 实际上,Socket通信不仅可以跨网络与不同主机的进程间通信,还可以在同主机上…

一键升级GIS场景视觉效果,告别繁琐操作

在当今的数字化时代,GIS(地理信息系统)不再仅仅只能通过一些二维示意图或简陋的三维地形图表示,它可以通过专业的软件简单升级视效。想象一下,在你的GIS场景中,阳光明媚的天气、突如其来的暴风雨、缭绕的晨…

工时管理平台核心功能解析:你需要了解的

国内外主流的10款工时管理平台对比:PingCode、Worktile、Todoist、ClickUp、滴答清单、专注清单、一木清单、NarTick、Tweek、朝暮计划。 在选择合适的工时管理平台时,你是否感到挑战重重?市场上的各种选项似乎都声称能够提升效率和减轻管理负…

【SQL Server点滴积累】SQL Server 2016数据库邮件(Database Mail)功能故障的解决方法

今天和大家分享SQL Server 2016数据库邮件(Database Mail)功能故障的解决方法 故障现象: 在SQL Server 2016中配置完成数据库邮件(Database Mail)功能后,当你尝试发送测试邮件后,既收不到测试邮件,也不显示错误消息 KB3186435 -…

Python数值计算(11)——拉格朗日插值

本篇介绍一下多项式插值中,拉格朗日法的原理及其实现。 1. 一点数学知识 先引用数学背景。如果给定N个点,然后要求一个多项式通过这N个点,最简单直接的方式是列出线性方程求解,N个点可以确定N个未知量,则所求的拟合多…

下面关于枚举的描述正确的一项是?

A. 枚举中定义的每一个枚举项其类型都是String; B. 在Java中可以直接继承java.util.Enum类实现枚举类的定义; C. 利用枚举类中的values()方法可以取得全部的枚举项; D. 枚举中定义的构造方法只能够使用private权限声明; 答案选择…

springboot山东外事职业大学校园食堂点餐系统-计算机毕业设计源码10417

摘 要 近年来,随着国民收入的提高,各行业取得长足进步,也带动了互联网行业的快速发展,许多传统行业开始与互联网相结合,通过数字化转型打造新的发展生态。 本文针对山东外事大学校园食堂点餐系统的需求,基于…

Java内存区域与内存溢出异常详解

在Java编程中,理解Java虚拟机的内存布局及其管理机制对于开发高效、稳定的应用程序至关重要。Java虚拟机的内存主要分为几个运行时区域,这些区域各司其职,共同支撑起Java程序的运行。本文将详细探讨Java虚拟机的内存区域以及这些区域如何与内…

Yolov模型的使用及数据集准备(1)LabelImg的下载和使用

1、LabelImg下载: labelimg简单来说就是打标签用的软件,当需要使用自定义数据集进行模型训练时,往往需要使用该软件来打标签。 下载地址:GitHub - HumanSignal/labelImg 1.1下载之后对压缩包进行解压 2、打开电脑的anaconda pro…

MyBatis XML配置文件

目录 一、引入依赖 二、配置数据库的连接信息 三、实现持久层代码 3.1 添加mapper接口 3.2 添加UserInfoXMLMapper.xml 3.3 增删改查操作 3.3.1 增(insert) 3.3.2 删(delete) 3.3.3 改(update) 3.3.4 查(select) 本篇内容仍然衔接上篇内容,使用的代码及案…