深度学习入门(第一天)——深度学习必备知识点

news2025/1/21 9:42:05
深度学习要解决的问题

人工智能、机器学习、深度学习的区别于联系

机器学习的流程:

  • 数据提取

  • 特征工程

  • 建立模型

  • 评估与应用

特征工程可以说是建模过程中,最重要的部分。

既然特征工程是最重要的,常规我们会做各种各样的特征,如聚合统计、交叉等,那有没有一种方法,它可以自动的去选择重要的特征。

而深度学习可以说是最接近人工智能这一概念的,因为它解决了机器学习中“人工的”问题,如人工的选择特征、选择算法等。

深度学习最大的亮点,就是解决特征工程的人工问题。

特征工程的作用:

  • 数据特征决定了模型的上限

  • 预处理和特征提取是最核心的

  • 算法与参数选择决定了如何逼近这个上限

特征如何提取,数值类的相对容易,那么文本类、图像类的呢?

传统特征提取方法:

各种计算可以说是非常麻烦的。

为什么需要深度学习:

如上图,将一个图像,分解成多个维度并变换成数值,变成机器可认识的。

深度学习应用领域

自动驾驶:

人脸识别:

医学检测:

缺点:计算大量数据导致速度慢。

数据规模越大,越适合深度学习

计算机视觉任务

如图像分类任务,如何把一张猫的图片,分到猫的类别(有一些列的标签:人、笔、飞机、猫 等等)

图像表示:计算机眼中的图像,一张图片被表示成三维数组的形式,每个像素的值从0到255。

可能的维度是300*100*3,假设高度h是300,宽度w是100,3则是颜色通道RBG。图像中数值越大表示该点越亮,反之则越暗。

计算机视觉面临的挑战

还是上面这张图,如照射角度:

其形状可能改变成如下的样子:

或者部分遮蔽:

背景混入:

这些都是可能遇到得问题,如何解决可以给一些遮蔽的样本,这些都是数据量可以解决的。

得分函数

线性函数

  • 从输入——>输出的映射

    每个像素点对结果产生影响,而每个像素点有对应的权重。

  • 数学表示

    32*32*3=3072个X(像素点),假设需要分类的类别一共有10个,那么这3072个X在这10个W(类别)中有着不同的权重得分,还有b偏值项,最终最高 得分 的就是预测的分类。

  • 计算方法

    为了计算简单,假设这种猫只有4个像素点,分别是56、231、24、2,分成3个类别(猫、狗、船),其中W有3行对应3个类别,且Xi有4个值对应4个像素点,我们来计算第一行,W*X+b = 0.2*56+(-0.5)*231+0.1*24+2.0*2+1.1 = -97.9+1.1 = -96.8,这样就得到了结果。

    当权重Wi比较大时,说明该像素点对结果的影响比较重要,正值代表促进作用,负值代表抑制作用。

    • W矩阵怎么来的:一开始是假设了一个,然后根据结果不断优化,就像上面的预测是把猫预测成了狗437.9,那么神经网络会不断迭代W矩阵中的值。

    现在我们知道上面的结果不够好,那么我们应该怎样让它变好。

损失函数
  • 如何衡量分类的结果

  • 怎么明确模型当前的效果是好是坏。

其中一种损失函数(回归任务):

实验:

假设我们运行完模型,得到上面这么个结果,第一张图评定为猫3.2为车5.1明显不合理,如果利用上面的公式,就是5.1-3.2=1.9,值越大表明预测越离谱,小于0则表示没有误差。

而+1是为了防止一种情况是,如果预测的car不是5.1而是3.15,那么3.15-3.2也小于0,但是能明确的说预测没问题吗?或许不能吧,因为只有一点偏差可能是“刚刚好”预测对了,那么+1就可以防止这种情况,预测对的值一定要远大于预测错的值。

计算:

cat = max(0, 5.1 - 3.2 + 1) + max(0, -1.7 - 3.2 + 1)

= max(0, 2.9) + max(0, -3.9)

= 2.9 + 0 = 2.9

max(0, x)的意思是x大于0取x,小于0则取0

car = max(0, 1.3 - 4.9 + 1) + max(0, 2.0 - 4.9 + 1)

= max(0, -2.6) + max(0, -1.9)

= 0 + 0 = 0

frog = max(0, 2.2 - (-3.1) + 1) + max(0, 2.5 - (-3.1) + 1)

= max(0, 5.3) + max(0, 5.6)

= 5.3 + 5.6 = 10.9

其中car预测最好,frog的预测最差

损失函数的值相同,意味着两个模型一样吗?

  • 还是这个公式:

  • 输入数据:X = [1, 1, 1, 1]

    • 模型A:w1 = [1, 0, 0, 0]

    • 模型B:w2 = [0.25, 0.25, 0.25, 0.25]

  • 两者的结果都等于1,那两者的可以说一样吗?是不是模型B的W更可靠。那么损失函数还得加入一个东西

损失函数 = 数据损失 + 正则化惩罚项

  • 正则化惩罚项:

  • 正则化惩罚项关注权重w,w越大则该公式的结果越大,我们希望模型不要太复杂,过拟合的模型是没用的。往往还有个 λ 。

回归任务的解决了,还有分类任务的。

Softmax分类器(分类任务)
  • 归一化:

    where

  • 计算损失值:

举例:

其中3.2exp表示e^3.2=24.5,24.5normalize表示24.5 / (24.5+164+0.18) = 0.13,这就是概率,同时我们再做-log(0.13)可以得到0.89这个损失值,log(1)的时候为0,即没有损失,表示概率值越接近于1损失的越少。

这些都是前向传播,一步步的得到损失值,那么如何以损失值来更新W更新模型呢,这就是反向传播。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1215080.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Google codelab WebGPU入门教程源码<5> - 使用Storage类型对象给着色器传数据(源码)

对应的教程文章: https://codelabs.developers.google.com/your-first-webgpu-app?hlzh-cn#5 对应的源码执行效果: 对应的教程源码: 此处源码和教程本身提供的部分代码可能存在一点差异。运行的时候,点击画面可以切换效果。 class Color4 {r: number;g: numb…

英伟达真是赢麻了,深夜推出最强AI芯片霸场 | 百能云芯

10月14日凌晨,英伟达在2023年全球超算大会(Supercomputing Conference,SC)上正式宣布,升级旗舰AI芯片,推出全新的H200芯片,以处理更强大的人工智能系统。包括亚马逊的AWS、Alphabet的Google Clo…

完全随机设计的方差分析

一、说明 实验设计在科学研究中发挥着至关重要的作用,使研究人员能够从数据中得出有意义的结论。一种常见的实验设计是完全随机设计(CRD),其特征是将实验单元随机分配到治疗组。CRD 的方差分析 (ANOVA) 是一种统计技术&#xff0c…

【C++高阶(二)】熟悉STL中的map和set --了解KV模型和pair结构

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:C从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习C   🔝🔝 map和set 1. 前言2. map和set介绍3. pair结构介…

一个开源的汽修rbac后台管理系统项目,基于若依框架,实现了activiti工作流,附源码

文章目录 前言&源码项目参考图: e店邦O2O平台项目总结一、springboot1.1、springboot自动配置原理1.2、springboot优缺点1.3、springboot注解 二、rbac2.1、概括2.2、三个元素的理解 三、数据字典3.1、概括与作用3.2、怎么设计3.3、若依中使用字典 四、工作流—…

pytorch文本分类(一):文本预处理

pytorch文本分类(一):文本预处理 本文为自己在鲸训练营答题总结,作业练习都在和鲸社区数据分析协作平台 ModelWhale 上。 🚩学习任务原链接在这里 相关数据链接:https://pan.baidu.com/s/1iwE3LdRv3uAkGGI…

企业工商四要素核验API的实现原理和功能介绍

引言 随着社会经济的不断发展,对企业信息的准确性和可信度要求也越来越高。为了有效防范企业信息不实和欺诈行为,企业工商四要素核验API应运而生。该API可以通过传入企业名称、社会统一信用代码、法人名称、法人身份证等信息,快速进行核验&a…

UFT On录制Web应用时无法识别Chrome浏览器对象

使用UFT的Object Spy 无法识别浏览器对象 成功加载Web插件后,使用UFT的对象间谍无法识别Chrome浏览器的对象 有三种情况可能导致这个问题: 浏览器比例没有设置为100%浏览器版本太低,无法与插件匹配浏览器没有添加UTF One的插件 我的是第三个…

单点车流量与饱和度的计算思考

sat:饱和度 v:平均车速 d(v):车速为v情况下的安全车距(车距车身长,平均值) l:车道数 f:单位时间监测流量(车/min) 饱和度计算公式: 推导过程…

【git】git本地仓库命令操作详解

这篇文章主要是针对git的命令行操作进行讲解,工具操作的基础也是命令行,如果基本命令操作都不理解,就算是会工具操作,真正遇到问题还是一脸懵逼 如果想看远程仓库的操作,可以看另一篇文章: 【git】远程远…

编译智能合约以及前端交互工具库(Web3项目一实战之三)

我们已然在上一篇 Web3项目灵魂所在之智能合约编写(Web3项目一实战之二) ,为项目写好了智能合约代码。 但身为开发人员的我们,深知高级编程语言所编写出来的代码,都是需要经过编译,而后外部方能正常调用。很显然,使用solidity这门新的高级编程语言编写出来的智能合约,也…

服务网关实践

概述 微服务架构由很多个微小的服务(微服务)组成系统,每个微服务有自己的主机和端口号。如果直接让客户端与各个微服务通信,带来的问题有: 客户端需要维护多个请求地址(主机和端口号)每个微服…

解决requests库中UnicodeError异常的问题

摘要:本文介绍了使用requests库时可能遇到的UnicodeError异常,并提供了两种解决方法,以确保你的代码能够正常处理URL。 问题背景 在使用requests库时,当尝试获取类似’http://.example.com’这样的URL时,可能会遇到Un…

1、24 个常见的 Docker 疑难杂症处理技巧(一)

1Docker 迁移存储目录 默认情况系统会将 Docker 容器存放在 /var/lib/docker 目录下 [问题起因] 今天通过监控系统,发现公司其中一台服务器的磁盘快慢,随即上去看了下,发现 /var/lib/docker 这个目录特别大。由上述原因,我们都知…

草图一键生成静态网页,看看这个开源项目

借助GPT-4V视觉模型,可以轻松的将一张草图生成一个静态页面。现在这已经不是什么稀奇事了。主要是分享一下它的Prompt,很简单,用户画好草图后,将草图保存成png图片,传给GPT-4V,然后GPT返回一个标准的HTML&a…

解决 requests 2.28.x 版本 SSL 错误

最近,在使用requests 2.28.1版本进行HTTP post传输时,您可能遇到了一个问题,即SSL验证失败并显示错误消息(Caused by SSLError(SSLCertVerificationError(1, [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get loc…

了解七大经典排序算法,看这一篇就足够了!!!

✏️✏️✏️好,那么今天给大家分享一下七大经典排序算法! 清风的CSDN博客 😛😛😛希望我的文章能对你有所帮助,有不足的地方还请各位看官多多指教,大家一起学习交流! 动动你们发财的…

代码随想录算法训练营第五十五天 | LeetCode 583. 两个字符串的删除操作、72. 编辑距离、编辑距离总结

代码随想录算法训练营第五十五天 | LeetCode 583. 两个字符串的删除操作、72. 编辑距离、编辑距离总结 文章链接:两个字符串的删除操作、编辑距离、编辑距离总结 视频链接:两个字符串的删除操作、编辑距离 1. LeetCode 583. 两个字符串的删除操作 1.1 思…

算法通关村第九关-白银挑战二分查找与高频搜索树

大家好我是苏麟,今天看看二分查找相关的题目 . 大纲 二分查找拓展问题山脉数组的峰顶索引 中序与搜索树二叉搜索树中的搜索验证二叉搜索树 二分查找拓展问题 山脉数组的峰顶索引 描述 : 符合下列属性的数组 arr 称为 山脉数组 : arr.length > 3存在 i&#…

【halcon】外观检测总结之灰度操作

1 灰度操作之 滞后延时 *滞后阈值 hysteresis_threshold (ImageInvert, RegionHysteresis, 190, 220, 3)这句话的意思就是,逐个判断这个图片区域里像素的灰度值,如果这个值小于190就不考虑了pass掉,如果大于220就直接入选。值在190和220之间…