【视频解读】动手学深度学习V2_02深度学习介绍

news2024/11/22 16:34:40

1.AI地图

image-20230505062036141

  1. 人工智能的地图,x轴是不同模式,由符号学到概率模型 到机器学习,Y轴是我想做的东西,最底下的是感知,我得了解这是什么东西,然后做推理,形成自己的知识,最后做规划。最底层的就是感知,就是我能够看到这个物体,比如这个屏幕等,做推理是基于我现在看到的东西,会发现什么事情,第三个知识是比较难的事情,根据我看到的数据和现象,来形成我的知识,我能进行比较长远一点的规划,也就是我的未来怎么做。
  2. 这里对几个比较大的领域做了一点规划,第一是自然语言处理,自然语言处理在过去取得了比较大的进步,但是还是停留在比较简单的感知上面,比如自然语言处理应用比较多的是机器翻译,如中文翻译成英文,就是几秒的事情,很多是潜意识里面感知的问题,所以人在几秒内能够反应过来的范围都属于感知的范围。
  3. 计算机视觉能够稍微往前走一点,我在图片里面能够做一些推理。
  4. 自然语言处理最初是符号学,首先语言是一个符号,接下来发展为概率模型和机器学习。
  5. 计算机视觉因为图片里面都是一些像素,很难用符号学来解释,所以计算机视觉大部分是用概率模型或机器视觉。
  6. 深度学习是机器学习的一种,他能做机器视觉,也能做自然语言处理,也能做强化学习。
  7. 过去8年里,从Alexnet开始,最热的方向就是机器视觉和自然语言处理。

2.深度学习应用的突破

1.图像分类

image-20230505071313275

  • Imagenet是一个比较大的图片分类数据集,包含1000类物体的图片,大概有1000万张图片。

image-20230505071437004

  • 这张图展示的是从10年到17年,Y轴是错误率。每个点表示每个paper的错误率,10年的错误率还是挺高的,最好的是26%左右,

2012年有一个比较大的下降,这也是深度学习的开始,在接下来的五年里面,深度学习已经把图像分类的误差降到非常低。17年几乎所有的团队都能把误差降到5%以内。基本上可以达到人类在图片识别上的精度。在图片分类这个工作,深度学习已经做的非常好了。

2.物体检测与分割

image-20230505071947897

  • 物体检测:我们不仅仅想知道这个图片里面的内容,我们还想知道是什么,在什么位置。
  • 物体分割:想知道每个像素是属于飞机,还是属于某个人,是更深层次的应用。

3.样式迁移

image-20230505075712340

  • 样式图片内容图片合成一张,类似一个滤镜,可以任意切换风格。

4.人脸合成

image-20230505075855066

  • 人脸合成的图片都是假的,通过随机树开始合成的一些照片,人类难以分辨出这些图片是真还是假。

5.文字生成图片

image-20230505080051368

  • baby 萝卜遛狗的图片
  • 牛油果椅子。

6.文字生成

image-20230505080220693

  • 如何来开一个比较有效的董事会议。
  • SQL语言,编程,这也是非常强大的语言生成模型。

7.无人驾驶

image-20230505080410701

8.案例研究–广告点击

image-20230505080500915

  • 问题:给你一个用户输入,如何给你一些广告。
  • 这个问题可以分成三个阶段,第一输入一个关键词时,给你一些广告,接下来就是机器学习的模型,给你一个广告后,客户的点击概率是什么样子,p为人会点击这个广告的概率,根据点击率和广告主付你多少钱,然后一乘,点击率乘以竞价,会得到一个数字,把它作为一个排序,排名高的我会拍到前面,排名低的我会舍去。
  • 这是广告点击的三个步骤,1.触发广告,2.预测一个点击率3.最后得到一个排序

image-20230505080549797

image-20230505081107397

  • 里面最重要的一个就是预测点击率,首先看到广告时要进行特征提取,包括广告主产品描述产品图片等信息,把这些特征放到模型之后,就可以预测出点击率的数据。主要包括两个步骤,特征提取模型预测
  • 我们可以把过去所有的广告展现用户点击数据存下来,因为我知道用户有没有点,所以我是有真实的用户点击行为,把它作为训练数据,放到一个模型里面进行训练.

image-20230505081553381

  • 一个完整的故事是这样的,我有些领域专家,模型控制用户展现,用户点击数据用反过来训练新的模型。
  • 数据科学家拿到数据进行模型训练。
  • AI专家主要提升模型精度和性能。
  • 一个机器学习领域里面有三类人,领域专家【对应用有非常深的了解,知道一些机器学习的事情,更多是了解机器学习的给我的产品带来什么样的影响】,数据科学家【数学科学家会把原始数据转化成计算机能够理解的数据,然后训练模型】和AI专家【关注某几个点,然后进一步提升】。每个人既可以是领域专家,也可以是数据科学家。

3.QA

1.机器学习在图像分割领域为什么有效,有没有定论?

  • 模型的可解释性是深度学习和机器学习比较关注的地方,因为它们是一个黑盒,你训练一个模型,你也不知道它为什么效果好,或者不好。对于深度学习来讲,其可解释性做的并不好,对于机器学习来说,对于一些简单的模型,我们有一些简单的理解,对于比较复杂的模型,我们基本是放弃其可解释性的研究。
  • 有效性和可解释性是两个概念。为什么有效,当然我可以给出很多解释, 但是可解释性是另外一个概念,人是不是能够理解这个模型,它为什么能够工作,它什么时候不工作,以及在什么时候出现偏差,这是可解释性要理解的问题。一个模型在一个什么样的问题上有应用,会有一些解释,什么样的模型会考虑空间信息,什么样的模型会考虑时间的信息,什么样的模型泛化性能好一些,这是是不是工作的可解释性,但是更一般的,目前还没有太多的进展。

2.领域专家什么意思?

我想去做农业上的物体识别,我想去看一下今年的收成怎么样?我用一个无人机,去把图片拍下来,然后就会看到树的一些图片,作为数据科学家,我不懂二月份树要长成什么样子,领域专家会告诉你,这个树长多少叶子是比较好的,数据科学家就会把领域专家的一些需求翻译成能够做的一些任务,所以说领域专家是提需求的一些人,是甲方,数据科学家是乙方。

3.MXnet要装GPU版本,必须要卸载CPU版本吗?

需要。该课程是基于pytorch,会有一些不一样。

4.深度学习不能用数学规范表述,只能直觉上理解是吗?

这个不一定,深度学习模型是可以用数学来表述的,接下来也是会介绍很多数学的东西,但是用数学来解释,它为什么工作,为什么不工作,这是目前做的不好的一个地方。

5.符号学可以与机器学习融合起来吗?

这个确实是可以的,符号学在深度学习目前有一些新的进展,比如符号学就是做一些符号学的推理,目前图神经网络可以做一些复杂的推理过程,模型够复杂的情况下,确实可以做一些推理的工作。

6.数据科学家和AI专家的区别在哪里?

  • 没有太多区别,数据科学家,给一个数据,我赶紧出一个模型,能工作就很好了,我关心的是如何把一个领域专家问题,抽象为实际的业务问题,变成机器学习能够完成的一个任务,训练一个还不错的模型,AI专家有可能也是数据科学家,我不仅能够把模型训练出来能用,而且能够把模型做的精度很高,资深数据科学家你可以认为是AI专家。
  • 数据科学家是有两条路,一条是不断开发新的领域,比如说机器学习在农业上的应用,在医疗上的应用,这是往广的方向上走,往深的方向上走的话,可以成为AI的专家。在某一块,我可以成功这一块了解最多的人。

7.Mac是不是支持Pytorch

可以支持Pytorch,只能用CPU,简单的任务是可以做的,负责的任务是比较难一些。

8.自然语言仅仅在感知层面似乎不太合适,因为语言的理解和产出,不仅仅是感知,也涉及语言知识,也涉及到规划,比如机器对话,下一步要做些什么。

语言是一个很复杂的过程,自然语言处理,我们做的还很一般,虽然能做一些感知,不如深度学习在机器视觉的领域做的应用好一些,地图是一个大致的分类,不用特别纠结。

9.如何寻找自己领域的paper的经验。

后面会讲。

10.无人驾驶,误判率在下降,但是误判的影响非常严重。

  • uncertainty或者roubustness,我的数据在数据发生偏移或者极端情况下,我会不会做出很不好的答案。解决方法之一就是把不同的模型融合到一起,通过多个模型来进行投票。在竞赛中,我们会提到如何通过多个模型来提

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/491191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

07-Vue技术栈之(组件之间的通信方式)

目录 1、组件的自定义事件1.1 绑定自定义事件:1.1.1 第一种方式1.1.2 第二种方式1.1.3 自定义事件只触发一次 1.2 解绑自定义事件1.3绑定原生DOM事件1.4 总结 2、全局事件总线(GlobalEventBus)2.1 应用全局事件总线 3、 消息订阅与发布&#…

SwiftUI 极简实现文本摆动弹性动画

概览 SwiftUI 为我们来了界面设计和调试上的便利,只需几行代码我们就能实现一个不错的文本动画效果: 如上图所示,我们在 SwiftUI 中基本还没发力,就实现了文本摆动弹性动画。 这究竟是怎么做到的呢? 无需等待&#…

英文论文(sci)解读复现【NO.7】基于注意机制的改进YOLOv5s目标检测算法

此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文&a…

Loadrunner性能测试(一)

备注:电脑最好安装有IE浏览器 一、下载安装包 链接:https://pan.baidu.com/s/1f5Sw0QK5zrLCU1EbN01evg?pwdbite 提取码:bite 包含的文件有: 二、安装loadrunner 注意,以下教程仅展示需要特别注意的步骤&#x…

PHP学习笔记第一天

前言 作者简介:不知名白帽,网络安全学习者。 博客主页:不知名白帽的博客_CSDN博客-网络安全,CTF,内网渗透领域博主 网络安全交流社区:https://bbs.csdn.net/forums/angluoanquan 目录 PHP语法 基本的PHP语法 PHP的数据类型 PH…

Kubernetes 集群中某个节点出现 Error querying BIRD: unable to connect to BIRDv4 socket

1. 问题描述 Readiness probe failed: calico/node is not ready: BIRD is not ready: Error querying BIRD: unable to connect to BIRDv4 socket: dial unix /var/run/calico/bird.ctl: connect: connection refusedReadiness probe failed: 2023-05-04 22:13:23.706 [INFO]…

LiangGaRy-学习笔记-Day10

1、知识回顾 1.1、rpm依赖报错问题 rpm安装的时候,会有依赖报错rpm安装httpd服务,体现报错 #rpm安装httpd [rootNode1 ~]# rpm -ivh /mnt/cdrom/Packages/httpd-2.4.6-88.el7.centos.x86_64.rpm warning: /mnt/cdrom/Packages/httpd-2.4.6-88.el7.ce…

自己组装的电脑怎么用U盘安装系统操作教学

自己组装的电脑怎么用U盘安装系统操作教学分享。有的用户使用台式机的时候,会自己去进行硬件的组装,但是这样的电脑在安装好了之后,里面还没有系统,需要进行安装。如果你不知道怎么去安装,可以来看看以下的操作方法。 …

HummerRisk 使用教程:源码检测

HummerRisk 是开源的云原生安全平台,以非侵入的方式解决云原生环境的安全和治理问题。核心能力包括混合云的安全治理和云原生安全检测。 本文将介绍HummerRisk中「源码检测模块」的功能,包括如何配置项目源码,以及使用源码检测规则进行安全检…

香港top5功能完善炒期货投资app软件排名(最新评测)

选择一款合适的炒期货投资软件对于投资者来说至关重要。考虑软件稳定、交易流畅度、交易品种、数据可靠性、而且还要考虑费用等多方面因素。 首先,软件的稳定性很重要。选用稳定性高的软件可以避免如断电、手机或电脑死机等突发状况,保证交易安全顺畅。…

FreeRTOS 低功耗 Tickless 模式

文章目录 一、低功耗模式1. 睡眠(Sleep)模式2. 停止(Stop)模式3. 待机(Standby)模式 二、Tickless 模式详解1. 如何降低功耗?2. Tickless 具体实现 一、低功耗模式 STM32 本身就支持低功耗模式,有三种低功耗模式: ● 睡眠(Sleep)模式。 ● 停…

5_服务编排_docker-compose

服务编排之Docker Compose 微服务架构的应用系统中一般包含若干个微服务,每个微服务一般都会部署多个实例,如果每个微服务都要手动启停,维护的工作量会很大。 要从Dockerfile build image 或者去dockerhub拉取image 要创建多个container 要…

GB/T25915.1法规基本标准-洁净室按粒子浓度划分洁净

《GB/T25915.1-2021洁净室及相关受控环境 第一部分:按粒子浓度划分空气洁净度等级》等4部国家标准。 今天小编跟大家分享一下参编的GB/T25915.1-2021相关法规文件内容,帮助大家更好的了解相关法规知识。 1 范围 本文件规定了按空气中悬浮粒子浓度划分洁…

9:00进去,9:05就出来了,这问的也太···

从外包出来,没想到死在另一家厂子了。 自从加入这家公司,每天都在加班,钱倒是给的不少,所以也就忍了。没想到8月一纸通知,所有人不许加班,薪资直降30%,顿时有吃不起饭的赶脚。 好在有个兄弟内推…

纯前端 根据目录解析word,拆分不同段落

前期回顾 两分钟学会 制作自己的浏览器 —— 并将 ChatGPT 接入_0.活在风浪里的博客-CSDN博客自定义浏览器,并集合ChatGPT,源码已公开https://blog.csdn.net/m0_57904695/article/details/130467253?spm1001.2014.3001.5501 👍 本文专栏…

Unity之OpenXR+XR Interaction Toolkit实现 监听VR手柄按键

一.前言 当我们接入XR Interaction Toolkit之后,我们可以很方便的做不同VR设备的适配,这在很大程度上提升了我们的开发效率,我们除了通过射线和物体交互之外,偶尔我们也会希望监听手柄上的部分按键的点击事件,今天我们…

网络安全大厂面试题合集

以下为网络安全各个方向涉及的面试题合集,星数越多代表问题出现的几率越大,祝各位都能找到满意的工作。 注:本套面试题,已整理成pdf文档,但内容还在持续更新中,因为无论如何都不可能覆盖所有的面试问题&…

国考省考结构化面试:情景模拟题的答题思路,人际关系题的变种,就题答题,灵活多变,关键在自己多思考,说话要有艺术

国考省考结构化面试:情景模拟题的答题思路,人际关系题的变种,就题答题,灵活多变,关键在自己多思考,说话要有艺术 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能,附带…

ansible常用模块总结

目录 一、 assert模块 二、 authorized_key模块 三、at模块 四、blockinfile模块 五、command模块 六、copy模块 七、 cron模块 八、 firewalld模块 九、 fail模块 十、 file模块 十一、 fetch模块 十二、filesystem模块 十三、 get_url模块 十四、group模块 十…

基于pytorch+transformers的车牌识别

目录 程序流程设计熟悉训练数据集CCPD2019数据集CCPD数据集标注信息单例再现 加载本地车牌数据集 程序流程设计 1,熟悉训练数据集; 2,加载本地车牌数据集; 3,定义网络模型; 4,输入数据集训练模…