【期中复习】深度学习

news2024/11/15 10:58:48

文章目录

    • 机器(深度)学习的四大核心要素
    • 为什么深度学习,不增加网络宽度
    • 黑盒模型的问题
    • 计算图
    • 线性神经网络
    • 梯度下降
    • 学习率
    • 优化方法
    • softmax函数用于多分类
    • 交叉熵
    • 线性回归与softmax回归的对比
    • 为什么需要非线性激活函数
    • 感知机
    • 线性回归、softmax回归、感知机和支持向量机的比较
    • sigmoid激活函数
    • 双曲正切(tanh)激活函数
    • 线性(ReLU)修正函数
    • MLP
    • K折交叉验证
    • 估计模型的复杂度
    • 数据复杂度
    • 欠拟合和过拟合
    • 欠拟合和过拟合的原因
    • 正则化
    • Dropout
    • 梯度爆炸和梯度消失
    • 权重初始化
    • 参数初始化

机器(深度)学习的四大核心要素

数据、模型、性能度量(目标函数)、优化方法

为什么深度学习,不增加网络宽度

  • 增加深度使得学习高层次、抽象特征成为可能
  • 相比于增加宽度,增加深度的学习效率更高。比如对于一些要学习的多项式函数,浅层网络需要指数增长的神经元个数,其拟合效果才能匹配上多项式增长的深层网络
    宽度的优点:增加宽度会增加模型的记忆能力

黑盒模型的问题

数据安全隐患、输出不可信、模型改进局限、模型应用局限

计算图

在这里插入图片描述

线性神经网络

  • 模型
    在这里插入图片描述

  • 性能度量
    在这里插入图片描述

  • 优化方法
    在这里插入图片描述

梯度下降

在这里插入图片描述

学习率

在这里插入图片描述

优化方法

在这里插入图片描述

softmax函数用于多分类

在这里插入图片描述

  • 可用:量化样本间的相对大小(等比例缩放不变)
  • 概率:每个样本取值范围[0,1],总和等于1
  • 可训练:可微分

交叉熵

在这里插入图片描述

线性回归与softmax回归的对比

在这里插入图片描述

为什么需要非线性激活函数

在这里插入图片描述
因为是线性的,神经网络虽然引入了隐藏层,却依然等价于一个单层神经网络

感知机

在这里插入图片描述
在这里插入图片描述

线性回归、softmax回归、感知机和支持向量机的比较

在这里插入图片描述

sigmoid激活函数

在这里插入图片描述

  • 优点
    (0-1),平滑、多标签分类
  • 缺点
    梯度消失、更新效率低

双曲正切(tanh)激活函数

在这里插入图片描述

  • 优点
    (-1,1),平滑,更新效率高
  • 缺点
    梯度消失

线性(ReLU)修正函数

在这里插入图片描述
在这里插入图片描述

MLP

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

K折交叉验证

在这里插入图片描述
在这里插入图片描述

估计模型的复杂度

在这里插入图片描述

数据复杂度

在这里插入图片描述

欠拟合和过拟合

在这里插入图片描述

欠拟合和过拟合的原因

在这里插入图片描述

正则化

在这里插入图片描述

Dropout

在这里插入图片描述

梯度爆炸和梯度消失

在这里插入图片描述

在这里插入图片描述

权重初始化

在这里插入图片描述

参数初始化

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1131427.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql-面试50题-2

一、查询数据 学生表 Student create table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10)); insert into Student values(01 , 赵雷 , 1990-01-01 , 男); insert into Student values(02 , 钱电 , 1990-12-21 , 男); insert into Student v…

Unity3D 打包发布时生成文件到打包目录

有时候需要自己创建批处理文件或日志文件,在启动程序的同级目录使用,减少手动操作的时间和错误率。主要使用到的是OnPostprocessBuild方法。 1、在工程中的Editor文件夹下创建脚本 2、将文件放入Plugins的相关目录 3.脚本内容 using System.Collection…

视频号视频下载教程,为视频博主提供的PC电脑版下载方法

在如今这个数字时代,视频博主们成为了社交媒体平台上的明星。他们创作出精彩纷呈的视频内容,吸引着大量粉丝的关注和喜爱。然而,对于那些想要在自己的电脑上收藏这些视频的人来说,可能需要一些技巧和工具来实现。幸运的是&#xf…

SD-WAN专线:一带一路市场布局的商业加速器

刚刚结束的“一带一路”国际合作高峰论坛再次彰显了跨境合作的重要性。在这个全球化时代,随着一带一路倡议的不断推进,企业需要更加高效、稳定的网络连接来实现与参与国家的合作。在这一背景下,SD-WAN专线成为了加速一带一路合作的新选择&…

【C++】c++引用和小细节

文章目录 一、引用的特性:引用的实质引用权限使用场景引用和指针的区别 c引用不是定义了新的对象,而是对一个已有的对象起了一个别名,如鲁迅和周树人的关系,鲁迅是周树人的笔名,两者是一个东西,只是名字不同…

2023年9月青少年机器人技术(三级)等级考试试卷-理论综合

2023年9月青少年机器人技术等级考试(三级)理论综合试卷 单选题 第 1 题 单选题 Arduino Nano主控板,通过光敏电阻控制LED灯亮度的变化。电路搭设及程序如下图所示,当光照强度逐渐增强时,LED的亮度逐渐减弱&#xff…

k8s-----19、Helm

Helm 1、引入2、概述2.1 重点2.2 V3版本的Helm2.2.1 与之前版本的不同之处2.2.2 V3版本的运行流程 3、安装和配置仓库、一些附带操作3.1 安装3.2 配置仓库3.3 常用命令3.4 添加helm的自动补齐 4、快速部署应用(weave应用)5、 自行创建Chart5.1 Chart目录内容解析5.2 简单安装部…

基于springcloud+web实现智慧养老平台系统项目【项目源码+论文说明】

基于springcloudweb实现智慧养老平台演示 摘要 首先,论文一开始便是清楚的论述了系统的研究内容。其次,剖析系统需求分析,弄明白“做什么”,分析包括业务分析和业务流程的分析以及用例分析,更进一步明确系统的需求。然后在明白了系统的需求基础上需要进一步地设计系统,主要包罗…

stm32f10系列的独立看门狗与窗口看门狗

在由单片机构成的微型计算机系统中,由于单片机的工作常常会受到来自外界电磁场的干扰,造 成程序的跑飞,而陷入死循环,程序的正常运行被打断,由单片机控制的系统无法继续工作,会 造成整个系统的陷入停滞状态…

[Note] 汉明码与汉明距离的思考

Hamming distance 定义 汉明距离,定义是两个码字之间的不同的位的数量,例如4’b0000和4’b0011的汉明距离为2,4’b0000和4’b1110的汉明距离为3。 一种编码方式的(最小)汉明距离,它的定义就是,…

与创新者同行,Doris Summit Asia 2023 线下技术峰会圆满落幕!

10 月 21 日,由飞轮科技主办、阿里云与腾讯云联合主办的 Apache Doris 社区首届线下技术峰会 Doris Summit Asia 2023 在一片热潮中落下帷幕。 本届峰会以「与创新者同行」为主题,设置主论坛和智慧金融与政企、先进智造与电信、企业服务与新经济、互联网…

做地推共享wifi贴的如今都怎么样了?

近年来,随着移动互联网的普及和发展,无线网络已经成为人们日常生活中不可或缺的一部分。然而,很多公共场所的WiFi网络并不方便使用,需要输入密码或者注册账号,给用户带来了不便。为了解决这个问题,一种名为…

元对象系统功能

元对象系统功能 建立工程 布局页面 布局页面 修改原件名称 建立元对象 函数作为接口 增加一些固定的属性 #------------------------------------------------- # # Project created by QtCreator 2023-10-24T21:54:44 # #----------------------------…

LLM在text2sql上的应用 | 京东云技术团队

一、前言: 目前,大模型的一个热门应用方向text2sql它可以帮助用户快速生成想要查询的SQL语句。那对于用户来说,大部分简单的sql都是正确的,但对于一些复杂逻辑来说,需要用户在产出SQL的基础上进行简单修改&#xff0c…

金字塔切分注意力模块PSA学习笔记 (附代码)

已有研究表明:将注意力模块嵌入到现有CNN中可以带来显著的性能提升。比如,SENet、BAM、CBAM、ECANet、GCNet、FcaNet等注意力机制均带来了可观的性能提升。但是,目前仍然存在两个具有挑战性的问题需要解决。一是如何有效地获取和利用不同尺度…

主流电商平台价格如何高频监测

双十一来临在即,除了商家很兴奋,品牌和消费者同样持续关注,除了关注不同平台的产品上架情况,价格也是这些渠道参与者最为关注的,品牌需要通过掌握各店铺的价格情况,了解市场情况以及各经销商的渠道治理现状…

从零搭建一个PWA应用需要了解哪些知识

在国内由于小程序的风生水起,PWA 应用在国内的状况一直都不是很好,PWA 和小程序有很多的相似性,但是 PWA 是由谷歌发起的技术,小程序是微信发起的技术,所以小程序在国内得到了大力的扶持,很快就在国内技术界…

docker制作java项目镜像

docker制作java项目镜像 环境步骤Dockerfile 运行容器 环境 当前使用win10安装的docker win10安装Docker参考文章 步骤 将Dockerfile文件和jar包放在同一个目录下 编写Dockerfile文件 Dockerfile #设置镜像基础: jdk8-jre , 比jdk内存小 FROM java:8-jre #维护人员信息 MA…