深度学习基础

news2025/1/10 20:44:22

1 机器学习、深度学习、人工智能

在这里插入图片描述

1.1 机器学习

机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。
基本步骤:获取数据、数据预处理、特征提取、特征选择、推理预测识别(数据预处理、特征提取、特征选择合称为特征表达)

1.2 监督学习

监督学习,是其训练集的数据是提前分好类,带有标签的数据,进行学习到模型以及参数。

1.3 非监督学习

非监督学习,需要将一系列没有标签的训练数据,输入到算法中,需要根据样本之间的相似性对样本集进行分类或者分析。

2 模型相关

2.1 判别模型和生成模型

生成式模型:由数据学习联合概率分布P(X,Y),然后由P(Y|X)=P(X,Y)/P(X),求出概率分布P(Y|X)作为预测的模型,该方法表示了给定输入X与输出Y之间的生成关系。
判别式模型:由数据直接学习决策函数y=f(x)或者条件概率分布P(Y|X)作为预测模型,判别方法关心的是对于给定输入X应预测出什么样的输出Y。
判别式模型方便很多,因为生成式模型要学习一个X,Y的联合分布往往需要很多数据,而判别式模型需要的数据则相对少,因为判别式模型更关注输入特征的差异性。不过生成式既然使用了更多数据来生成联合分布,自然也能够提供更多的信息

2.2 回归模型

回归模型正是表示从输入变量到输出变量之间映射的函数。例如,线性回归代表目标值预期是输入变量的线性组合。

2.3 多层神经网络

由输入层、输出层、隐藏层组成:

  1. 输入层:接受与处理训练数据集中的各输入变量值
  2. 隐层:实现非线性数据的线性变换
  3. 输出层:给出输出变量的分类或预测结果

3 正则化

经常使用的是L1和L2正则化(L2>L1),思想是在损失函数增加一项(正则项)。

3.1 L2正则化

正则项为权重的平方和,公式为:
在这里插入图片描述
其中在这里插入图片描述是不添加正则化的损失函数。

3.2 L1正则化

正则项为权重的和,公式为:
在这里插入图片描述

3.3 偏差和方差

偏差是描述模型的期望预测与真实结果之间的偏离程度。偏差大说明模型拟合能力差,此时欠拟合。
方差是描述数据扰动造成的模型性能的变化,即模型在不同数据集上的稳定程度。方差大,说明模型稳定性差,训练集上拟合优秀,测试集上拟合差,则方差大,此时过拟合。

3.4 欠拟合

欠拟合,模型参数学习的过少,模型不能很好地拟合数据

3.5 过拟合

过拟合:把一些不必要的特征过度计算了

4 数据集相关

评估方法就是如何划分数据集,应该要求测试集与训练集之间互斥,用测试集来预测评估模型方法。

4.1 留出法

就是将整个数据集按照某种比例进行划分成训练集和测试集,训练集和测试集比例一般为7:3。

4.2 交叉验证法

将全部数据集S分成 k个不相交的子集,每次从分好的子集中里面,拿出一个作为测试集,其它k-1个作为训练集,根据训练集训练出模型,放到测试集上,得出结果。计算k次求得的结果的平均值,作为该模型的真实结果。

如果k太大,误差估计的偏差很小。但是误差估计的方差很大(由于验证点少)计算时间非常大(试验次数多),会导致过拟合。
如果k太小,计算量小,计算时间短。但是误差估计的方差小(由于验证点多)误差估计的偏差会很大,会导致欠拟合。

4.3 留一法

交叉验证法的一种,每次只留下一个样本做测试集,其它样本做训练集,如果有k个样本,则需要训练k次,测试k次(注意这里是以样本为单位,交叉验证法以子集为单位)。
适合小样本数据

4.4 自助法

留出法每次从数据集D中抽取一个样本加入数据集D’中,然后再将该样本放回到原数据集D中,即D中的样本可以被重复抽取。这样,D中的一部分样本会被多次抽到,而另一部分样本从未被抽到。

5 最大似然学习

已经知道结果,寻找使该结果出现可能性最大的参数的过程。计算步骤如下:

  1. 写出似然函数
  2. 对似然函数取对数
  3. 求导,令导数为0得到似然方程
  4. 解似然方程得到参数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/717273.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

postman几种常见的请求方式

1、get请求直接拼URL形式 对于http接口,有get和post两种请求方式,当接口说明中未明确post中入参必须是json串时,均可用url方式请求 参数既可以写到URL中,也可写到参数列表中,都一样,请求时候都是拼URL 2&am…

【win怎么给两个屏幕设置不同壁纸】

在现在经济的发展下,多数用户都拥有了两个屏幕,那么如何在不适用壁纸软件的情况下,将两个屏幕设置成不同的壁纸呢? 操作 首先将需要进行设置的图片选好,将其保存到桌面上,紧接着框选两张图片,…

探索Gradio库中的Image模块及其强大功能

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

84、基于stm32单片机超市自助存储柜快递箱系统设计(程序+原理图+流程图+参考论文+开题报告+任务书+设计资料+元器件清单等)

单片机主芯片选择方案 方案一:AT89C51是美国ATMEL公司生产的低电压,高性能CMOS型8位单片机,器件采用ATMEL公司的高密度、非易失性存储技术生产,兼容标准MCS-51指令系统,片内置通用8位中央处理器(CPU)和Flash存储单元&a…

Go程序结构- package和import

1、包和文件 在Go语言中包的作用和其他语言中的库或模块的作用类似,用于支持模块化、封装、编译隔离和重用。关键点如下: (1)包中保存一个或者多个.go结尾的文件,而包的目录就是包的导入路径 (2)中Go中通过一条简单的规则来管理标识符是否对外…

下个版本已定!C++自救新动作!

自去年年底,美国安全局(NSA)在其所发布的《Software Memory Safety》报告中点名批评C之后,C之父Bjarne Stroustrup一顿回怼后,做出决定:内部自救。现在,就让我们看看下一个版本的C,究…

【Go】Go 语言教程--语言变量(五)

往期教程: Go 语言教程–介绍(一)Go 语言教程–语言结构(二)Go 语言教程–语言结构(三)Go 语言教程–数据类型(四) 文章目录 变量声明多变量声明值类型和引用类型简短形…

【微服务】springboot 适配多数据源设计与实现

目录 一、问题背景 1.1 mysql读写分离 1.2 适配多种类型数据库 1.3 多数据源 二、适配多数据源场景和问题 2.1 支持快速切换其他数据源 2.2 代码层面最小化改造 2.3 数据迁移问题 2.4 跨库事务问题 三、多数据源适配解决方案 3.1 自己造轮子 3.2 基于providerId方式…

年少轻狂,中年失意,晚年凄惨的杜甫

诗圣杜甫的一生,几乎和苦难、倒霉紧紧拴在了一起。 裘马轻狂,恣意漫游的青年 公元712年,发生了两件值得历史铭记的大事情。第一件事,唐玄宗在这一年继位;第二件事,伟大的诗人杜甫在这一年出生。 杜甫字子…

openstack平台IsolatedHostsFilter的使用记录

文章目录 前言已有的经验思路一:image元数据思路二:flavor元数据思路三、IsolatedHostsFilter:使用filter来限制总结 前言 甲方的云平台新到了一些海光的机器,希望能加入到已有的计算集群里面。问题不大,但是有些小的…

怎么开发zblog插件?

要开发 ZBlog 插件,可以按照以下步骤进行: 1. 创建插件目录:在 ZBlog 的插件目录中创建一个新的目录,目录名称即为插件的名称,例如 "myplugin"。 2. 创建插件入口文件:在插件目录下创建一个 PHP …

Android Studio实现内容丰富的安卓宿舍管理平台

如需源码可以添加q-------3290510686,也有演示视频演示具体功能,源码不免费,尊重创作,尊重劳动。 项目编号086 1.开发环境 android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端: 1.注册登录 2.查看公告 3.报…

docker 教程笔记,win11

1、如何执行container 当git clone一个带Dockerfile的项目时,先打开终端,跳转到该项目文件夹。 使用如下命令构建镜像image docker build -t project_name . 注: project_name为该项目名,后面必须要有空格和点。 执行完毕后&#…

「TCG 规范解读」TCG 规范架构概述(下)

修订历史: 2023.3.4 2023.6.18 2023.7.2 可信计算组织(Ttrusted Computing Group, TCG)是一个非盈利的工业标准组织,它的宗旨是加强不同计算机平台上计算环境的安全性。TCG 于 2003 年春成立,并采纳了由可信计算平台联盟(the Trusted Computing Platform Alliance, TCPA)…

python函数的基本定义

python定义函数的规则: 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号(); 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数; 函数的第一行语句可以选择性地使用文档字符串—用于存放函数…

Axure设计之文章目录动态定位导航教程

博客类型的内容网站,文章目录能很好的提升用户体验,通过目录可以清除整体结构,还可以通过目录进行导航,定位要浏览内容所在位置。下面通过Axure工具使用简单的元件实现文章目录导航的效果。 一、案例效果 1、页面左侧为文章目录&a…

Spring 系列1 -- 初识Spring

目录 1. Spring是什么? 2. DI 概念说明 3. 总结 1. Spring是什么? 我们通常所说的Spring指的是Spring Framework(Spring框架),他是一个开源框架,有着庞大的社区.Spring ⽀持⼴泛的应⽤场景,它可以让 Java 企业级的应用程序开发起来更简单.用一句话来概述就是Spri…

nginx缓存配置

nginx缓存配置 在http模块下配置在server模块下配置简单验证下nginx服务器配置客户机访问nginx缓存服务器 在http模块下配置 注意/data/nginx/cache要自己创建 http {proxy_cache_path /data/nginx/cache levels1:2 keys_zonemy_cache:10m max_size10g inactive60m use_temp_…

Kafka基础入门篇

一、kafka简介 其主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间的访问性能高吞吐率。即使在非常廉价的机器上也能做到单机支持每秒100K条消息的传输支持Kafka Server间的消息分区,及分…

资源释放的方式

资源释放通常指的是关闭文件、网络连接、数据库连接等资源,以释放系统资源并防止资源泄漏。 1:try-catch-finally finally:在异常处理时提供finally块来执行所有清除操作,比如IO流中的释放资源特点:被finally控制的语句最终一定…