神经网络笔记

news2024/11/18 7:48:59

多分类问题

Softmax

在这里插入图片描述
在这里插入图片描述

高级优化算法

Adam Algorithm Intuition

每个参数有不同的学习率
在这里插入图片描述
在这里插入图片描述

卷积层

每个神经元只看前一层输入的一部分
原因:
1.更快的计算
2.需要更少的训练数据(不容易过度拟合)

模型评估

成本函数

在这里插入图片描述
在这里插入图片描述

分类

训练集用来训练参数w和b,而测试集用来选择多项式模型(即参数d),训练集不能评估w和b的好坏,类似的测试集也不能用来评估参数d的好坏

分为训练集,交叉验证集,测试集
在这里插入图片描述
训练集在不同的模型上拟合出每个模型的最优WB,交叉验证再从已经拟合好的模型里选择一个最好的模型,再用测试集测试这个模型的误差

通过偏差和方法进行诊断

高偏差:训练集做的不好,基准性能表现和训练误差Jtrain差距
高方差:交叉集做的不好,训练误差和交叉验证误差Jcv之间差距

学习曲线

学习曲线是一种帮助理解学习算法如何作为它拥有的经验量的函数的方法,拥有训练实例的数量

高偏差

在这里插入图片描述
修正方法(强化模型):
1.增加额外的特征
2.添加多项式特征,eg:X1X2,X1的平方
3.减小lamda,降低数据影响

高方差

在这里插入图片描述
修正方法(简化模型):
1.获得更多训练集
2.减少多项式特征值,比如去掉X的三次方、四次方
3.增加lamda,提高数据影响

高偏差欠拟合,加训练数据量没法改善,从模型选择就有问题;高方差过拟合加训练数据量可以改善

神经网络正则化

L1 L2 L3是正则化的三种方法,L1是参数绝对值,L2是参数平方,L3是两者相加
在这里插入图片描述
适当正则化,有利于更大的神经网络,但是速度会减慢。
大型神经网络是低偏置机器,适合复杂函数

机器学习开发

ML开发的迭代循环:选择体系结构(模型、数据等)—建立模型—判断(偏差、方差、误差分析)

误差分析

错误分析要点:通过手动检查算法错误或者错误标记的一组示例

添加更多数据

添加数据是专注于添加更多分析表明可能有帮助的类型的数据
数据增强:特别使用可以显着增加训练集大小的图像和音频数据
数据增强的一个技巧是,对数据所做的更改或扭曲应该代表测试集中噪声或扭曲的类型
数据合成:从头开始构建全新的示例,多用于视觉

迁移学习-使用其他任务中的数据

从完全不相关的任务中获取数据
在这里插入图片描述
将参数转移到新的神经网络,把输出层换成需要的个数,比如换成10个
训练神经网络参数:
1.只训练输出层参数。将参数W1到w4 作为顶部的值,并固定他们,然后使用随机梯度下降或 Adam等算法,仅更新W5、b5 ,以降低您用于学习从训练集中识别数字0到9 的通常成本函数。适合小的训练集
2.训练网络中的所有参数,包括 WA1b1、W2、b2 一直到 WA5,但前四层参数将使用在上面训练过的价值观。适合大的训练集
这两个步骤首先在大型数据集上进行训练,然后在较小的数据集上进一步调整参数,这一步被称为监督预训练。
第二步称为微调,可以在其中获取已初始化或从监督预训练中获得的参数,然后进一步运行梯度下降以微调权重,以适应您可能拥有的手写数字识别的特定应用

机器学习项目的完整周期

在这里插入图片描述

倾斜数据集的误差指标

在这里插入图片描述
精确度(查准率P)是针对预测的,一种预测里头有多少是对的
召回率(查全率R)是针对数据的,一类数据里头有多少被认出

精确率与召回率的权衡

在这里插入图片描述
排序平均值/调和平均数,强调较小的值
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/670362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Python】数据库(创建库 访问 连接 创建表 编辑记录 案例:客户管理实现)

文章目录 * 库表与管理1.访问数据库1.1 连接与创建数据库1.2 创建表1.3 编辑表记录1.3.1 添加记录1.3.2 修改记录1.3.3 返回所有记录1.3.4 删除记录1.3.5 查询记录 1.4 案例:客户管理 SQLite 实现 * 库表与管理 1.访问数据库 SQLite 是 Python 自带的数据库管理模…

SpringBoot 如何使用 Spring Cloud Stream 处理事件

SpringBoot 如何使用 Spring Cloud Stream 处理事件 在分布式系统中,事件驱动架构(Event-Driven Architecture,EDA)已经成为一种非常流行的架构模式。事件驱动架构将系统中的各个组件连接在一起,以便它们可以相互协作…

【深度学习】5-4 与学习相关的技巧 - 正则化解决过拟合(权值衰减,Dropout)

机器学习的问题中,过拟合是一个很常见的问题。过拟合指的是只能拟合训练数据,但不能很好地拟合不包含在训练数据中的其他数据的状态。机器学习的目标是提高泛化能力,即便是没有包含在训练数据里的未观测数据也希望模型可以进行正确的识别。 …

皓文电子 | 智能制造领先企业的安全服务经验分享

皓文电子是一家为客户提供设计、生产、销售高端开关电源及各类功率变换产品的国家级高新技术企业,是国内智能制造领域的代表企业。其核心产品能与国际主流电源厂商竞争,达到国内外领先水平,并在国家多个重点项目中批量生产装备。 遭遇安全事件…

2023年湖北孝感初、中级工程师职称报名条件和要求是什么?启程别

2023年湖北孝感初、中级工程师职称报名条件和要求是什么?启程别 初级职称对于找工作很有帮助。现在,学历越来越高,仅有学历已经不能满足应聘需求。初级职称的获得并不难,有了职称也会让自己在找工作时更有竞争力。威信公号搜一下启…

2023年最新智能优化算法之——IBI逻辑优化算法(IBL),附MATLAB代码

今天给大家带来一个有意思的智能优化算法,IBL算法。 先说效果:在CEC2005函数集测试,基本上毫无压力,把把都能预测的很准确,而且速度极快。大家可以自行尝试哈。 为啥说这个算法有意思呢,大家看IBL的英文全…

史上最大图灵测试实验完成150万人类参与1000万次对话,判断对面是人还是AI

本文 介绍 了AI 21实验室推出了一个好玩的社交图灵游戏——「人类还是机器人?」 【导读】这个「人类还是AI?」的游戏一经推出,就被广大网友们玩疯了!如今全世界已有150万人参与,网友们大方分享自己鉴AI的秘诀。 历上规模最大的…

解决:torch.cuda.is_available()一直返回False,显卡是NVIDA GeForce MX250

目录 1. 背景2. 发现问题根源3. 解决问题 1. 背景 AI时代了,之前一直不怎么用到的小米笔记本Pro的 NVIDA GeForce MX250独显,就想着让它发挥余热,免得买了这么多年,一直闲置,浪费。 无脑按照chatGPT给的例子&#x…

为什么Django要引入CSRF令牌?答:主要是为了防止跨站伪造请求攻击,那么什么是跨站伪造请求攻击呢?

“CSRF”的英文全称是:“Cross-Site Request Forgery”,翻译过来就是:“跨站请求伪造”。 那么什么是跨站伪造请求攻击呢?看下面这张图就够了。 注意:看上面这张图请按图中标注的1到6的顺序阅读。 Django通过引入CS…

一文详解!接口自动化的关键思路和解决方案

目录 引言 正文 一.接口传参 二. 外部数据源 三. 测试断言 四. 环境切换 五. 批量测试 总结 一.接口自动化的工具思维和测试思维 二.贯穿整个接口自动化项目的三个基本思路: 引言 与UI相比,接口一旦研发完成,通常变更或重构的频率…

使用nps搭建内网穿透服务

使用nps搭建内网穿透服务 如何使用nps搭建内网穿透服务前提准备操作流程配置服务端配置客户端 P2P模式,大流量低延迟 正式开始之前呢,先介绍一下什么是内网穿透: 内网穿透(NAT穿透)是一种技术,它允许您通过…

软件测试简历编写以及软件测试面试题大全

目录 前言: 一、简历重要性以及编写原则 二、简历模板 三、简历包装 四、互联网公司常用接口测试面试题 五、互联网公司常面自动化测试面试题 前言: 软件测试是软件开发过程中必不可少的一环,也是一个不断发展和变化的领域。在寻找软件测试职…

广角积分球均匀光源

现阶段,摄影测量技术已涉及多行多业,其在交通、考古以及景物三维重建中的应用尤为显著,但是普通相机取景范围有限,不能全面捕获整个空间信息,因此一种新型相机--全景相机逐步被应用到实际当中。80年代初,国…

场景解析丨活用PDCA循环,让你的项目管理更高效!

聚焦制造业共性项目管控难题 结合装备制造行业特性, 从PDCA循环角度, 通过痛点、解决方案、实际案例的剖析, 看企业如何做好项目管理。 本期干货内容分享 1. 计划的可执行性 计划要达成共识,打造合理三级计划体系 2. 执行的…

Android预装apk

预装APK到system/app目录 注:APK名字不能含有中文、空格等特殊字符。 在 驱动路径/android/vendor/aw/public/prebuild/apk 创建一个目录存放对应的APK将所需预装的APK放入该目录中在该目录中创建 Android.mk文件,并编译 # 文件名 LOCAL_PATH : $(call…

supervisor简介

1、概述 supervisor是一个用python语言编写的进程管理工具,它可以很方便的监听、启动、停止、重启一个或多个进程。当一个进程意外被杀死,supervisor监听到进程死后,可以很方便的让进程自动恢复,不再需要程序员或系统管理员自己编…

回调函数(callback)是什么?一文理解回调函数(callback)

这里写目录标题 一、什么是回调函数1.1、回调函数的定义和基本概念1.2、回调函数的作用和使用场景 二、回调函数的实现方法2.1、函数指针2.2、函数对象/functor2.3、匿名函数/lambda表达式 三、回调函数的应用举例四、回调函数的优缺点五、回调函数与其他编程概念的关系5.1、回…

性能提升30%!袋鼠云数栈基于 Apache Hudi 的性能优化实战解析

Apache Hudi 是一款开源的数据湖解决方案,它能够帮助企业更好地管理和分析海量数据,支持高效的数据更新和查询。并提供多种数据压缩和存储格式以及索引功能,从而为企业数据仓库实践提供更加灵活和高效的数据处理方式。 在金融领域&#xff0…

Mysql高阶语句(一)

Mysql高阶语句(一) 一、MySQL高级进阶SQL 语句1、SELECT斜体样式2、DISTINCT3、WHERE4、AND、OR5、IN6、BETWEEN7、通配符、LIKE8、ORDER BY9、| | 连接符10、GROUP BY11、HAVING 二、函数1、数学函数2、聚合函数3、字符串函数4、日期时间函数 一、MySQL…

短视频矩阵源码

短视频矩阵源码的开发部署其实并不难,主要依托于抖音平台各种开放权限进行研发,市面上常见的源码功能构建也是大同小异,主要处理还在于细节及产品优化上。 如: 1. 视频制作板块,文字转语音功能,当然各种云&…