机器学习 day33(误差分析、添加数据、迁移学习)

news2025/2/25 8:14:13
  1. 误差分析
    在这里插入图片描述
  • 我们可以手动查看分类错误的子集样本(通常为100个),并统计他们的错误类型
  • 在所有错误类型中,选择一种或几种最常见的错误,进行改进。这可以最高效的改进你的模型
  • 误差分析的一个限制是:它只能很好的解决人类擅长的问题
  1. 添加数据
  • 添加数据有三种常见方法:直接添加全新的数据,数据增强,数据合成
  • 添加所有类型的全新数据可能又贵又慢,因此添加有针对性的全新数据可以更低成本的改进模型
    在这里插入图片描述
  • 在图像和音频领域,数据增强是一种显著增加数据集的方法。
  • 数据增强:通过旋转、缩小、方法、增加对比度、镜像变换等改变已有的训练样本,来获得一个全新的训练样本
    在这里插入图片描述
  • 数据增强的高级变换例子:在图片上加一个网格,并随机扭曲网格,从而获得一个更丰富的数据集
    在这里插入图片描述
  • 数据增强,是在数据中制造更多的噪音,同时最后的结果应当与测试集接近
    在这里插入图片描述
  • 数据合成:通常用于计算机视觉领域。上图右侧的例子是使用电脑上的字体,通过不同的对比度,颜色,字体进行截图得到。
    在这里插入图片描述
  • AI包括代码(算法或模型)+ 数据,通常我们是以模型为中心来改进我们的系统,但也可以以数据为中心来改进我们的系统
  1. 迁移学习
    在这里插入图片描述
  • 迁移学习分为两步:首先为监督预训练,即在一个非常大且与任务目标不完全相关数据集上对模型进行预训练,其次为微调,即在监督预训练中获得或初始化大部分参数的基础上,根据任务目标相关的数据集,进一步运行梯度下降或Adam算法,来微调所有权重参数或仅获得(改变)输出层参数
  • 微调有两种方法:一种是仅获得(改变)输出层的参数,适用于任务目标相关的数据集比较小。一种是训练所有权重参数,适用于任务目标相关的数据集稍大
  • 迁移学习的一个好处是,我们可以在网络上下载已经预训练完成的神经网络,省去了我们自己进行监督预训练的步骤
    在这里插入图片描述
  • 由上图可以看出,神经网络在前几层学会了检测边缘,检测角点,检测曲线等通用基本形状,这对神经网络进行其他图片识别任务很有帮助。
  • 迁移学习的一个限制是,预训练和微调的数据集必须是同一个类型的,即都是图像数据或音频数据或文本数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1027653.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务08-认识和使用SpringAMQP

1.AMQP的认识 1.1 介绍 AMQP是什么?看完你就知道了_hello_读书就是赚钱的博客-CSDN博客_amqp 好处: 什么connection:消息队列的连接、channel:服务发送接收消息的通道、Queue:消息队列——>这些你都不需要自己编写…

Keil 5 或者Keil 4自定义主题颜色100%成功

文章目录 步骤一:代码内容解析:完整文件代码一效果图:黑主题Keil 原主题 步骤一: 找到keil 5或者Keil 4软件安装目录下的UV4文件夹下的global.prop文件,然后用记事本打开该文件,复制下面配置替换到global.prop文件里的所有内容保…

IO口电路种类

文章目录 参考1.高速振荡电路(时钟IO引脚)2.与 GPIO 功能共享的低速振荡电路(子时钟IO)3.CMOS 滞后输入引脚4.电源输入保护电路5.A/D 转换器 ref (AVRH)带保护电路的电源输入端6.CMOS 电平输出7.CMOS 电平输出,带有模…

键盘失灵按什么键恢复?详细方法分享!

“我的电脑键盘莫名其妙失灵了,试了好多方法都无法恢复。请问遇到键盘失灵的情况,应该按什么键才能恢复呢?” 键盘是计算机的重要输入设备之一,但有时候它可能会出现失灵的情况,让用户感到困惑和不知所措。但其实&…

软件设计师笔记系列(一)

😀前言 在日常生活和工作中,我们依赖于各种各样的计算机系统来完成一系列复杂的任务。计算机系统不仅仅是硬件设备的集合,它还包括一系列用于协调硬件工作的软件和协议。了解计算机系统的基础知识,包括其构造和功能,是…

【已解决】模糊匹配导致一门课存在多个同名教师

[已解决] 模糊匹配导致一门课存在多个同名教师 问题 LEFT JOIN jsxxb ON XSKB.RKJSXM LIKE jsxxb.JZGXM || ‘%’ 思路 利用正则表达式解决 jsxxb.JZGXM 的字段示例如 李志勇,许蕤 需以,作为分割点,只匹配逗号前面的名字,或者是没有逗号&a…

CSS 学习笔记(基础)

用来控制网页表现的语言,CSS(Cascading Style Sheet):层叠样式表。然后我们继续看看 W3C 标准: 结构:HTML表现:CSS行为:JavaScript CSS导入方式、选择器&属性 由于网页的框架…

【C++进阶】:哈希

哈希 一.unordered_map二.底层结构1.哈希概念2.解决哈希冲突1.闭散列2.开散列 在C98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到 l o g 2 N log_2N log2​N,即最差情况下需要比较红黑树的高度次,当树中的…

分布式/微服务---第四篇

系列文章目录 文章目录 系列文章目录一、分布式事务解决方案二、如何实现接口的幂等性一、分布式事务解决方案 XA规范:分布式事务规范,定义了分布式事务模型 四个角色:事务管理器(协调者TM)、资源管理器(参与者RM),应用程序AP,通信资源管理器CRM 全局事务:一个横跨多个数…

【数字通信原理】第三章—信源编码理论

文章目录 第三章 信源编码理论1.模拟信号的数字化概论2. 信源编码的基本原理2.1 抽样定理2.1.1 低通抽样定理2.1.2 带通抽样定理 2.2 脉冲振幅调制PAM2.2.1 自然抽样2.2.2 平顶抽样 第三章 信源编码理论 1.模拟信号的数字化概论 2. 信源编码的基本原理 2.1 抽样定理 2.1.1 低…

Win10 家庭版 - 解决应用程序无法启动,因为应用程序的并行配置不正确的问题(System Default Context”的激活上下文生成失败)

Win10 家庭版 - 解决应用程序无法启动,因为应用程序的并行配置不正确的问题(System Default Context”的激活上下文生成失败) 系统环境遇到问题试过过程解决办法 前天的时候,女盆友公司电脑遇到个问题:几乎所有的 exe …

Nginx 的优化思路有哪些?网站的防盗链如何做?附图文说明和完整代码步骤

Nginx 的优化思路有哪些?网站的防盗链如何做?实际工作中有哪些类似的安全经验?通过代码实践一步一步实现,附图文说明和完整代码步骤 实验拓扑图: 实验步骤 1、在Centos01上安装Nginx,设置网站根目录/www使用域名www.huhu.com访问 2、在Centos02上安装DNS使用域名访问Ce…

python读取.xls文件,绘制钻头外径磨损图

通过xlrd模块读取.xls文件,数据如下,总计162行16列: 读取与作图如下: from xlrd import open_workbook import matplotlib import matplotlib.pyplot as plt # 设置字体为微软雅黑,解决中文显示问题matplotlib.rc(&qu…

vue3项目学习三:配置登陆解决方案

配置登陆解决方案 配置环境变量封装axios封装接口请求模块封装登录请求触发登录动作本地缓存处理方案LocalStorage 登录鉴权退出登录方案主动退出被动退出 配置环境变量 在根目录创建开发模式和生产模式的两种baseURL 输入: ENVdevelopment# base api VUE_APP_BA…

国内首款研发领域 AI 项目管理工具发布:PingCode AI

PingCode的使命,始终是用技术驱动研发生产力。 过去几年,PingCode在研发管理领域持续引领创新,基于“自动化、数据化、智能化”的战略三部曲,先后发布了研发【自动化】引擎、【效能度量】引擎,而对于最后一步“智能化”…

时序数据库 IoTDB 发布端边云原生解决方案,有效优化工业互联网数据上传时效与资源消耗...

2023 年 9 月 8 日,由中国通信学会、福建省工业和信息化厅主办的 2023 中国国际工业互联网创新发展大会在厦门举办。大会主论坛中,时序数据库 IoTDB 发表其自研建立的端边云原生解决方案,该方案可实现端侧设备、边缘服务器、数据中心数据的协…

400电话怎么办理(申请开通)

申请开通400电话是一项相对简单的过程,只需按照以下步骤进行操作即可。 第一步,选择400电话服务提供商。在市场上有很多公司提供400电话服务,您可以根据自己的需求和预算选择适合的服务商。可以通过搜索引擎、咨询朋友或者查看相关论坛等方式…

开学季ipad电容笔哪款好?便宜的电容笔推荐

随着数码产品不断地更新和添加新的特性功能,iPad的平板已经可以和笔记本电脑相媲美了。而时至今日,随着技术的进步,ipad已经不再是一款单纯的娱乐设备,而是一款集学习、绘画、办公于一体的功能。为提高生产力,搭配上一…

公共4G广播音柱有哪些用处

公共广播音柱有哪些用处 公共广播音柱是一种用于广播音频信号的设备,一般安装在公共场所或街道上。它具有以下几个主要用处: 1. 喊话广播:公共广播音柱可以用于喊话广播,用来传达重要信息、紧急通知、警报等,如公共安…

基于微信小程序的实验室预约管理系统设计与实现

前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 👇🏻…