Datawhale x李宏毅苹果书入门 AI夏令营 task03学习笔记

news2024/11/16 7:54:32

实践方法论

训练模型的基本步骤:(如下图所示)

  1. 用训练集训练模型,(最终得出来最优的参数集)
  2. 将最优参数集带入模型中,用测试集测试模型(人话:将最优参数集带入原来函数中,用测试集的x值计算y值)(这个过程就叫做预测)


训练过程中遇到问题的解决攻略(看下图的方式是“前序遍历”)

model bias出现问题的情况:

1.看training data的 loss,太大;

2.当你模型无论如何调整参数,训练的结果还是不够好。

解决办法:那就只能重新设计模型,增加(减少)feature,下图是model bias出现问题

下图是optimization出现问题

当loss大了,判断是model bias还是optimization的问题的方法如下:

通过比较不同层数的model判断现在的model够不够大,如果高model比低model效果差,那么就是高model的optimization出现问题(56-layer的前20-layer和20-layer做一样的事,56层的后36层竟然没有帮助反而拖后腿

 选择合理的model的方法:training set分为training set训练,用validation set测试,可以根据validation set测试出来的loss判断使用哪个模型。如下图所示:


通过划分training set和validation set判断选用模型的方法:

  1. 训练集分为等分为n份 数据集,分别选用其中的一个作为val set,其他作为train set,
  2. 写出所有排列的可能(全排列)
  3. 将全排列的val set 和train set的数据带入同一个model中,计算出msei,然后算出平均的mse
  4. 重复操作3,只需要把model换成你要测试的模型之中即可

    overfitting

  • overfitting:loss在training data小,在test data大
  • overfitting解决方法:
  1. 数据增强:a.增加训练资料;b.根据资料的特性和自己对要处理的问题的理解,自己去创造data 
  2. 限制模型:a.Less parameters,sharing parameters(把几个参数值设置成一样的);b.Less features(降低model的层数(即降低model的复杂度,采用简单的模型比如二次多项式等));c.Early stopping;d.Regularization;e.Dropout

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2086041.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

观测云「可观测性解决方案」亮相 828 B2B 企业节

今年,随着第三届828 B2B企业节与中国国际大数据产业博览会的同步盛大开幕,我们迎来了企业发展和技术创新的崭新篇章。作为国内可观测性领域的领军企业,观测云不断深化在监控观测技术与能力上的探索,致力于为全球用户提供全面而统一…

如何用网络分析仪测试软件测试天线?

随着射频技术的发展,对于天线性能的精确测试需求日益增长,矢量网络分析仪因此成为测试环节中不可或缺的工具之一。今天天宇微纳为大家介绍网络分析仪测试天线S参数的方法与流程。 网络分析仪测试天线的方法 S参数是衡量和评估天线性能和通信质量的重要指…

springboot接收时间类型参数的方式

参数直接跟在url上面用DateTimeFormat接收 参数写在实体类中 用JsonFormat接收 注意: pattern 中的表达式要和接受的数据类型格式一致。不然会报错。例如表达式是 yyyy-MM-dd 就只能匹配LocalDate ,不能用 LocalDateTime去接收。即使LocalDateTime是更细化的时间类型…

Redis过期键监听

在 Redis 中,为了监听过期键事件,需要使用 Redis 的 Keyspace Notifications 功能。这一功能允许客户端订阅某些事件的发生,比如键过期、键删除等。 启用过期键监听 在 Redis 的配置文件 redis.conf 中,确保配置项 notify-keysp…

恒电流间歇滴定法 (GITT) 测试教程

文章目录 恒电流间歇滴定法 (GITT) 测试教程1. GITT 测试原理2. 实验准备2.1 设备与材料2.2 配置实验装置 3. GITT 测试步骤3.1 设定测试参数3.2 执行 GITT 测试 4. 数据分析4.1 电压变化分析4.2 扩散系数计算4.3 电荷传输阻抗分析 5. 总结与应用 恒电流间歇滴定法 (GITT) 测试…

【最新发布】OpenCV实验大师工作流引擎 - 实现OpenCV算法从设计到交付零代码

点击查看 更多 OpenCV工作流引擎案例与代码教程,QT集成案例 OpenCV实验大师工具软件介绍 一款能够提升OpenCV教学质量与OpenCV工程化开发质量与速度的OpenCV算法设计与流程验证 工具软件 - OpenCV实验大师平台。 一款OpenCV工程化开发效率提升与OpenCV教学质量提升…

一步迅速了解Spring框架中的几大特点

一,Spring框架的特点1 :AOP 1, AOP全称: Aspect Oriented Programming 2, AOP主要是用面向切面编程思想处理问题,面向切面编程是对面向对象编程的补充和延续 3,面向切面编程思想 面向切面编程思想是将我们程序中的非业务代码&am…

[SimCLR v2] Big Self-Supervised Models are Strong Semi-Supervised Learners

1、目的 借助无监督预训练来提升半监督学习的效果 2、方法 1)unsupervised/self-supervised pretrain -> task-agnostic -> big (deep and wide) neural network可以有效提升准确性 -> improvements upon SimCLR larger ResNet models;deeper …

03:logic软件操作界面及常用设置

1.打开logic软件 2显示工具栏 3.logic软件常用设置 3.1常规页设置 3.2设计页设置 3.3颜色设置

在发布您的插件之前,如何在 ONLYOFFICE 插件市场中进行测试?

ONLYOFFICE 插件为我们提供了强大的定制和拓展功能。作为插件开发人员,您可能希望在发布之前,在插件管理器中预览您的插件。这篇文章将指导您如何在 ONLYOFFICE 插件市场中预览插件。 关于 ONLYOFFICE ONLYOFFICE 是一个国际开源项目,由领先…

大数据智能风控核心:模型

概述 模型 线性判别分析方法,Sir Ronald Fisher最早提出模型评分的概念。 个人FICO模型信用分。 巴塞尔委员会发布巴塞尔Ⅱ协议,推出内部评级法(Internal Rating Based Approach,IRB)​。IRB综合考虑客户评级和债项…

HLS报错之:Export RTL报错 “ERROR: [IMPL 213-28] Failed to generate IP.“

原因:官方bug 解决办法:下载补丁(补丁适用于2014年至2021年的多个Vivado版本),并添加到对应路径下即可。 注意:windows下该方法试用。 补丁连接 我这里下载到xilinx的目录下并解压: 点进去找…

微服务集成 Seata

文章目录 引入依赖配置TC地址其它服务使用 本篇文章介绍分布式架构下, 各个微服务之间要达成分布式事务, 引入 Seata 的步骤和使用方式. 引入依赖 首先&#xff0c;在 order-service 服务中引入依赖&#xff1a; <!--seata--> <dependency><groupId>com.al…

YOLOv8改进 | 模块缝合 | C2f融合多尺度表征学习模块 【含OD、RTDETR、OBB等yaml文件】

秋招面试专栏推荐 &#xff1a;深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 &#x1f4a1;&#x1f4a1;&#x1f4a1;本专栏所有程序均经过测试&#xff0c;可成功执行&#x1f4a1;&#x1f4a1;&#x1f4a1; 专栏目录 &#xff1a;《YOLOv8改进有效…

String框架基础补充

前言 本文将继续上一篇文章的内容对 Spring 数据访问层管理,Spring集成mybatis等知识进行补充,未看过上一篇文章的小伙伴可以点击下方链接,跳转观看上一篇文章Spring框架基础https://mp.csdn.net/mp_blog/creation/editor/141639879 Spring数据访问层管理 首先,我们需要知道 : …

软考高项彻底没用了?谁说的?站出来,我保证不笑场!

哎呀&#xff0c;最近这风言风语可不少啊&#xff0c;说咱们的软考高项证书成了“过气网红”&#xff0c;彻底没用了&#xff1f;这可真是让我哭笑不得&#xff0c;咱们得好好聊聊这个话题&#xff0c;不能让这“谣言”满天飞啊&#xff01; 首先&#xff0c;我得说&#xff0…

直播电商如何重构人场关系?推荐这套电商精细化运营方案!

随着电子商务的不断发展&#xff0c;直播电商和货架电商已经成为两大主流的在线购物模式。它们各自以独特的方式满足消费者的购物需求&#xff0c;同时也有不同的商业挑战和机遇。本文将从消费者行为、技术应用、品牌策略等多个角度分析这两种电商模式的核心区别。同时&#xf…

大众集团25届校招社招网申入职SHL测评题库:综合能力测评、性格问卷、英语测评考什么?

恭喜您通过大众汽车(中国)科技有限公司的简历初。请点击下面的测评链接&#xff0c;在5天内完成测评&#xff0c;过期失效(例:3.11收到链接&#xff0c;3.15为最后一天有效期)。每位人选只有一次测评机会。 ​大众汽车入职测试细节: 1.性格问卷:25 分钟 2.综合能力:46 分钟&a…

Python 轻松去除验证码干扰点,让识别不再犯难

Python 轻松去除验证码干扰点&#xff0c;让识别不再犯难 引言一、干扰点噪声二、图片降噪三、测试运行结果写在最后 作者&#xff1a;高玉涵 时间&#xff1a;2024.8.29 21:52 博客&#xff1a;blog.csdn.net/cg_i 环境&#xff1a;Windows10、Python 3.11.3、PIL、Tesseract-…

Unet改进10:在不同位置添加CPCA||通道先验卷积注意力机制

本文内容:在不同位置添加CPCA注意力机制 目录 论文简介 1.步骤一 2.步骤二 3.步骤三 4.步骤四 论文简介 低对比度和显著的器官形状变化等特征经常出现在医学图像中。现有注意机制的自适应能力普遍不足,限制了医学影像分割性能的提高。本文提出了一种有效的通道先验卷积…