【AI相关】模型相关技术名词

news2024/11/20 8:30:26

目录

过拟合和欠拟合

1.过拟合

2.欠拟合

特征清洗、数据变换、训练集、验证集和测试集

1.特征清洗 

2.数据变换

3.训练集

4.验证集

5.测试集

跨时间测试和回溯测试

1.跨时间测试(OOT 测试)

2.回溯测试

联合建模与联邦学习

1.联合建模

2.联邦学习

API


过拟合和欠拟合

1.过拟合

过拟合是指模型在训练数据上表现得非常好,但在新的、未见过的数据上表现很差。

这就像是一个学生把课本上的内容背得滚瓜烂熟,但遇到实际问题时却不知道如何解决。

过拟合通常是因为模型过于复杂,或者训练数据太少,导致模型把训练数据中的噪声也学习进去了。

2.拟合

欠拟合则相反,是指模型在训练数据上表现就很差,更不用说在新的数据上了。

这就像是一个学生连课本上的内容都没有完全理解。

欠拟合通常是因为模型过于简单,或者训练数据太少,导致模型无法捕捉到数据的真实规律。


特征清洗、数据变换、训练集、验证集和测试集

1.特征清洗 

简单解释:把数据中的“脏东西”去掉,让数据变得干净整齐。

例子:假设你有一个学生成绩的数据集,其中有一些学生的成绩是空的或者写成了“未知”。特征清洗就是把这些空的或错误的成绩去掉或替换成合理的值,确保每个学生都有一个准确的成绩。

2.数据变换

简单解释:把数据变得更容易理解和使用。

例子:如果你有一组学生的身高数据,单位是厘米。但为了方便比较,你想把这些身高数据转换成米。数据变换就是做这个单位转换的过程,让数据更容易比较和分析。

3.训练集

简单解释:用来教模型学习的数据。

例子:假设你想训练一个识别猫和狗的模型。你会给模型看很多猫和狗的照片,告诉它哪些是猫,哪些是狗。这些用来训练模型的照片就是训练集。

4.验证集

简单解释:用来检查模型学得怎么样的数据。

例子:在训练模型的过程中,你会用一些额外的照片来检查模型是否学会了区分猫和狗。这些照片就是验证集。如果模型在验证集上的表现很好,说明它可能学会了。

5.测试集

简单解释:用来测试模型最终学得如何的数据。

例子:当模型训练完成后,你会用一组全新的、模型从未见过的照片来测试它。这些照片就是测试集。如果模型在测试集上的表现也很好,那么你可以更有信心地认为这个模型在实际应用中也会表现得很好。


跨时间测试和回溯测试

1.跨时间测试(OOT 测试)

含义:跨时间测试是指在不同的时间点对软件进行测试,以检查软件在不同时间段的性能、稳定性和功能是否一致。

通俗解释:想象一下,你有一个软件,你在它刚发布时测试了一次,然后在几个月后再次测试。这就是跨时间测试。目的是确保软件在经过一段时间后仍然能够正常工作,没有出现问题。

2.回溯测试

含义:回溯测试是指在修复了软件中的某个问题或添加了新功能后,重新运行之前的测试用例,以确保该问题已被解决,并且新的更改没有引入新的问题。

通俗解释:假设你的软件有一个bug,你修复了它。为了确保这个修复真的有效,并且没有引入其他的问题,你会重新运行之前为这个bug编写的测试用例。这就是回溯测试。

简而言之,跨时间测试关注软件在不同时间的表现,而回溯测试关注修复或更改后软件的表现。

联合建模与联邦学习

1.联合建模

简单解释:联合建模是多个团队或组织合作,把他们的数据和知识放在一起,共同创建一个模型。

例子

假设有两家电商公司,它们各自都有用户购物数据。

为了更准确地预测用户的购买行为,这两家公司可以决定联合建模。

它们将各自的数据合并,并共同训练一个模型。这样,模型就能利用更多的数据,从而可能做出更准确的预测。

2.联邦学习

简单解释:联邦学习是一种保护隐私的机器学习方法。在联邦学习中,各个参与方可以在不共享原始数据的情况下,共同训练一个模型。

例子

假设有多个医院想要合作开发一个疾病预测模型,但它们不希望共享患者的具体医疗数据,以保护患者隐私。

这时,它们可以采用联邦学习。

每家医院在自己的数据上训练模型的一部分,然后将这部分模型的结果分享给其他医院。

通过这种方式,各个医院可以在不暴露原始数据的情况下,共同训练出一个更准确的预测模型。


API

全称是“Application Programming Interface”,中文可以翻译为“应用程序编程接口”。

它是不同软件应用程序之间的通信桥梁,允许不同的软件组件或系统之间进行数据交换和功能调用。

简单来说,API就像是一个翻译,让不同的软件或系统能够“说”同一种“语言”,从而实现互相协作和数据共享。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1629114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用友政务财务系统FileDownload接口存在任意文件读取漏洞

声明: 本文仅用于技术交流,请勿用于非法用途 由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,文章作者不为此承担任何责任。 简介 用友政务财务系统是由用友软件开发的一款针对政府机…

OPPO手机支持深度测试+免深度测试解锁BL+ROOT权限机型整理-2024年3月更新

绿厂OPPO手机线上线下卖的都很不错,目前市场份额十分巨大,用户自然也非常多,而近期ROM乐园后台受到很多关于OPPO手机的私信,咨询哪些机型支持解锁BL,ROOT刷机,今天ROM乐园正式盘点当前市场上可以解BL刷root…

树莓派4-通过IIC实现图片循环播放

一、环境 1、树莓派4; 2、串口连接电脑; 3、树莓派由杜邦线连接0.96寸OLED1306协议 4、树莓派能够联网,便于安装环境。离线情况也可以安装,相对麻烦; 二、目标 1、树莓派可以开启IIC并识别已连接的IIC; …

机器人-轨迹规划

旋转矩阵 旋转矩阵--R--一个3*3的矩阵,其每列的值时B坐标系在A坐标系上的投影值。 代表B坐标系相对于A坐标系的姿态。 旋转矩阵的转置矩阵 其实A相对于B的旋转矩阵就相当于把B的列放到行上就行。 视频 (将矩阵的行列互换得到的新矩阵称为转置矩阵。&…

4月26日 阶段性学习汇报

1.毕业设计与毕业论文 毕业设计已经弄完,加入了KNN算法,实现了基于四种常见病的判断,毕业论文写完,格式还需要调整,下周一发给指导老师初稿。目前在弄答辩ppt(25%)。25号26号两天都在参加校运会…

【蓝桥杯省赛真题38】python字符串拼接 中小学青少年组蓝桥杯比赛 算法思维python编程省赛真题解析

目录 python字符串拼接 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 七、 推荐资料 1、蓝桥杯比赛 2、考级资料 3、其它资料 python字符串拼接 第十三届蓝桥杯青少年组python编程省赛真题 一、题目…

Cadence OrCAD学习笔记(2)OrCAD原理图

最近换份工作主要用到Cadence,之前都是用AD居多,所以现在也开始记录下Cadence学习过程,方便后面复习。 参考教程: OrCAD视频教程第2期:10分钟学会OrCAD原理图_哔哩哔哩_bilibili 本期主要介绍原理图中的基本操作&…

ZooKeeper 搭建详细步骤之二(伪集群模式)

ZooKeeper 搭建详细步骤之一(单机模式) ZooKeeper 及相关概念简介 伪集群搭建 ZooKeeper 伪集群是指在一个单一的物理或虚拟机环境中模拟出一个由多个 ZooKeeper 节点构成的集群。尽管这些节点实际上运行在同一台机器上,但它们通过配置不同的…

【学习笔记二十八】EWM和QM集成的后台配置和前台展示

一、EWM和QM集成概述 SAP EWM(扩展仓库管理)和QM(质量管理)的集成是SAP系统中一个重要的特性,它允许企业在仓库管理过程中实现质量控制和检验流程的自动化。以下是关于EWM和QM集成的一些关键点概述: 集成优势:通过集成,企业可以确保仓库中的物料在收货、存储、…

flutter笔记-主要控件及布局

文章目录 1. 富文本实例2. Image2.1 本地图片2.2 网络图片 笔记3. 布局4. 滑动相关view4.1 GridView类似九宫格view4.2 ListView 关于widget的生命周期的相关知识这里就不做介绍,和很多语言类似; 1. 富文本实例 Dart中使用richtext,示例如下…

深入浅出MySQL-02-【MySQL支持的数据类型】

文章目录 前言1.数值类型2.日期时间类型3.字符串类型3.1.CHAR和VARCHAR类型3.2.ENUM类型3.3.SET类型 4.JSON类型 前言 环境: Windows11MySQL-8.0.35 1.数值类型 MySQL中的数值类型,如下: 整数类型字节最小值最大值TINYINT1有符号 -128无…

C#反射应用

1.根据类名名称生成类实例 CreateInstance后面的参数部分一定要和所构造的类参数数量对应,即使设置参数默认值,也不可省略。 2.只知道类名,需要将该类作为参数调用泛型接口。 3.只知道类名,需要将该类的数组作为参数调用泛型接口…

基于51单片机的电梯仿真系统

基于51单片机的电梯设计 (仿真+程序PPT) 功能介绍 具体功能: 1.一共4层,数码管显示当前楼层; 2.六个按键模拟电梯外按键(1上、2上、2下、3上、3下、4下),每当按下时有…

前端HTML5学习2(新增多媒体标签,H5的兼容性处理)

前端HTML5学习2新增多媒体标签,H5的兼容性处理) 分清标签和属性新增多媒体标签新增视频标签新增音频标签新增全局属性 H5的兼容性处理 分清标签和属性 标签(HTML元素)和属性,标签定义了内容的类型或结构,而…

基于 Redis 发布订阅实现服务注册与发现

写在前面 其实很少有公司会使用 Redis 来实现服务注册与发现,通常是ETCD、NACOS、ZOOKEEPER等等,但是也不妨碍我们了解。本文会先介绍 Redis 的发布/订阅模式,接着基于这个模式实现服务注册与发现。 Redis发布订阅流程图: Red…

多端文件互传软件-LocalSend

一、前言 日常学习或者是工作需求,需要手机和电脑互传文件。用到频率低的话,使用即时通讯软件也就够了。 像我日常使用的多端互传文件软件是LocalSend。 二、 LocalSend LocalSend是一款基于局域网的文件传输工具。 LocalSend是一种用于在本地网络中…

系统盘空间不足调优方式1-APPData/大文件清理

作者:私语茶馆 1.前言 Windows系统盘(C盘)很容易剩余空间不足,这种情况下会非常影响Windows系统的运行,系统盘约束非常多,不方便在线扩容,因此规划和利用好系统盘是保障整体运行效率的关键。包…

经典机器学习算法——Pagerank算法

目录 Pagerank介绍 背景介绍 中心思想 一、量化重要性 三大指标 1、数量指标 2、质量指标 3、稀释指标 二、实际应用简化为理论模型 PageRank公式 手动预测网站的重要度 马尔可夫矩阵预测网站的重要度 两个方法的联系 PageRank算法存在的问题 一、Dead Ends问题…

XTuner微调LLM:1.8B、多模态和Agent-笔记四

本次课程由XTuner 贡献者李剑锋、汪周谦、王群老师讲解【XTuner 微调 LLM:1.8B、多模态和 Agent】课程 课程视频:http:// https://b23.tv/QUhT6ni 课程文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md 两种Finetun…

web题目实操 5(备份文件和关于MD5($pass,true)注入的学习)

1.[ACTF2020 新生赛]BackupFile (1)打开页面后根据提示是备份文件 (2)查看源码发现啥都没有 (3)这里啊直接用工具扫描,可以扫描到一个文件名为:/index.php.bak的文件 (…