【机器学习】为什么训练集用fit_transform而测试集只用transform？

news2026/2/12 13:19:49

文章目录

一、解释
二、归一化（Normalization）
三、为什么只对训练集做fit_transform，对测试集只做transform？

一、解释

fit(): Method calculates the parameters μ and σ and saves them as internal objects.

解释：简单来说，就是求得训练集X的均值，方差，最大值，最小值，这些训练集X固有的属性。

transform(): Method using these calculated parameters apply the transformation to a particular dataset.

解释：在fit的基础上，进行标准化，降维，归一化等操作（看具体用的是哪个工具，如PCA，StandardScaler等）。作用是通过找中心和缩放等实现标准化

fit_transform(): joins the fit() and transform() method for transformation of dataset.

解释：fit_transform是fit和transform的组合，既包括了训练又包含了转换。对部分数据先拟合fit，找到该part的整体指标，如均值、方差、最大值、最小值等等（根据具体转换的目的），然后对该trainData进行转换transform，从而实现数据的标准化、归一化等等。

transform()和fit_transform()二者的功能都是对数据进行某种统一处理（比如标准化~N(0,1)，将数据缩放(映射)到某个固定区间，归一化等）

二、归一化（Normalization）

归一化的目的：

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内，使其具有可比性。

归一化之后等高线变得不再崎岖， $x_1$ 和 $x_2$ 的更新速度变得更为一致，容易更快地通过梯度下降找到最优解。迭代次数变少，减小梯度下降算法的过程，从而加速模型的生成。

在这里插入图片描述

从上图中不难看出，归一化后的数据迭代次数更少！

三、为什么只对训练集做fit_transform，对测试集只做transform？

机器学习假设：

训练集和测试集的每个样本都是从同一分布中抽样得到的，所以在训练集中fit之后在测试集就不能再fit了，要不然二者可能不是同一分布模型，预测效果会很糟糕。

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/361870.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

使用vue3+vantUi3.x版本，van-list列表组件，控制台报错

使用vue3+vantUi3.x版本，van-list列表组件，控制台报错

van-list报错过程在vue3.0vantUi3.x版本中，使用List列表组件时，代码就是官方给的demo： <van-listv-model:loading"loading":finished"finished"finished-text"没有更多了"load"onLoad" >&l…

阅读更多...

甘肃西部河谷科技有限公司官网上线 | LTD技术行业案例分享

甘肃西部河谷科技有限公司官网上线 | LTD技术行业案例分享

甘肃西部河谷信息科技有限公司成立于2018年，是一家专业的IT技术推广与服务公司。主营业务有智慧城市、智慧校园、智慧农业、信息技术设备软件研发、集成销售；安防设备、网络工程、市场营销策划、电子商务信息、技术咨询服务等。公司立足高端IT技术服务&a…

阅读更多...

CODESYS开发教程11-库管理器

CODESYS开发教程11-库管理器

今天继续我们的小白教程，老鸟就不要在这浪费时间了😊。前面一期我们介绍了CODESYS的文件读写函数库SysFile。大家可能发现了，在CODESYS的开发中实际上是离不开各种库的使用，其中包括系统库、第三方库以及用户自己开发的库。实际…

阅读更多...

2023年测试人跳槽新功略，涨薪10K+

2023年测试人跳槽新功略，涨薪10K+

软件测试是如何实现涨薪的呢？很多人眼中的软件测试岗位可能是简单的，技术含量不是那么高，就是看看需求、看业务、设计文档、然后点一点功能是否实现，再稍微深入一点就是测试下安装部署时会不会出现兼容性问题，以及易用…

阅读更多...

【Spring Cloud Alibaba】002-Spring Cloud Alibaba

【Spring Cloud Alibaba】002-Spring Cloud Alibaba

【Spring Cloud Alibaba】002-Spring Cloud Alibaba 文章目录【Spring Cloud Alibaba】002-Spring Cloud Alibaba一、Spring Cloud Alibaba 介绍1、介绍2、 Spring Cloud Alibaba 提供的功能模块二、分布式项目搭建1、项目搭建2、访问测试3、结论三、Spring Cloud Alibaba 环境…

阅读更多...

一文带你精通分布式锁

一文带你精通分布式锁

在单机环境下，由于使用环境简单和通信可靠，锁的可见性和原子性很容易可以保证，可以简单和可靠地实现锁功能。到了分布式的环境下，由于公共资源和使用方之间的分离，以及使用方和使用方之间的分离，相互之间的…

阅读更多...

车机开发【Android SystemUI 架构音量控制详解】

车机开发【Android SystemUI 架构音量控制详解】

SystemUI介绍 SystemUI摘要在Android系统中SystemUI是以应用的形式运行在Android系统当中，即编译SystemUI模块会生产APK文件，源代码路径在frameworks/base/packages/SystemUI/，安装路径system/priv-app/-SystemUI。什么是SystemUI 在前…

阅读更多...

Glue Connector 和 Connection 的关系与区别

Glue Connector 和 Connection 的关系与区别

AWS Glue作为一种无服务器产品，其运行环境是“不可预知”的，也就是“一个黑盒”，所以如何能连接一些自有数据源是Glue必须考虑并给予满足的，为此，Glue给出的解决方案就是Connector和Connection，一个connect…

阅读更多...

快鲸scrm发布快递行业私域运营解决方案

快鲸scrm发布快递行业私域运营解决方案

现如今，快递行业竞争格局日益激烈，前有“四通一达”等传统快递企业，后有自带互联网基因、绑定电商流量新贵快递企业，如菜鸟、京东等。在这一背景下，很多快递企业开启了增长破局之旅，他们纷纷搭建起私域运营…

阅读更多...

高校借力泛微，搭建一体化、流程化的内控管理平台

高校借力泛微，搭建一体化、流程化的内控管理平台

财政部《行政事业单位内部控制规范（试行）》中明确规定：行政事业单位内部控制是指通过制定制度、实施措施和执行程序，实现对行政事业单位经济活动风险的防范和管控，包括对其预算管理、收支管理、采购管理、资产管理、建…

阅读更多...

【0基础也能看懂】从0到1落地接口自动化测试

【0基础也能看懂】从0到1落地接口自动化测试

昨天花了几个小时看完了字节XX大佬的《接口测试入门课》，有一些新的收获，结合我自己实践自动化测试的一些经验以及个人理解，这篇文章来聊聊新手如何从零到一落地实践接口自动化测试。为什么要做接口测试测试理念的演变早些时候，软…

阅读更多...

【Python入门第十四天】Python 集合

【Python入门第十四天】Python 集合

集合（Set） 集合是无序和无索引的集合。在 Python 中，集合用花括号编写。实例创建集合： thisset {"apple", "banana", "cherry"} print(thisset)运行实例注释：集合是无序的&#…

阅读更多...

Kubeadm介绍与使用Kubeadm搭建kubernetes集群环境

Kubeadm介绍与使用Kubeadm搭建kubernetes集群环境

Kubeadm介绍 1.通俗点讲，kubeadm跟minikube一样，都是一个搭建kubernetes环境一个工具； 区别在于：minikube是搭建单机kubernetes环境的一个工具 kubeadm是搭建集群kubernetes环境的一个工具，这个常用； 2.对…

阅读更多...

DocEE:一种用于文档级事件抽取的大规模细粒度基准论文解读

DocEE:一种用于文档级事件抽取的大规模细粒度基准论文解读

DocEE: A Large-Scale and Fine-grained Benchmark for Document-level Event Extraction 论文：NAACL2022.pdf (tongmeihan1995.github.io) 代码：tongmeihan1995/DocEE: DocEE: A Large-Scale and Fine-grained Benchmark for Document-level Event Ext…

阅读更多...

ABAP 辨析ON INPUT|REQUEST|CHAIN-INPUT|CHAIN-REQUEST

ABAP 辨析ON INPUT|REQUEST|CHAIN-INPUT|CHAIN-REQUEST

1、逻辑流在屏幕开发中，存在如下逻辑流： PBO（Process Before Output）：屏幕输出之前触发 PAI（Process After Input）：用户在屏幕中执行操作触发 POH（Process On Help-…

阅读更多...

5.8 BGP属性-AS-PATH

5.8 BGP属性-AS-PATH

5.4.2配置BGP AS-PATH属性控制选路 1. 实验目的熟悉BGP AS-PATH属性控制选路的应用场景掌握BGP AS-PATH属性控制选路的配置方法2. 实验拓扑实验拓扑如图5-8所示：图5-8：配置BGP AS-PATH属性控制选路 3. 实验步…

阅读更多...

DADPS-Biotin-Alykne|2241685-22-1|DADPS生物素炔烃

DADPS-Biotin-Alykne|2241685-22-1|DADPS生物素炔烃

DADPS（二烷氧基二苯基硅烷）生物素炔烃探针消除了链霉亲和素-生物素亲和纯化的主要限制。该试剂含有生物素部分和叠氮化物反应部分。DADPS 探针可用于生物分子标记和蛋白质组学研究。 DADPS biotin alkyne probe eliminates the main limitation of affin…

阅读更多...

【Linux】软件安装（三）

【Linux】软件安装（三）

目录 1. 软件安装 1.1 软件安装方式 1.2 安装JDK 1.3 安装Tomcat 1.4 安装MySQL 1.5 安装lrzsz 1. 软件安装 1.1 软件安装方式在Linux系统中，安装软件的方式主要有四种，这四种安装方式的特点如下： 安装方式特点二进制发布包安装…

阅读更多...

基于springboot校园二手市场平台

基于springboot校园二手市场平台

一、项目简介本项目是一套基于springboot校园二手市场平台，主要针对计算机相关专业的正在做bishe的学生和需要项目实战练习的Java学习者。包含：项目源码、数据库脚本等，该项目可以直接作为bishe使用。项目都经过严格调试，确保…

阅读更多...

YOLOv6-3.0-目标检测论文解读

YOLOv6-3.0-目标检测论文解读

文章目录摘要算法2.1网络设计2.2Anchor辅助训练2.3自蒸馏实验消融实验结论论文： 《YOLOv6 v3.0: A Full-Scale Reloading 》github： https://github.com/meituan/YOLOv6上版本参考 YOLOv6摘要 YOLOv6 v3.0中YOLOv6-N达到37.5AP，1187FPS&…

阅读更多...

推荐文章

最新文章