第二章.线性回归以及非线性回归—特征缩放，交叉验证法，过拟合

news2026/2/13 1:41:12

第二章.线性回归以及非线性回归

2.9 特征缩放

1.数据归一化

1).作用：

把数据的取值范围处理为0-1或者-1-1

2).数据范围处理为0-1之间的方法：

newValue=(oldValue-min)/(max-min)
例如：数组:（1,3,5）,value1:(1-1)/(5-1)=0; value2:(3-1)/(5-1)=0.5; value3:(5-1)/(5-1)=1

3).数据范围处理为-1-1之间的方法：

newValue=（(oldValue-min)/(max-min)-0.5)*2
例如：数组:（1,3,5）,value1:((1-1)/(5-1)-0.5)*2=-1; value2:((3-1)/(5-1)-0.5)*2=0; value3:((5-1)/(5-1)-0.5)*2=1

2.均值标准化

1).方法：

newValue=（(oldValue-u)/s[x:特征数据；u:数据的平均值；s:数据的方差]
例如：x=(1,3,5,7,9)
①.u=(1+3+5+7+9)/5
②.s=((1-5)²+(3-5)²+(5-5)²+(7-5)²+(9-5)²)/5=8
③.(1-5)/8=-0.5
④.(3-5)/8=-0.25
⑤.(5-5)/8=0
⑥.(7-5)/8=0.25
⑦.(9-5)/8=0.5

2.10 交叉验证法:

1.交叉验证法是一种验证方法：

在这里插入图片描述

说明：白色的方框：代表训练集，蓝色方框：代表测试集.
模型用训练集训练，用测试集测试，会得到一个误差值E，迭代10次，每次用的测试集的位置是不同的，用的就是交叉验证的思想

2.11 过拟合:

1.回归描述：

在这里插入图片描述

说明：
①.正确拟合:测试集和训练集表现的都比较好
①.过拟合:训练集表现比较好，测试集表现的比较差

2.分类描述：

在这里插入图片描述

说明：
①.正确拟合:测试集和训练集表现的都比较好
①.过拟合:训练集表现比较好，测试集表现的比较差

3.防止过拟合的方法：

1).减少样本特征（有些数据的特征是干扰性）

2).增加数据量（基本上数据量越大，效果越好）

3).正则化（Regularized）

正则化的代价函数分为两种
参数说明：
λ：正则项的系数

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/167075.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MyBatis-Plus分析打印SQL(开发环境)

MyBatis-Plus分析打印SQL(开发环境)

项目创建POM依赖  <dependency><groupId>p6spy</groupId><artifactId>p6spy</artifactId><version>3.9.1</version> </dependency> YML配置 spring:datasource…

阅读更多...

silicon labs Gateway HOST-NCP MQTT网关搭建

silicon labs Gateway HOST-NCP MQTT网关搭建

一、背景目前正在开发一款中控网关，网关mcu跑Android系统，NCP采用EFR32MG21开发板，需要跑MQTT协议控制zigbee的网络。基于以上需求，下载了simplicity studio V5版本和最新的EmberZNet 7.2.0.0协议栈进行验证，发现新的GSDK已经不再支持MQTT功能，官方回答是EmberZNet 6.7…

阅读更多...

论文解读 - 城市自动驾驶车辆运动规划与控制技术综述 (第2部分)

论文解读 - 城市自动驾驶车辆运动规划与控制技术综述 (第2部分)

文章目录🚗 II. Overview of the decision-making hierarchy used in driverless cars（无人驾驶汽车的决策层综述）🔴 A. Route Planning（路径规划）🟠 B. Behavioral Decision Making&#xff08…

阅读更多...

论文工具大全+软件简介

论文工具大全+软件简介

文章目录**1.使用说明用哪个文库就打开，****2.在软件中复制粘贴网址点下载**3.点已下载文件右击鼠标另外保存**腾讯微云-https://share.weiyun.com/5U3fAjF**1.安装并上传论文点检测2.检测等待时间3.打开检测报告查看回复[文献]：参考文献自动生成器参考文…

阅读更多...

贪心算法专题

贪心算法专题

1.Acwing 1055. 股票买卖 II 题目链接：1055. 股票买卖 II - AcWing题库思路：逢涨就买 #include<iostream> using namespace std;int main() {int n;long long ans0;int a[100005];cin>>n;cin>>a[0];for(int i1;i<n;i){cin>&…

阅读更多...

C语言—动态内存管理

C语言—动态内存管理

专栏：C语言个人主页：HaiFan. 专栏简介：本专栏主要更新一些C语言的基础知识，也会实现一些小游戏和通讯录，学时管理系统之类的，有兴趣的朋友可以关注一下。动态内存管理前言一、为什么会存在动态内存分配二…

阅读更多...

磨金石教育分享||CG特效技术主要应用在哪几个领域

磨金石教育分享||CG特效技术主要应用在哪几个领域

前面我们介绍了很多关于CG特效的知识，我们知道CG特效发展的历史以及重大意义。那么我们今天再来详细讨论一下CG特效主要应用的几个领域。近几年文化艺术的发展伴随着互联网信息技术高速传播。文化艺术产业变得多元，动漫、3A大作游戏、商业大片、虚拟现实…

阅读更多...

Java 元注解

Java 元注解

元注解是负责对其它注解进行说明的注解，自定义注解时可以使用元注解。Java 5 定义了 4 个注解，分别是 Documented、Target、Retention 和 Inherited。Java 8 又增加了 Repeatable 和 Native 两个注解。这些注解都可以在 java.lang.annotation 包中找到…

阅读更多...

前端压缩图片为指定宽高

前端压缩图片为指定宽高

压缩图片原理通过原生的input标签拿到要上传的图片文件将图片文件转化成img元素标签在canvas上压缩绘制该HTMLImageElement将图片转化为一个包含图片展示的data URI，即图片被转换成base64编码的字符串实现通过原生的input标签拿到上传的图片文件 css部分<…

阅读更多...

Linux 通过监控监控系统内存并定时重启指定服务

Linux 通过监控监控系统内存并定时重启指定服务

一、使用Free命令监控系统内存 1.1 查看系统内存情况 free -m1.1.1 获取空闲物理内存 echo Mem-free: `free -m | grep Mem | awk {print $4}`M1.1.2 获取缓冲区内存

阅读更多...

php 安装curl扩展支持sftp协议

php 安装curl扩展支持sftp协议

原因：php默认安装的依赖的libcurl.so中不支持sftp 协议解决方法：先安装libssh2，curl安装时编译参数带–with-libssh2，这样可以支持sftp 一.编译安装libssh2-1.8.0 1.下载源码地址: https://github.com/libssh2/libssh2 2.编译…

阅读更多...

requests页面常用操作(post、put、get、head、patch、delete方法)

requests页面常用操作(post、put、get、head、patch、delete方法)

1 requests主要方法2 请求返回信息3 应用3.1 登录页面3.2 退出登录3.3 修改参数3.4 上传文件Requests 是一个 Python 的 HTTP 客户端库。每次调用 requests 请求之后，会返回一个 response 对象，该对象包含了具体的响应信息。可以通过requests模拟提交请求…

阅读更多...

蓝桥杯 stm32 实现 ADC 采集数据功能 CubeMX

蓝桥杯 stm32 实现 ADC 采集数据功能 CubeMX

文章内的代码使用 HAL 库。 ADC 即模数转换器，是指将连续变化的模拟信号转换成离散的数字信号的器件。文章目录前言一、ADC 原理图二、CubeMX 配置三、ADC 代码讲解总结前言一、ADC 原理图从原理图我们可以看到 STM32G431 内部集成两个最高位 12 位的 A…

阅读更多...

通信电子、嵌入式类面试题刷题计划03

通信电子、嵌入式类面试题刷题计划03

文章目录021——"Hello, world!"022——计算圆的面积023——打印10x10的星号024——字符串打印025——打印26个英文字母026——strlen函数的用法027——sizeof函数的使用028——if else、变量赋值语句029——if else语句030——if elseif else语句，判断是…

阅读更多...

数字IC设计、验证、FPGA笔试必会 - Verilog经典习题（七）求两个数的差值

数字IC设计、验证、FPGA笔试必会 - Verilog经典习题（七）求两个数的差值

数字IC设计、验证、FPGA笔试必会 - Verilog经典习题 （七）求两个数的差值 🔈声明： 😃博主主页：王_嘻嘻的CSDN博客 🧨未经作者允许，禁止转载 🔑系列专栏：牛客Ve…

阅读更多...

Redis作为缓存应用场景分析

Redis作为缓存应用场景分析

为什么使用缓存 Redis是一个内存型数据库，也就是说，所有的数据都会存在与内存中，基于Redis的高性能特性，我们将Redis用在缓存场景非常广泛。使用起来方便，响应也是远超关系型数据库。应用场景 Redis的应用场景非常…

阅读更多...

绝了，超越YOLOv7、v8,YOLOv6 v3.0正式发布

绝了，超越YOLOv7、v8,YOLOv6 v3.0正式发布

超越YOLOv7、v8! YOLOv6 v3.0正式发布!!! YOLOv6 全新版本v3.0正式发布！引入新的网络架构和训练方案，其中YOLOv6-S以484 FPS的速度达到45.0% AP，超过YOLOv5-S、YOLOv8-S，其代码刚刚开源由于前段时间Ultralytics公司透露出V8的发…

阅读更多...

马哥架构第2周课程作业

马哥架构第2周课程作业

haproxy、nginx、lvs负责均衡相关的话题一. nginx和haproxy的异同点二. 实现haproxy四层地址透传，并且做基于cookie的会话保持2.1 haproxy四层地址透传2.2 基于cookie的会话保持2.2.1 配置选项2.2.2 配置示例2.2.3 验证 Cookie 信息三. 实现自定义错误页面和https的…

阅读更多...

【学习笔记】【Pytorch】12.损失函数与反向传播

【学习笔记】【Pytorch】12.损失函数与反向传播

【学习笔记】【Pytorch】12.损失函数与反向传播一、损失函数的介绍1.L1Loss类的使用代码实现2.MSELoss类的使用3.损失函数在模型中的实现二、反向传播一、损失函数的介绍参考： 损失函数（loss function） pytorch loss-functions 文档作用&…

阅读更多...

【JavaEE】基于TCP的客户端服务器程序

【JavaEE】基于TCP的客户端服务器程序

✨哈喽，进来的小伙伴们，你们好耶！✨ 🛰️🛰️系列专栏:【JavaEE】 ✈️✈️本篇内容:基于TCP的客户端服务器程序。 🚀🚀代码存放仓库gitee：JavaEE初阶代码存放！ ⛵⛵作者…

阅读更多...

推荐文章

最新文章