【Python机器学习】回归任务、线性回归评价指标讲解及温度与花朵数线性回归实战(图文解释 附源码)

news2024/10/8 13:21:08

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

 与分簇、分类和标注任务不同,回归任务预测的不是有限的离散的标签值,而是无限的连续值。回归任务的目标是通过对训练样本的学习,得到从样本特征集到连续值之间的映射。如天气预测任务中,预测天气是冷还是热是分类问题,而预测精确的温度值则是回归问题。

一、回归任务

设样本集S={s_1,s_2,…,s_m}包含m个样本,样本s_i=(x_i,y_i)包括一个实例x_i和一个实数标签值y_i,实例由n维特征向量表示,即x_i=(x_i^(1),x_i^(2),…,x_i^(n))。 回归任务可分为学习过程和预测过程。

在学习过程,回归任务基于损失函数最小的思想,学习得到一个决策函数模型或神经网络模型。

决策函数回归模型要建立起合适的从实例特征向量到实数的映射函数Y=f(X),X是定义域,它是所有实例特征向量的集合,Y是值域R。

神经网络回归模型要利用一定的网络结构N,学习到能够正确体现从实例到标签的映射关系的网络参数W,即得到合适的网络模型N(S,W)。

记测试样本为x=(x^(1),x^(2),…,x^(n))。在预测过程,决策函数回归模型依据决策函数Y=f(X)给予测试样本x一个预测标签值y ̂;神经网络回归模型将x馈入已经训练好的网络N(S,W),从输出得到预测标签值y ̂。

回归常表现为用曲线或曲面(二维或高维)去逼近分布于空间中的各样本点,因此也称之为拟合。直线和平面可视为特殊的曲线和曲面。

二、线性回归与回归评价指标 

当用输入样本的特征的线性组合作为预测值时,就是线性回归(Linear Regression)。

记样本为s=(x,y),其中x为样本的实例,x=(x^(1),x^(2),…,x^(n)),x^(j)为实例x的第j维特征,也直接称为该样本的第j维特征,y为样本的标签,在回归问题中,y是一个无限的连续值。

定义一个包含n个实数变量的集合{w^(0),w^(1),w^(2),…,w^(n)},将样本的特征进行线性组合:

线性回归模型用向量表示为:

其中,x=(■8(x^(0)&■8(x^(1)&⋯)&x^(n)))^T为特征向量,并指定x^(0)=1,W=(w^(0) w^(1) … w^(n))为系数向量。向量W称为回归系数,负责调节各特征的权重,它就是要学习的知识。

线性回归是参数学习模型,因为它先假定了模型符合的决策函数,学习过程实际上求得该决策函数的最优参数值。

当只有1个特征时:

 

可看作是二维平面上的直线,此时x^(1)是直线的斜率,w^(0)是截距。

在二维平面上,让一条线去尽可能地贴近所有点,直接的想法是使所有点到该直线的距离和最小,使之最小的直线被认为是最“好”的。

 

距离l计算起来比较麻烦,一般采用更容易计算的残差s:

s_i=|y_i−f(x_i)|

式中,f(x)是拟采用的直线。容易理解,残差s与距离l之间存在等比例关系。因此,可以用所有点与该直线的残差和∑▒s_i代替距离和∑▒l_i作为衡量“贴近”程度的标准。

因为残差需要求绝对值,后续计算时比较麻烦,尤其是在一些需要求导的场合,因此常采用残差的平方作为衡量“贴近”程度的指标:

s_i^2=(y_i−y ̂_i)^2

残差称为绝对误差(Absolute Loss),残差平方称为误差平方(Squared Loss)。误差平方对后续计算比较方便,因此常采用所有点的误差平方和(Sum of Squared Error, SSE)作为损失函数来评价回归算法,该叫法与聚类的误差平方和损失函数相同。

还经常采用均方误差(Mean of Squared Error, MSE)作为损失函数,它是误差平方和除以样本总数。

线性回归中,不同的回归系数W确定了不同的线性模型,会带来不同的残差,因此,对于第i个样本来说,可将误差平方s_i^2记为s_i^2(W)。误差平方s_i^2(W)为实际值y_i与预测值f(x_i)之差的平方:

 因此,线性模型的求解,就是要求得使L(W)达到最小值时的W

三、线性回归温度与花朵数量实战

当温度处于15至40度之间时,数得某块草地上小花朵的数量和温度值的数据。现在要来找出这些数据中蕴含的规律,用来预测其它未测温度时的小花朵的数量。

线性回归拟合结果如下

 部分代码如下

import numpy as np
from sklearn.metrics import mean_squared_error
175]
new_tempera = [18, 22, 33]
 
from sklearn import linear_model
reg = linear_model.LinearRegression()
temps = np.array(temperatures).reshape(-1,1)
reg.fit (temps, flowers)
temps_pred = reg.predict(temps)
print('MSE: %.2f' % mean_squared_error(flowers, temps_pred))
print("W(0):", reg.intercept_, "   W(1):", reg.coef_)
>>>  MSE: 17.80
W(0): 114.39047619047619    W(1): [1.43428571]
 
new_temps = np.array(new_tempera).reshape(-1,1)
reg.predict(new_temps)
>>> array([140.20761905, 145.9447619 , 161.72190476])

创作不易 觉得有帮助请点赞关注收藏~~~ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/100022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ERC-3525 开发入门指南

ERC-3525 标准是以太坊社区批准通过的半匀质化通证(Semifungible Token, 亦称为半同质化通证,简称 SFT)标准,由 Solv Protocol 提出。ERC-3525 标准定义了一类新型的数字资产,具有以下突出优势:与 ERC-721 …

网曝某公司HR向求职者索要高考成绩!你们还记得自己的高考分数吗?

奇葩年年有,今年特别多,一位网友曝光:在应聘北京某公司的时候,HR竟然跟自己索要高考成绩!网友感叹,遇到过在学信网查本科学位的公司,但这种奇葩公司没见过。有人说,虽然问高考成绩确…

git status 查看仓库文件状态

1. 前言 2. 各种状态 3. -s 参数 4. --ignored 查看所有被忽略的文件 1. 前言 git status 命令用于查看当前 git 中的文件状态 这个命令会将工作区、暂存区、版本库中的文件状态输出到命令行界面 git status git status 命令是 git 中最常用的命令之一,当我们要执…

[附源码]计算机毕业设计Python-菜篮子系统(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

C++11标准模板(STL)- 算法(std::equal)

定义于头文件 <algorithm> 算法库提供大量用途的函数&#xff08;例如查找、排序、计数、操作&#xff09;&#xff0c;它们在元素范围上操作。注意范围定义为 [first, last) &#xff0c;其中 last 指代要查询或修改的最后元素的后一个元素。 确定两个元素集合是否是相…

手写Spring8(Aware感知容器变化)

文章目录目标设计思想项目结构一、实现1、定义标记接口2、容器感知类2.1、BeanFactoryAware2.2、BeanFactoryAware2.3、BeanNameAware2.4、ApplicationContextAware3、包装处理器(ApplicationContextAwareProcessor)4、注册 BeanPostProcessor5、感知调用操作二、测试1、事先准…

(附源码)springboo计算机专业大学生就业指南网 毕业设计 061355

计算机专业大学生就业指南网 摘 要 信息化社会内需要与之针对性的信息获取途径&#xff0c;但是途径的扩展基本上为人们所努力的方向&#xff0c;由于站在的角度存在偏差&#xff0c;人们经常能够获得不同类型信息&#xff0c;这也是技术最为难以攻克的课题。针对学生就业管理等…

Premiere Pro 快捷键大全(2023版)

说明&#xff1a;为避免篇幅过大&#xff0c;本文快捷键是基于 Windows 系统 Pr 2023 版本的。Mac系统下的快捷键可按以下方式进行对应&#xff1a;Ctrl→Command&#xff0c;Alt→Option。有不能对应的&#xff0c;本文会给出说明。◆ ◆ ◆媒体相关新建序列&#xff1a;Ctrl …

创建Series()对象--pandas

1. 函数功能 产生带有标签(索引)的一维数组&#xff0c;Series对象中的数据可以是任意类型&#xff08;整型、字符串、浮点型、python对象等&#xff09; 2. 函数语法 pandas.Series(dataNone, indexNone, dtypeNone, nameNone, copyFalse, fastpathFalse)3. 函数参数与示例…

猿如意初体验!赞一个。

目录 功能一&#xff1a;chatGPT 功能二、对 “效率工具”的试体验&#xff01; 功能三&#xff1a;教程文档 最后总结 猿如意传送门猿如意下载地址&#xff1a;猿如意-程序员的如意兵器,工具代码,一搜就有 猿如意使用了几次了&#xff0c;今天来想分享一下我对于猿如意的…

工程复现 -- SiamMOT

工程复现 – SiamMOT 先赞后看&#xff0c;养成好习惯&#xff0c;感谢您的理解与支持&#xff01; 参考&#xff1a; 1. siam-mot源码地址 2. SiamMOT 论文地址 3. SiamMOT 论文解析 简单介绍 SiamMOT&#xff08;SiamMOT: Siamese Multi-Object Tracking&#xff09;是…

微服务框架 SpringCloud微服务架构 服务异步通讯 53 MQ 集群 53.5 仲裁队列【SpringAMQP】

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式&#xff0c;系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 服务异步通讯 文章目录微服务框架服务异步通讯53 MQ 集群53.5 仲裁队列【SpringAMQP】53.5.1 仲裁队列53 MQ 集群 53.5 仲裁队列【SpringAM…

Jvm学习笔记

&#x1f3b6; 文章简介&#xff1a;Jvm学习笔记 &#x1f4a1; 创作目的&#xff1a;Jvm学习笔记 ☀️ 今日天气&#xff1a;天气很好 &#x1f4dd; 每日一言&#xff1a;乾坤琉璃色&#xff0c;碧宇凝清光。 文章目录类文件结构详解一 概述二 Class 文件结构总结2.1 魔数&am…

工程机械部件的大尺寸空间精度检测仪器

工程机械作为工程建设中的重要工具&#xff0c;施工过程中长期承受各种外力&#xff0c;因此对各结构件质量要求很高&#xff0c;检测十分严格&#xff0c;通常要求的公差在0.1mm&#xff5e;0.2mm以内。工程机械部件外形尺寸及重量通常较大&#xff0c;常规仪器无法有效满足检…

【Linux权限管理】

The secret of getting ahead is getting started. 目录 1 Linux权限的概念 2 文件访问者的分类&#xff08;人&#xff09; 3 文件类型和访问权限&#xff08;事物属性&#xff09; chmod chown: chgrp: 4 文件掩码 umask 5 目录的权限 6 粘滞位 7 权限的总结 1 Linu…

【瑕疵检测】瓶盖瑕疵检测【含Matlab源码 730期】

⛄一、简介 文中将图像预处理与边缘检测相结合对瓶盖瑕疵进行检测, 先使用直方图规定化的方法对图像做出修正与增强, 再利用中值滤波的方法消除图像孤立的噪声点;Canny算子快速分辨出瓶盖瑕疵, 再利用采用Otsu阈值方法求取自适应阈值自动选择并提取瑕疵。 1 图像预处理 在特征…

Mac 使用 brew 安装 mysql

最近需要用到 MySQL 来开发项目&#xff0c;所以在 Mac 配置了下 MySQL 的环境。 1、使用 brew install mysql 安装 MySQL 安装完毕后会有以下提示信息&#xff0c;告诉我们初始安装好后 root 账户没有密码&#xff0c;只需要输入 mysql -uroot就能连接运行MySQL。 那咱们输入 …

模板引擎:ftl文件生成word

wshanshi&#xff1a;总结记录…便于回顾… 一、什么是FreeMarker FreeMarker 是一个用 Java 语言编写的模板引擎&#xff0c;基于模板来生成文本输出。 FreeMarker的原理&#xff1a;模板数据模型输出&#xff0c;模板只负责数据在页面中的表现&#xff0c;不涉及任何的逻辑代…

设计模式之组合模式

Composite design pattern 组合模式的概念、组合模式的结构、组合模式的优缺点、组合模式的使用场景、组合模式的实现示例、组合模式的源码分析 1、组合模式的概念 组合模式&#xff0c;即部分整体模式&#xff0c;是用于把一组相似的对象当做一个单一个的对象。组合模式依据树…

C#语言实例源码系列-身份证验证

专栏分享点击跳转>Unity3D特效百例点击跳转>案例项目实战源码点击跳转>游戏脚本-辅助自动化点击跳转>Android控件全解手册 &#x1f449;关于作者 众所周知&#xff0c;人生是一个漫长的流程&#xff0c;不断克服困难&#xff0c;不断反思前进的过程。在这个过程中…