机器学习-线性回归(简单回归、多元回归)

news2025/4/4 1:41:17

这一篇文章,我们主要来理解一下,什么是线性回归中的简单回归和多元回归,顺便掌握一下特征向量的概念。

一、简单回归

简单回归线性回归的一种最基本形式,它用于研究**一个自变量(输入)与一个因变量(输出)**之间的线性关系。其数学表达形式为:

y= wx + b

其中:

  • y:因变量(输出),即我们要预测的目标值
  • x:自变量(输入),即影响因变量的已知因素
  • w(权重/斜率):表示自变量对因变量的影响程度
  • b(偏置/截距):表示当 x = 0 时,y 的取值

通俗举例 1:通过身高预测体重

假设我们想要建立一个简单的模型,根据一个人的身高来预测体重,我们有以下数据:

身高(cm)体重(kg)
15050
16060
17070
18080

建模思路:

  • 设身高 x,体重 y,假设两者之间有一个线性关系 y=wx+b。
  • 通过拟合这些数据,模型可能会得到类似的方程: 体重=0.5×身高−25, 在这里:
    • w=0.5(表示每增加 1 cm 身高,体重约增加 0.5 kg)
    • b=−25(表示身高为 0 时的理论体重,但在实际场景中无意义,仅为模型参数)

预测:
如果一个人的身高是 175 cm,则模型预测体重为:

y=0.5×175−25=62.5kg

通俗举例 2:学习时间与考试分数

假设我们想要研究学习时间(小时)对考试分数的影响,收集了一些数据:

学习时间(小时)考试分数(分)
150
255
365
470

建模思路:
我们尝试建立一个简单回归模型来预测分数:

考试分数=10×学习时间+45

在这里:

  • 斜率 w=10(表示每增加 1 小时学习时间,分数提高 10 分)
  • 截距 b=45(表示即使不学习,可能的最低分数是 45 分)

预测:
如果某人学习 5 小时,预测的考试分数为:

10×5+45=95

简单回归的特点

  1. 只涉及一个自变量(单输入)
  2. 假设变量之间是线性关系(如果关系复杂,可能需要更高级的回归方法)
  3. 易于解释和计算(适合初学者理解和使用)

简单回归的应用场景

  • 通过温度预测冰淇淋销量
  • 通过广告支出预测销售额
  • 通过年龄预测血压

二、多元回归

什么是多元回归?

多元回归(Multiple Linear Regression, MLR) 是线性回归的一种扩展,它用于研究**多个自变量(输入)一个因变量(输出)**之间的关系。简单来说,它是一种能同时考虑多个影响因素的回归模型。

多元回归的数学公式:

其中:

  • y:因变量(输出)
  • x1,x2,...,xn:自变量(输入特征)
  • w1,w2,...,wn:各特征的权重(回归系数),衡量每个特征对结果的影响程度
  • b:偏置项(截距),表示所有输入特征为 0 时的输出值

通俗举例 1:房价预测

假设我们想要预测一套房子的价格,影响房价的因素有:

面积(㎡)房龄(年)离市中心距离(km)价格(万元)
10053200
120105180
8022220
1501510150

在这里,我们可以建立一个多元回归模型:

通俗举例 2:学生考试成绩预测

假设某个学生的考试成绩可能受到上课时长、作业完成情况、睡眠时间等因素的影响,我们收集到以下数据:

上课时长(小时)作业完成率(%)睡眠时间(小时)考试成绩(分)
1090885
870670
1295990
650560

建立回归模型:

多元回归的特点

  1. 同时考虑多个因素,适合更复杂的现实场景
  2. 线性关系假设,适用于数据中存在一定的线性相关性
  3. 解释性强,可以分析每个变量对结果的贡献

多元回归的应用场景

  • 市场营销:影响销售额的因素可能包括广告投放、产品价格、品牌影响力等
  • 医学研究:预测患者的疾病风险,考虑年龄、体重、血压、运动习惯等
  • 商业分析:评估员工绩效,考虑工作时长、项目数量、经验等

三、特征向量

如何简单理解特征向量?

通俗来说,特征向量(Feature Vector) 就是用一组数字来描述一个对象的“特征”。在机器学习中,我们用特征向量来表示数据,使得计算机能够处理和学习这些数据的模式。

简单例子 1:水果分类

假设你要训练一个模型来识别不同的水果,比如苹果、橘子、香蕉。我们可以用以下特征来描述水果:

  • 重量(克)
  • 颜色(红色=1,橙色=2,黄色=3)
  • 大小(直径 cm)

如果你拿到一个水果,它的特征如下:

  • 重量:150 克
  • 颜色:1(红色,代表苹果)
  • 大小:8 cm

那么,这个水果可以表示成一个特征向量:

[150,1,8]

同样,橘子和香蕉的特征可能分别是:

[120,2,7](橘子)

[130,3,9](香蕉)

这些特征向量可以作为机器学习模型的输入,让模型学习如何区分不同的水果。

简单例子 2:学生成绩分析

假设你想分析学生的表现,考虑以下特征:

  • 上课时长(小时)
  • 作业完成率(%)
  • 考试成绩(分)

学生 A:

[10, 90, 85]

学生 B:

[8,70,78]

这些数据可以组成特征向量,让我们对学生的学习情况进行分析和预测。

特征向量的特点

  1. 数值化:将现实世界的特征转换为计算机可处理的数值形式。
  2. 多维度:可以同时包含多个属性,描述一个对象的多个方面。
  3. 通用性:适用于分类、回归、聚类等各种机器学习任务。

总结

特征向量就是用一组数字来表示事物的特征,它帮助计算机更好地理解和分析数据。你可以把它想象成一个“数据快照”,每个维度(数值)代表事物的一个属性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2281249.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智能体的核心技能之插件,插件详解和实例 ,扣子免费系列教程(11)

欢迎来到滔滔讲AI,今天我们来学习智能体的核心功能点之一的插件。 插件是通过API连接集成各种平台和服务,它扩展了智能体的能力。平台内置了丰富的插件,我们可以直接调用。 一、什么是插件 首先,插件其实就像一个工具箱。 每个插…

Spring Security(maven项目) 3.0.2.6版本—总

通过实践而发现真理,又通过实践而证实真理和发展真理。从感性认识而能动地发展到理性认识,又从理性认识而能动地指导革命实践,改造主观世界和客观世界。实践、认识、再实践、再认识,这种形式,循环往复以至无穷&#xf…

超强推理大模型 QVQ-32B-preview 一键部署

QwQ-32B-Preview 是 Qwen 团队于 2024 年开发的实验研究模型,专注于提高 AI 推理能力。这个模型在多个基准测试中展现了卓越的性能,特别是在 GPQA、AIME、MATH-500 和 LiveCodeBench 等测试中,准确率分别达到了 65.2%、50.0%、90.6% 和 50.0%…

数据结构(Java)——二叉树

1.概念 二叉树是一种树形数据结构,其中每个节点最多有两个子节点,通常被称为左子节点和右子节点。二叉树可以是空的(即没有节点),或者由一个根节点以及零个或多个左子树和右子树组成,其中左子树和右子树也分…

谷粒商城——商品服务-三级分类

1.商品服务-三级分类 1.1三级分类介绍 1.2查询三级分类查询-递归树型结构数据获取 1.2.1导入数据pms_catelog.sql到数据表pms_category 1.2.2一次性查出所有分类及子分类 1.2.2.1修改CategoryController.java /*** 查出所有分类以及子分类,以树形结构组装起来*/R…

AviatorScript用法

AviatorScript的介绍,网上有很多,这里就不啰嗦了。这里介绍下传参的用法 应用场景:如果不想频繁的打包升级,而是想只更新某些规则脚本重启服务就可以升级的话,AviatorScript无疑是最佳选择。比如说,今天制…

云计算和服务器

一、云计算概述 ICT是世界电信协会在2001年的全球性会议上提出的综合性概念,ICT分为IT和CT,IT(information technology)信息技术,负责对数据生命周期的管理;CT(communication technology),负责数据的传输管理。 CT技术…

论文:深度可分离神经网络存内计算处理芯片

引言:SRAM - CIM芯片在处理深度可分离神经网络时面临的挑战 深度可分离卷积(Depthwise separable convolution, DSC)由逐深度卷积(DW)和逐点卷积(PW)组成,逐深度卷积用于提取空间特征&#xff…

代码随想录刷题day14(1)|(链表篇)142.环形链表 II

目录 一、链表理论基础 二、环形链表思路 1.如何判断有环? 2.如何找出环的入口? 3.其他疑问 三、相关算法题目 四、总结 一、链表理论基础 代码随想录 (programmercarl.com) 二、环形链表思路 1.如何判断有环? 使用快慢指针法&…

运算放大器应用电路设计笔记(六)

6.1输出失调电压发生的原因与计算 6.1.1用噪声增益进行评价 若运算放大器两个输入端接地,则理想运放输出为零,但实际的运放输出不为零,有一定的直流输出电压。这种直流电压称为输出失调电压。发生的原因是,运算放大器内部元件尤…

openresty(nginx)+lua+kafka实现日志搜集系统

今天我们来实现一下快捷的nginx日志搜集系统,主讲的是nginx服务里面的openresty的日志搜集。采用的手段是采用lua做中间桥梁。 一、安装openresty 具体安装步骤在这里《centos7 二进制安装openresty》 二、安装kafka 1、安装Java及配置Java 具体安装步骤在这里《采…

PortSwigger靶场练习---网页 LLM 攻击:间接提示注入

网页 LLM 攻击: Indirect prompt injection 间接提示注入 PortSwigger靶场地址: Dashboard | Web Security Academy - PortSwigger 题目: 官方提示: 发现攻击面 点击实时聊天以访问实验室的聊天功能。 询问LLM它有权访问哪些 AP…

【2024.12】西电英语听说雨课堂期末考试答案

前言 这次的英语听说1和2雨课堂期末是同一张卷子。 26-40为填空题,后面有些话太长了 37. when they are physicial active 38. people could need two times as much water as others do 39. why people have the idea that good health requires eight…

人声检测原理VAD

在机器人的研究中,机器人与人语音交互是一个重要的功能,在语音交互中,人声检测至关重要。不论是在手机中,还是在esp32芯片上,都需要一种简单快捷的方式来检测本地语音,滤掉杂音和噪音。 机器人启动后会一直…

2_高并发内存池_各层级的框架设计及ThreadCache(线程缓存)申请内存设计

一、高并发内存池框架设计 高并发池框架设计,特别是针对内存池的设计,需要充分考虑多线程环境下: 性能问题锁竞争问题内存碎片问题 高并发内存池的整体框架设计旨在提高内存的申请和释放效率,减少锁竞争和内存碎片。 高并发内存…

后端开发基础——JavaWeb(Servlet)

Servlet 关于系统架构 系统架构包括什么形式? C/S架构 B/S架构 C/S架构? Client / Server(客户端 / 服务器) C/S架构的软件或者说系统有哪些呢? QQ(先去腾讯官网下载一个QQ软件,几十MB&…

c++ 与 Matlab 程序的数据比对

文章目录 背景环境数据保存数据加载 背景 ***避免数据精度误差&#xff0c;快速对比变量 *** 环境 c下载 https://github.com/BlueBrain/HighFive 以及hdf5库 在vs 中配置库 数据保存 #include <highfive/highfive.hpp> using namespace HighFive;std::string fil…

Leecode刷题C语言之收集所有金币可获得的最大积分

执行结果:通过 执行用时和内存消耗如下&#xff1a; int dfs(int node, int parent, int f, int* coins, int k, int **children, int *childCount, int **memo) {if (memo[node][f] ! -1) {return memo[node][f];}int res0 (coins[node] >> f) - k;int res1 coins[no…

mybatis(57/134)

今天没什么想法&#xff0c;搭了个转账平台&#xff0c;加深了点之前javaweb的mvc架构的印象&#xff0c;还有异常的抛出处理等

ONNX 简介

ONNX &#xff08;Open Neural Network Exchange&#xff09;是一套表示深度神经网络模型的开放格式&#xff0c;由微软和 Facebook 于 2017 推出&#xff0c;然后迅速得到了各大厂商和框架的支持。目前&#xff0c;在数家机构的共同维护下&#xff0c;ONNX 已经对接了多种深度…