简单线性线性回归

news2025/4/4 18:52:49

文章目录

brief
直线回归的一般形式
- 参数计算
- y观测值和回归值的关系
- 基本前提假定
- 假设检验
- - 直线回归的变异来源
  - 自由度问题：
  - 假设检验
多元线性回归

brief

当研究两个有因果关系的变量时，我们希望建立一个方程式表示两者的关系，这样有一个变量得知时可以推测另一个变量。回归分析通常是一个好方法。
研究一因一果的回归分析称为一元回归分析，又分为直线回归和曲线回归。
研究多因一果的回归分析称为多元回归分析，又分为直线多元回归和多元曲线回归。
当然他还有很多变种：
在这里插入图片描述

这里主要记录了一元直线回归分析的学习记录，包括前提假设，数学方程式，评价拟合有度，假设检验，模型应用。最后会把直线回归扩展到多元直线回归的应用上。

直线回归的一般形式

Y = a + bx

Y 是响应变量的回归值
x 是自变量的观测值
a 是方程式的截距项，对应着x为0时Y的回归值
b 称为回归系数，表示x变动一个单位Y相应的会变动几个单位

研究回归关系时，自变量x的每一个取值x_i 都有一个正态分布的y总体与之对应，而不是一个确定的y_i 与之对应。（或者说当x = x_i 时，y_i 的平均数 Y 与之对应。）

参数计算

对于参数a，b一般根据最小二乘法进行估算,最终使得 RSS = min( sum( (y_i - Y)²) ) 最小，
观测值y和回归值Y的残差平方和（ RSS）等于 sum( (y_i - Y)²)。

具体推导过程此处省略，推导结果如下：
在这里插入图片描述
x的离均差与y的离均差乘积之和 sum[( x - mean(x)) (y - mean(y))] 记为SP
x的离均差的平方和sum[(x - mean(x))²] 记作 SS_x

y观测值和回归值的关系

在这里插入图片描述

基本前提假定

正态性：第一是指，对于固定的因变量x，都有一个正态总体Y与之对应；第二是指，观测值y包含有误差部分，误差是随机且正态分布的。
独立性：y的观测值相互独立
线性：自变量和响应变量之间呈线性
同方差性：响应变量的方差不随自变量的水平变化而不同。
自变量x是没有误差的固定项，或者至少和观测y比起来，x的误差小到可以忽略不记。这一点在实际应用中常常被放宽。
如果是多元线性回归，自变量应该非共线性(不相关)

假设检验

直线回归的变异来源

在这里插入图片描述

观测值y是一个随机变量，y的总变异y - mean(y) 可以分解为两部分，第一部分是自变量x变异引起的变异回归值Y - mean(y),第二部分是误差所引起的变异 y - Y。

所以观测值 y和回归值 Y的总变异可以写成：
在这里插入图片描述
其中：

最终有：

上式左边，sum[ (y - mean(y))² ] 为观测y的离均差平方和，表示随机变量y的总变异，记作SS_y。
sum[ (Y - mean(y))² ] 为x变异引起的y变异的总平方和，称作回归平方和，记作SS_回归或者U。
sum[ (y - Y)² ] 为误差引起的y变异的总平方和，称为残差平方和，记为SS_离回归或者Q。
SS_回归越大说明回归效果越好，因为x可以解释y的变异。但是记住回归效果好不等于模型好。

自由度问题：

这里有待进一步探究，，我有点没想明白这个自由度的问题。

在这里插入图片描述

假设检验

F检验
参考单因素方差分析相关章节。
这里我是这样理解的，U相当于X解释的方差部分，Q相当于误差能解释的方差部分，如果U和Q来自同一个正态总体，是不是说明U和Q没有显著差别，那也就是X能解释的方差和误差能解释的方差没有区别，所以线性方程Y = a + bx不是显著性能解释y的方程。

在这里插入图片描述

在这里插入图片描述

多元线性回归

多元也就是多个自变量x。

模型形式：在这里插入图片描述

参数估计也是使得残差值的平方和 RSS = min( sum( (yi - Y)2) ) 最小估算而来。

前提假设以及方程的显著性检验和回归系数显著性的检验同上。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/540408.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

公司里的5种人，建议马上开除

公司里的5种人，建议马上开除

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID：jishulingdaoli) 多年前，马云在某期湖畔大学开学演讲时，说了一句经典名言：“小公司的成败在于你聘请什么样的人，大公司的成败在于你开除什么样的人。”K哥觉得&#xff0…

阅读更多...

Ocean Optics USB2000光谱仪无法在Win10/8系统运行

Ocean Optics USB2000光谱仪无法在Win10/8系统运行

1、问题描述 USB2000型光谱仪，由于生产年代过于久远，虽然能被Win10系统识别，但是驱动程序安装完成后依然报错， 提示：该设备无法启动。（代码 10） 请求USB BOS 描述符失败。运行SpectraSuite软件…

阅读更多...

操作系统原理 —— 什么是信号量，信号量如何实现进程互斥、进程同步？（十五）

操作系统原理 —— 什么是信号量，信号量如何实现进程互斥、进程同步？（十五）

在之前的章节中，我们提到了进程互斥，以及进程互斥实现的几种方式，那么今天我们再来讲解一种，基于信号量来实现进程之间的同步、互斥的方式。用户进程可以通过使用操作性提供的一对原语来对信号量进行操作，从而很方…

阅读更多...

C语言基础知识：C语言中的指针

C语言基础知识：C语言中的指针

目录 1、为什么需要指针? 2、指针是什么？ 3、指针与变量的关系 4、指针的分类 5、指针的用法 6、指针的运算 7、野指针 8、指针使用时的注意事项同C语言中其他变量一样，把指针也可以看成是一种变量。不过，这种变量专门存储地址值。…

阅读更多...

vscode链接远程服务器开发c++项目

vscode链接远程服务器开发c++项目

因为要在linux环境下开发c应用，需要一个比较好用的远程工具。之前做深度学习的时候一直用vscode链接服务器写python，感觉用起来很舒服。 vscode下载安装这些就略过了，从插件安装和配置文件开始介绍参考文章：https://zhuanlan.zh…

阅读更多...

如何做一份精致的性能测试报告？

如何做一份精致的性能测试报告？

相比于普通的功能测试，性能测试对测试工程师的技能要求更高，一般来说，也只有中高级测试工程师才会有机会做性能测试。对于题主关心的问题，我拆分出下面三个部分来做解答： 1、性能测试报告的目的 2、性能测试过程中的关…

阅读更多...

【算法分析与设计报告】快递终端送货配送系统、基因序列比较、地图染色、文章查重系统、果园篱笆问题（附源码）

【算法分析与设计报告】快递终端送货配送系统、基因序列比较、地图染色、文章查重系统、果园篱笆问题（附源码）

一、快递终端送货分配问题问题描述假设某快递终端投递站，服务n个小区，小区与快递点之间有道路相连，如下图，边上的权值表示距离。图1-1 小区快递点图现在设有m包裹，每个包裹都有自己的目的地及总量。假设送货员一…

阅读更多...

IPB072N15N3G-ASEMI代理英飞凌高压MOS管IPB072N15N3G

IPB072N15N3G-ASEMI代理英飞凌高压MOS管IPB072N15N3G

编辑：ll IPB072N15N3G-ASEMI代理英飞凌高压MOS管IPB072N15N3G 型号：IPB072N15N3G 品牌：英飞凌封装：TO-263 最大漏源电流：31A 漏源击穿电压：600V RDS（ON）Max：99mΩ…

阅读更多...

第四届“中国法研杯”司法人工智能挑战赛-刑期预测赛道三等奖方案

第四届“中国法研杯”司法人工智能挑战赛-刑期预测赛道三等奖方案

一、前言本文将回顾第四届“中国法研杯”司法人工智能挑战赛-刑期预测算法赛道比赛。使用多任务预训练、然后进行微调的形式最终在比赛中取得了三等奖的成绩。二、任务介绍主办方在第一届“中国法研杯”比赛上提出了刑期预测任务，本届将针对往届刑期预测准确率…

阅读更多...

《终身成长》笔记六——称赞努力的过程，也将其与结果关联

《终身成长》笔记六——称赞努力的过程，也将其与结果关联

目录经典摘录成为好父母好老师成长型思维模式的真伪第一种错误理解：很多人将他们身上某些他们喜欢的优点称作“成长型思维模式” 第二种错误理解：很多人认为成长型思维模式只关乎努力，特别是去夸奖别人的努力第三种错误理解&#xff…

阅读更多...

基于树莓派4B的智能家居

基于树莓派4B的智能家居

基于树莓派4B的智能家居前言C语言的简单工厂模式工厂模式介绍类和对象工厂模式的优缺点优点缺点智能家居框架产品工厂卫生间灯设备二楼灯设备餐厅灯设备客厅灯设备泳池灯设备风扇设备锁设备警报器设备地震监测设备火灾监测设备温湿度检测设备指令工厂语音控制设备server控制…

阅读更多...

如何创建样本手册？

如何创建样本手册？

第一步：提前研究和规划首先明确目标客户群体在其中扮演的角色。谁会穿你的衣服？您品牌的潜在客户是谁？他们的愿望是什么？他们会被什么打动？设置客户角色至关重要，因为它将决定样本手册的基调&#xff0…

阅读更多...

Simulink 自动代码生成电机控制：模型仿真速度的优化

Simulink 自动代码生成电机控制：模型仿真速度的优化

目录方法一 Simulationmode 方法二多核并行方法三 Performance Advisor 总结方法一 Simulationmode 执行下面的指令获取Simulink仿真实时，这里以霍尔FOC的模型为例，在切换模式为Accelerator时不能使用调用子模型的形式，需要把子模型复制…

阅读更多...

map的forEach区别

map的forEach区别

map的forEach区别先总结下： map和forEach区别是： 1.map有返回值而且必须return返回一个数组才行 ; 而forEach没有返回值可直接打印结果； 即：forEach()方法不会返回执行结果，而是undefined。也就是说，forEa…

阅读更多...

vue 在线聊天实战范例（含选择发送表情、图片、视频、音频，自定义右键快捷菜单，一键复制，左右聊天气泡）

vue 在线聊天实战范例（含选择发送表情、图片、视频、音频，自定义右键快捷菜单，一键复制，左右聊天气泡）

最终效果完整代码 index.vue <template><div class"page"><div class"leftBox"><h1>访客</h1><div class"chatBox"><div class"chatRecordBox"><div v-for"(item, index) in cha…

阅读更多...

DBCO-COOH分子量：305.3,CAS:1353016-70-2,二苯基环辛炔-羧基；类似有DBCO-NH2、SH、MAL、NHS等等

DBCO-COOH分子量：305.3,CAS:1353016-70-2,二苯基环辛炔-羧基；类似有DBCO-NH2、SH、MAL、NHS等等

中文名称：二苯基环辛炔-羧基英文名称：DBCO-acid 英文别称：DBCO-COOH cas: 1353016-70-2 分子式：C19H15NO3 分子量：305.3 DBCO-COOH是DBCO 衍生化的常用构件，在EDC、DCC和HATU等活化剂存在下&#xf…

阅读更多...

linux kernel menuconfig kconfig makefile

linux kernel menuconfig kconfig makefile

概述 menuconfig是Linux平台用于管理代码工程、模块及功能的实用工具。 menuconfig的使用方式通常是在编译系统之前在系统源代码根目录下执行make menuconfig命令从而打开一个图形化配置界面，再通过对各项的值按需配置从而达到影响系统编译结果的目的。 Nuttx的me…

阅读更多...

Spring Boot 数据库操作Druid和HikariDataSource

Spring Boot 数据库操作Druid和HikariDataSource

目录 Spring Boot 数据库操作应用实例-需求创建测试数据库和表进行数据库开发， 在pom.xml 引入data-jdbc starter 参考官方文档需要在pom.xml 指定导入数据库驱动在application.yml 配置操作数据源的信息创建bean\Furn.java 测试结果整合Druid 到…

阅读更多...

六、easyUI中的window（窗口）组件

六、easyUI中的window（窗口）组件

1.window（窗口）组件的概述窗口控件是一个浮动和可拖拽的面板，它可以用作应用程序窗口。默认情况下，窗口可以移动，调整大小和关闭。它的内容也可以被定义为静态HTML或要么通过Ajax动态加载 2.window（窗口&…

阅读更多...

MySQL-备份+日志：介质故障与数据库恢复

MySQL-备份+日志：介质故障与数据库恢复

MySQL-备份日志：介质故障与数据库恢复第1关：备份与恢复任务描述相关知识MySQL的恢复机制MySQL的备份与恢复工具编程要求代码参考第2关备份日志：介质故障的发生与数据库的恢复任务描述相关知识编程要求测试说明代码参考第1关：备…

阅读更多...

推荐文章

最新文章