最小二乘法——参数估计过程推导

news2025/1/15 12:56:38

一 准备

        1 给定数据集 D={(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m})},其中假设X是一维的情况,即只有一个自变量

        2 线性回归学习的目标:f(x_{i})=wx_{i}+b,使得f(x_{i})\simeq y_{i}

        3 如何确定w和b?关键在于衡量f(x)和y之间距离的方法,此处使用的是‘均方误差’,其具有非常好的几何意义,对应了常用的欧几里得距离;公式如下:

                                MSE = \frac{1}{m}\sum_{i=1}^{m}(y_{i}-\bar{y})^{2}

            因此我们可以试图让均方误差最小化,即:

                                                    (\hat{w},\hat{b}) = arg min \sum_{i=1}^{m}(f(x_{i})-y_{i})^{2}= arg min \sum_{i=1}^{m}(y_{i}-wx_{i}-b)^{2}

        4 ‘最小二乘法’:基于“均方误差”来进行模型求解的方法;其试图找到一条直线,使所有样本到直线的欧氏距离之和最小。

        5 “线性回归模型的最小二乘参数估计”:求解w和b使E_{(w,b)} = \sum_{i=1}^{m}(y_{i}-wx_{i}-b)^{2}最小化的过程

        6 为简化公式,以下\sum_{i=1}^{m}均用\sum代替

        

二 估计过程

        1.最小化目标函数:

                E_{(w,b)} = \sum(y_{i}-wx_{i}-b)^{2}            (1)

        2.我们将E_{(w,b)}分别对w和b求导;

                1)首先化简等式

                        E_{(w,b)}=\sum(y_{i}-wx_{i}-b)^{2}

                                =\sum[x_{i}w+(y_{i}-b)]^{2}

                                =\sum(x_{i}^{2}w^{2}+(y_{i}-b)^{2}-2(y_{i}-b)x_{i}w))

                                =w^{2}\sum x_{i}^{2}+\sum(y_{i}-b)^{2}-w(\sum2(y_{i}-b)x_{i})

                2)对E_{(w,b)}=w^{2}\sum x_{i}^{2}+\sum(y_{i}-b)^{2}-w(\sum2(y_{i}-b)x_{i})求w的偏导

                       \frac{\theta E_{(w,b)}}{\theta w}=2(\sum x_{i}^{2})w-\sum 2(y_{i}-b)x_{i}

                                  =2(w\sum x_{i}^{2}-\sum (y_{i}-b)x_{i})

               3)对E_{(w,b)}=w^{2}\sum x_{i}^{2}+\sum (y_{i}-b)^{2}-w(\sum 2(y_{i}-b)x_{i})求b的偏导                                              先进一步化简等式:

                        E_{(w,b)}=w^{2}\sum x_{i}^{2}+\sum (y_{i}-b)^{2}-w(\sum 2(y_{i}-b)x_{i})

                                   =(\sum x_{i}^{2})w^{2}+\sum (y_{i}^{2}+b^{2}-2y_{i}b)-\sum 2y_{i}x_{i}w+\sum 2bx_{i}w

                                   =\sum x_{i}w^{2}+\sum y_{i}^{2}+\sum b^{2}-\sum 2y_{i}b-\sum 2y_{i}x_{i}w+\sum2b wx_{i}

                        再求偏导:

                        \frac{\theta E_{(w,b)}}{\theta b}=2mb-2\sum y_{i}+2\sum wx_{i}

                                    =2mb-2(\sum (y_{i}-wx_{i}))

                                    =2(mb-\sum (y_{i}-wx_{i}))

                4)整理上述两个偏导求取结果

                        \frac{\theta E_{(w,b)}}{\theta w}=2(w\sum x_{i}^{2}-\sum (y_{i}-b)x_{i})

                        \frac{\theta E_{(w,b)}}{\theta b}=2(mb-\sum (y_{i}-wx_{i}))

        3.另2中求得的两个偏导数结果为0可得w和b的最优闭式解

                1)首先令\frac{\theta E_{(w,b)}}{\theta b}=2(mb-\sum (y_{i}-wx_{i}))等于0

                     0=2(mb-\sum (y_{i}-wx_{i}))

                     0=mb-\sum (y_{i}-wx_{i})

                     mb=\sum (y_{i}-wx_{i})

                     b = \frac{\sum (y_{i}-wx_{i})}{m}

                 2) 再令\frac{\theta E_{(w,b)}}{\theta w}=2(w\sum x_{i}^{2}-\sum (y_{i}-b)x_{i})等于0

                      0=2(w\sum x_{i}^{2}-\sum (y_{i}-b)x_{i})

                      0=w\sum x_{i}^{2}-\sum (y_{i}-b)x_{i}

                     w\sum x_{i}^{2}=\sum (y_{i}-b)x_{i}

                     w\sum x_{i}^{2}=\sum (y_{i}x_{i})-b\sum (x_{i})

                     w\sum x_{i}^{2}=\sum (y_{i}x_{i})-(\frac{1}{m}\sum y_{i}-\bar{x}w)\sum (x_{i})    (代入b的表达式)

                     w\sum x_{i}^{2}=\sum (y_{i}x_{i})-\frac{1}{m}\sum y_{i}x_{i}+(\bar{x}\sum (x_{i})w

                     w\sum x_{i}^{2}-(\bar{x}\sum (x_{i}))w=\sum (y_{i}x_{i})-\sum y_{i}\bar{x}

                     w(\sum x_{i}^{2}-\bar{x}\sum x_{i})=\sum y_{i}(x_{i}-\bar{x})

                     w =\frac{\sum y_{i}(x_{i}-\bar{x})}{\sum x_{i}^{2}-\bar{x}\sum x_{i})}

                     w = \frac{\sum y_{i}(x_{i}-\bar{x})}{\sum x_{i}^{2}-\frac{1}{m}(\sum x_{i})^{2}}

                     (其中,\bar{x}=\frac{1}{m}\sum x_{i},为x的均值)

三 参考文献

机器学习 周志华 清华大学出版社 2016年1月第一版

                      

                        

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/922425.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

23款奔驰GLE450时尚型升级ACC自适应巡航系统,解放双脚缓解驾驶疲劳

有的时候你是否厌倦了不停的刹车、加油?是不是讨厌急刹车,为掌握不好车距而烦恼?如果是这样,那么就升级奔驰原厂ACC自适应式巡航控制系统,带排队自动辅助和行车距离警报功能,感受现代科技带给你的舒适安全和…

英特尔开始加码封装领域 | 百能云芯

在积极推进先进制程研发的同时,英特尔正在加大先进封装领域的投入。在这个背景下,该公司正在马来西亚槟城兴建一座全新的封装厂,以加强其在2.5D/3D封装布局领域的实力。据了解,英特尔计划到2025年前,将其最先进的3D Fo…

将公共组件提取到npm包中

多个前端项目中公共组件使用方案(npm包方式) - 简书

AMEYA360:大唐恩智浦电池管理芯片DNB1168-新能源汽车BMS系统的选择

DNB1168是一款全球独有的集成(EIS)交流阻抗谱监测功能的单电池监测芯片。该芯片通过车规级AEC-Q100和汽车行业最高功能安全等级ISO 26262:2018 ASIL-D双重认证。芯片?内部集成多种高精度电池参数监测,支持电压、温度、交流阻抗检…

error: can‘t find Rust compiler

操作系统 win11 pip install -r requirements.txt 报错如下 Using cached https://pypi.tuna.tsinghua.edu.cn/packages/56/fc/a3c13ded7b3057680c8ae95a9b6cc83e63657c38e0005c400a5d018a33a7/pyreadline3-3.4.1-py3-none-any.whl (95 kB) Building wheels for collected p…

python中两个可以美化表格数据输出结果的工具,很好用

目录标题 前言1.使用tabulate美化表格输出2.使用prettytable美化输出总结尾语 前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 在用python处理表格数据中,这其中的工作重点就是对表格类型的数据进行梳理、计算和展示,本文重点介绍展示这个方面的工作…

Redis怎么测试?

有些测试朋友来问我,redis要怎么测试?首先我们需要知道,redis是什么?它能做什么? redis是一个key-value类型的高速存储数据库。 redis常被用做:缓存、队列、发布订阅等。 所以,“redis要怎么…

基于PIC单片机篮球计分计时器

一、系统方案 本设计采用PIC单片机作为主控制器,矩阵键盘控制,比分,计时控制,24秒,液晶12864显示。 二、硬件设计 原理图如下: 三、单片机软件设计 1、首先是系统初始化 2、液晶显示程序 /*************…

2023年7月京东空气净化器行业品牌销售排行榜(京东运营数据分析)

随着科技发展,智能家具在日常生活中出现的频率越来越高,许多曾经不被关注的家电也出现在其中,包括近年来逐渐兴起的空气净化器。伴随人们对自身健康的重视度越来越高,作为能够杀灭空气污染物、有效提高空气清洁度的产品&#xff0…

【C/C++】继承的方式和优点

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c系列专栏&#xff1a;C/C零基础到精通 &#x1f525; 给大…

LDAP: error code 53 - unauthenticated bind (DN with no password) disallowed

这个错误提示显示Jenkins无法连接到LDAP服务器&#xff0c;原因是LDAP服务器不允许未认证的绑定&#xff08;DN与无密码&#xff09;。 但实际填写了DN

OLED透明屏报价:如何选择高性价比的产品

OLED透明屏作为一项创新的显示技术&#xff0c;其透明度和高清晰度的特点使其在各个领域得到了广泛应用。 然而&#xff0c;在购买OLED透明屏时&#xff0c;消费者往往会面临多样的报价和产品选择。本文将基于相关数据和报告&#xff0c;为您详细介绍OLED透明屏的报价因素&…

有序充电运营管理平台是基于物联网和大数据技术的充电设施管理系统-安科瑞黄安南

随着我国能源战略发展以及低碳行动的实施&#xff0c;电动汽车已逐步广泛应用&#xff0c;而电动汽车的应用非常符合当今社会对环保意识的要求&#xff0c;以及有效节省化石燃料的消耗。 由于其没有污染排放的优点以及政府部门的关注&#xff0c;电动汽车将成为以后出行的重要…

JavaWeb学习-Day10

SpringBootWeb案例 准备工作 开发流程&#xff1a; 开发接口步骤&#xff1a; 删除部门&#xff1a; 新增部门&#xff1a; 简化代码&#xff1a; limit:分页展示&#xff0c;公式&#xff1a;&#xff08;页数-1&#xff09;*页面总数&#xff0c;页面总数 目前出现的问题&am…

基于mysql5.7制作自定义的docker镜像,适用于xxl-job依赖的数据库,自动执行初始化脚本(ddl语句和dml语句)

一、背景 xxl-job-admin依赖mysql数据库&#xff0c;且需执行初始化脚本&#xff0c;包括ddl和dml语句。 具体的步骤总结如下&#xff1a; 1、新建数据库xxl_job2、创建mysql表table3、执行dml语句&#xff0c;包括新建admin用户及密码&#xff0c;创建执行器和任务。 毫无疑…

vue uniapp 同意验证码滑块验证

前言 &#xff08;vue-puzzle-vcode&#xff09; 发送验证码以及登录的时候会做验证&#xff0c;防止机刷等 效果图 一、安装依赖 npm install vue-puzzle-vcode --save二、使用步骤 1.html使用 <Vcode :show"isShow" success"onSuccess"/>2.j…

Abaqus建筑工程应用的10大特征

前后处理界面友好易用 • 界面支持中英文 • 建模和查看结果采用一致的操 作环境 • 模型树和结果树使操作更便捷 • 支持基于Python脚本的建模方式 有限元求解器性能卓越 • 单元类型全――超500种类型 单元适应各种工程对象 • 材料模型多――能够模拟金属、 混凝土、岩…

使用fastjson2的@JSONField注解解决日期格式记录

最近在做一个三方对接&#xff0c;对方的日期格式数据要求时间日期格式: yyyyMMddHHmmss或者 yyyyMMdd&#xff0c;我一下想起了fastjson2工具包&#xff0c;所以很愉快的解决了此问题。 依赖jar如下&#xff1a; <dependency><groupId>com.alibaba.fastjson2</…

全球Salesforce顾问薪资大揭秘!顾问如何升职加薪?

Salesforce顾问通过针对业务挑战提出、记录和分析需求&#xff0c;提供解决方案&#xff0c;从而帮助企业改善Salesforce的流程和效率。顾问是企业和Salesforce之间的桥梁。 Salesforce顾问的薪资一直是生态系统中的热门话题&#xff0c;备受求职者关注。本篇文章将分享提高顾…

OpenEuler华为欧拉系统安装

OpenEuler华为欧拉系统安装 一、OpenEuler简介1、OpenEuler概述2、OpenEuler特性 二、OpenEuler部署安装1、安装前配置2、安装引导3、选择语言4、安装信息摘要 三、欧拉系统安装图形化界面1、需要在超级管理员&#xff0c;在root权限下操作2、启动图形化界面 四、手动安装VMwar…