机器学习——线性回归、梯度下降

news2025/1/12 10:54:37

文章目录

    • 一、机器学习的分类
    • 二、线型回归Linear regression(单变量线性回归)
    • 三、代价函数
      • 3.1 建模误差
      • 3.2 平方误差代价函数 Squared error cost function
      • 3.3 梯度下降
      • 3.4 梯度下降与线性回归相结合

一、机器学习的分类

  • 监督学习:学习数据带有标签
  • 无监督学习:没有任何的标签,或者有相同的标签
  • 其他:强化学习、推荐系统等

二、线型回归Linear regression(单变量线性回归)

还是房价预测的例子, 训练集如下:
在这里插入图片描述
定义各个变量的含义如下:

  • m——代表训练集中实例的数量
  • x——代表特征/输入变量
  • y——代表目标变量/输出变量
  • (x,y)——代表训练集中的实例
  • (x(i),y(i))——代表第 i 个观察实例:其中x(i) 代表第i个输入变量, y(i)代表第i个目标变量
  • h——代表学习算法的解决方案或函数,也称为假设(hypothesis)

h 根据输入的 x 值来得出 y 值, y 值对应房子的价。因此, h 是一个从x 到 y 的函数映射,h 的一种可能的表达方式如下。因为只含有一个特征/输入变量,这样的问题叫作单变量线性回归问题
在这里插入图片描述

三、代价函数

线性回归算法优化的目标是:选取最有可能与数据相拟合的直线
数据与直线的误差,称为建模误差 modeling error
为了使建模误差最小,我们需要调整参数θ0 和 θ1,使得代价函数Cost function:J(θ0, θ1) 的值最小。

在各种代价函数中,最常用的是平方误差代价函数 Squared error cost function

3.1 建模误差

因为 h 是一次方程,它对应两个模型参数(parameters) θ0 和 θ1,选取不同的参数 θ0 和 θ1,产生的 h 不同,最终的直线也不同。
参数决定了直线相对于训练集的准确程度,模型所预测值 与 训练集实际值 之间的差距(下图中蓝线所指)就是 建模误差(modeling error)
在这里插入图片描述
  调整参数 θ0 和 θ1目标:使建模误差的平方和最小

3.2 平方误差代价函数 Squared error cost function

示例一:
在这里插入图片描述
  左边是假设函数(此例θ0=0,直线过原点),不同的θ1代表着不同的拟合情况。
  右边是代价函数,不同的θ1代表着不同的代价,对于平方误差代价函数,计算公式为:
在这里插入图片描述
  当 θ1 取1时,J(θ1) = 0 , 此时 J(θ1) 最小,处于曲线最低点,是我们想要的结果

示例二:
  当 θ0 和 θ1 都发生变化时,代价函数 J(θ0 , θ1) 在三维空间中图形如下:
在这里插入图片描述
  因为三维图像看起来太复杂, 将它投射到二维平面。引入等高线contour plot ,等高线上的点,对应的代价函数 J(θ0 , θ1) 取值相同
在这里插入图片描述
  上图取值位于三维图形的最低点,在二维图形上位于等高线的中心。对应的假设函数 h(x) 直线如左图。虽然拟合数据有一些误差(蓝色竖线),但是已经很接近最小值了。

3.3 梯度下降

梯度下降算法对 θ赋值, 使得 J(θ)按梯度下降最快方向进行, 一直迭代下去, 最终得到局部最小值,即收敛 convergence,如图:
在这里插入图片描述
在这里插入图片描述

梯度下降算法不只用于线性回归, 可以用来最小化任何代价函数 J。公式如下:
在这里插入图片描述
(1)梯度下降的更新规则
  取红点的切线,即这条红色直线。
  由于曲线右侧斜率为正,导数为正。 因此,θ1 减去一个正数乘以 α,值变小。
  曲线左侧斜率为负,导数为负。 因此,θ1 减去一个负数乘以 α,值变大。
在这里插入图片描述
(2)学习率 ɑ 的选择
  如果 α 太小,只能小碎步下降,需要很多步才能到达全局最低点,很慢。
  如果 α 太大,那么算法可能会越过最低点。一次次越过最低点,离它越来越远。会导致无法收敛, 甚至发散。
  在这里插入图片描述
(3)不调整学习速率 α 也能收敛
  梯度下降一步后, 新的导数会变小,移动的幅度会自动变小。直到最终移动幅度非常小时,已经收敛到局部极小值。
在这里插入图片描述

3.4 梯度下降与线性回归相结合

将平方误差函数 h(x), 结合梯度下降法, 以及平方代价函数J(Θ),得出第一个机器学习算法, 即线性回归Linear Regression对之前的线性回归问题运用梯度下降法,关键在于求出代价函数的导数
在这里插入图片描述
  j 分别取 0 和 1 时,其导数如下:
在这里插入图片描述
  将上面两个导数带入梯度下降算法中,替代原来的在这里插入图片描述 。梯度下降算法变为:
在这里插入图片描述
虽然梯度下降一般易受局部最小值影响 susceptible to local minima,但我们在线性回归中提出的优化问题只有一个全局最优解,而没有其他局部最优解,代价函数是凸二次函数。因此,梯度下降总是收敛到全局最小值(假设学习率α不是太大)

高等线性代数中有一种计算代价函数 J 最小值的数值解法,不需要梯度下降这种迭代算法,也能解出代价函数 J 的最小值,这是另一种称为正规方程 (normal equations) 的方法。实际上在数据量较大的情况下,梯度下降法比正规方程要更适用一些

笔记参考:https://www.cnblogs.com/maxiaodoubao/p/9857874.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608218.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生成模型之高斯判别分析(GDA)和贝叶斯

生成模型与判别模型的区别 判别模型的学习算法学习给定x下的条件分布p(y|x; θ), 例如,Logistic Regression(对数几率回归)将p(y|x; θ)建模为,g是sigmoid函数。 考虑一个分类问题,基于动物的某些特征想…

电商数据监测:如何获取想要的电商平台数据?

随着电商行业的发展,越来越多的企业开始通过电商平台销售商品。为了更好地掌握市场信息和消费者需求,企业需要获取电商平台上的数据。这些数据可以帮助企业制定营销策略、优化产品设计和提高竞争力。本文将介绍如何使用电商API获取想要的电商平台数据。 …

数据库的增删改查(一)

1、CRUD *注释:在SQL中可以使用"--空格描述"来表示注释说明 *CRUD即增加(Create)、查询(Retrieve)、更新(Update)、删除(Delete)四个单词的首字母缩写 2、新增(Create) 语法: insert [into] table_name [(column[,column] ...)…

【红队靶场】暗月五月考核靶场sunday

红队靶场 🎉B站配套视频:【顺手挂个三连呗】 https://www.bilibili.com/video/BV1xu4y1Z71y/?share_sourcecopy_web&vd_source0e30e09a4adf6f81c3038fa266588eff🔥系列专栏:红队靶场 🎉欢迎关注🔎点赞…

【MySql】ProxySQL

文章目录 ProxySQL运行机制ProxySQL安装ProxySQL的Admin管理接口和admin管理接口相关的变量admin-admin_credentialsadmin-stats_credentialsadmin-mysql_ifaces 读写分离环境信息部署步骤 负载均衡连接池自动摘除宕机的DB动态加载配置访问控制查询缓存ProxySQL 集群来源 Proxy…

送礼物 dfs 双向dfs 剪枝 java

🍑 送礼物 达达帮翰翰给女生送礼物,翰翰一共准备了 N N N 个礼物,其中第 i i i 个礼物的重量是 KaTeX parse error: Undefined control sequence: \[ at position 2: G\̲[̲i\]。 达达的力气很大,他一次可以搬动重量之和不超…

有效的括号——力扣20

题目描述 思路 1.判断括号的有效性可以使用「栈」这一数据结构来解决 2.遍历给定的字符串 s。当遇到一个左括号时,我们会期望在后续的遍历中,有一个相同类型的右括号将其闭合。由于后遇到的左括号要先闭合,因此我们可以将这个左括号放入栈顶。…

2.项目中的文件

项目的路径是这样的 目录 1 pages 1.1 json 1.2 wxml 1.3 wxss 1.4 js 2 utils 3 .eslintrc.js 4 app.js 5 app.json 6 app.wxss 7 project.config.json 8 project.private.config.json 9 sitemap.json 1 pages pages 用来存放所有小程序的页面&am…

数据结构与算法基础(青岛大学-王卓)(4)

第四弹啊,栈和队列终于叮叮咚咚看完了,小龙虾呀鳝鱼汤啊倍儿香~~~~,配合本文食用更香 😃 文章目录 栈和队列栈队列案列的引入栈的表示和操作栈的抽象数据类型定义顺序栈顺序栈的表示顺序栈的初始化顺序栈基本操作顺序栈的入栈顺序…

基于Python的接口自动化-JSON模块的操作

目录 引言 一、JSON是啥? 二、JSON的有效数据类型 三、Python JSON库的使用 结语 引言 在使用Python进行接口自动化测试脚本时,一般都是脚本只写接口测试逻辑实现,而执行脚本时需要的测试用例数据都是写入excel、数据库或者指定的配置文…

入门编程指南:如何从零开始学习编程?

一、自学编程需要注意什么? 自学编程需要注意以下几点: 选择适合自己的编程语言,在学习初期建议选择易入手的编程语言。需要不断地练习,并建立自己的编程项目,以此提高编程技巧和应用能力。追求知识的全面性&#xf…

实验二十二、压控电压源二阶带通滤波器的参数选择

一、题目 如图1所示电路中,已知 R 51 k Ω R51\,\textrm kΩ R51kΩ, R 3 20 k Ω R_320\,\textrm kΩ R3​20kΩ; f 0 1 kHz f_01\,\textrm{kHz} f0​1kHz。利用 Multisim 分析下列问题: (1)选取合适…

[图表]pyecharts-K线图

[图表]pyecharts-K线图 先来看代码: import requests from typing import List, Unionfrom pyecharts import options as opts from pyecharts.charts import Kline, Line, Bar, Griddef get_data():response requests.get(url"https://echarts.apache.org/…

攻击者使用 Python 编译的字节码来逃避检测

以 PyPI(Python 包索引)等开源包存储库为目标的攻击者设计了一种新技术,可以将他们的恶意代码隐藏在安全扫描器、人工审查和其他形式的安全分析中。 在一次事件中,研究人员发现恶意软件代码隐藏在 Python 字节码 (PYC) 文件中&am…

Scala学习(十二)---模式匹配

文章目录 1.基本语法2.模式守卫3.匹配常量和类型4.匹配对象和样例类4.1 匹配对象4.2 匹配样例类 5.偏函数中的模式匹配 1.基本语法 在Scala中的模式匹配类似于Java中的switch语法 //模式匹配基本语法val a10val b20val c""c match {case "" >println(…

VScode远程连接虚拟机(ubuntu系统)

文章目录 1. Windows端安装VScode2. 安装远程登录插件3. 配置Remote-SSH插件关于关闭后如何打开该配置文件 4. 测试ubuntu与windows可否ping通5. 在Ubuntu中安装 SSH1.检查是否安装ssh-server2.安装openssh-server3.查看ssh服务是否启动4.Ubuntu中配置openssh-server开机自动启…

路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码

路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码 文章目录 路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要:本文主要介绍利用智能优化…

6.4下周黄金最新行情走势分析及开盘交易策略

近期有哪些消息面影响黄金走势?下周黄金多空该如何研判? ​黄金消息面解析:周五(6月2日),美市尾盘,现货黄金收报1947.82美元/盎司,大幅下跌29.70美元或1.50%,日内最高触及1983.43美元/盎司&…

chatgpt赋能python:Python升序排序

Python升序排序 Python是一种非常强大的编程语言,它在数学计算、数据处理等方面具备很强的优势。在实际应用中,我们经常需要对一系列数据进行排序。而在Python中,升序排序是非常常见的操作。本篇文章将介绍在Python中如何使用ifelse进行升序…

JavaWeb13(ajax01 AJAX介绍AJAX登陆AJAX加入购物车AJAX修改购物车商品数量)

目录 一. 什么是ajax 二.为什么需要AJAX? 三. 同步和异步的区别. 四.基于jQuery实现AJAX语法 4.1 语法1-$.ajax(url,[settings]). 4.1 语法2-$.get/post(url, [data], [callback], [type]). 五 .案例 5.1 ajax实现登录 ①html代码 用户登录 用户名: 密码…