✨机器学习笔记(二)—— 线性回归、代价函数、梯度下降

news2024/9/22 19:36:16
Course1-Week1:
https://github.com/kaieye/2022-Machine-Learning-Specialization/tree/main/Supervised%20Machine%20Learning%20Regression%20and%20Classification/week1

1️⃣线性回归(linear regression)

f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b

🎈A linear regression model predicting house prices:

在这里插入图片描述

如图是机器学习通过监督学习运用线性回归模型来预测房价的例子,当房屋大小为1250 f e e t 2 feet^2 feet2时,预测的价格为 220k$。

在这里插入图片描述

🎈Terminology:
线性回归中可能用到的术语及含义
在这里插入图片描述

2️⃣代价函数(cost function)

为了预测出更准确的结果,需要模型更好的拟合程度,对于线性回归模型 f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b,我们需要找到合适的参数 w w w b b b,使得拟合程度最高。

在这里插入图片描述
🎉而如何找到合适的 w w w b b b 呢,这时需要通过代价函数(cost function)来进行衡量。我们希望对于每组数据,模型通过 x ( i ) x^{(i)} x(i) 预测出的 y ^ ( i ) \hat{y}^{(i)} y^(i) 接近真实的 y ( i ) y^{(i)} y(i) ,于是有如下的代价函数:

J = 1 2 m ∑ i = 1 m ( y ^ ( i ) − y ( i ) ) 2 J = \frac{1}{2m}\sum_{i=1}^{m}(\hat{y}^{(i)}-y^{(i)})^2 J=2m1i=1m(y^(i)y(i))2

J ( w , b ) = 1 2 m ∑ i = 1 m ( f w , b ( x ( i ) ) − y ( i ) ) 2 J(w,b)=\frac{1}{2m}\sum_{i=1}^{m}(f_{w,b}(x^{(i)})-y^{(i)})^2 J(w,b)=2m1i=1m(fw,b(x(i))y(i))2

✨现在的目标就变为 minimize w , b J ( w , b ) \underset{w, b}{\text{minimize}}J(w,b) w,bminimizeJ(w,b)


为了简单理解代价函数,让 b = 0 b=0 b=0 简化函数,针对 f ( x ) = w x f(x) = wx f(x)=wx 讨论。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

对所有的 w w w 取值最终可以列出一个代价函数:

在这里插入图片描述
可以看到当 w = 1 w=1 w=1 J ( w ) J(w) J(w) 最小,此时的 w w w 即为我们找到的最合适的参数。


当我们不再忽略 b b b ,来研究两个参数 w w w b b b 影响下的代价函数时,它的函数是一个三维图形,此时 J J J 的最小值在这个3D图形的底部:
在这里插入图片描述

假设我们拿一把小刀🔪去水平地给这样的三维图形砍一刀,去看这个横切面,大概可以得到这样的图形:
在这里插入图片描述

回归函数 f w , b f_{w,b} fw,b 和代价函数中的点的对应关系如下:
在这里插入图片描述

3️⃣梯度下降(gradient descent)

✨​ 用于求代价函数 J ( w , b ) J(w,b) J(w,b) 的最小值的方法, α \alpha α 为学习率(learning rate)。
w = w − α ∂ ∂ w J ( w , b ) w=w-\alpha\frac{\partial}{\partial w} J(w, b) w=wαwJ(w,b)

b = b − α ∂ ∂ b J ( w , b ) b=b-\alpha\frac{\partial}{\partial b} J(w, b) b=bαbJ(w,b)

对于一个三维的代价函数,想象成有个小人站在山上一个点,对于自己的360度的方向,需要选择一个方向迈出一步,确保这一步比其他各个方向下降的都要快,然后到达下一个点后以此类推,最终下降到最低点。
在这里插入图片描述
如果从不同的 ( w , b ) (w,b) (w,b) 作为起点,最后降低到的最低点不同,这些谷底被称为 local mininum(局部极小值)

🎉这个梯度下降的过程就是不断调整 w w w b b b 的过程:

在这里插入图片描述


学习率 α \alpha α
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2117498.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【深度学习讲解笔记】前言

小编为AI专业的本科学生,最近入手了一本《深度学习讲解》的书,由于封面画了苹果🍎,所以也叫苹果书,这本书目前在全网的热度很高。 本书是根据李宏毅老师讲授的《机器学习》课程编写的,作者是来自DataWhale…

SCI顶刊中“introduction”经典模板,建议收藏!

Introduction Introduction 的行文框架是一个从较宽泛的学术领域逐渐缩小到你的研究目标的过程。 1.研究背景和重要性 (Background AndImportance) • Mention of previous work on the subject • A statement of the importance of the subject 引言部分的第一段需要给出…

(Charles)如何抓取手机http的报文

抓包的目的: 发现bug需要定位要抓包 检查数据传输的安全性 接口测试遇到需求文档不全要抓包 抓包主要抓取的是http协议(https协议)的报文 http协议规范客户端和服务端的数据传输格式,是一个标准和规范 每个http连接包括请求消息和…

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用&…

CSP-J基础之数学基础 杨辉三角 一篇搞懂

文章目录 前言杨辉三角介绍杨辉三角的结构数学中的形式杨辉三角的性质 杨辉三角进行左对齐杨辉三角的递推公式编程实现杨辉三角总结 前言 杨辉三角是数学中一个非常有趣且重要的概念。它不仅在组合数学中扮演着重要角色,还在许多数学问题的解决中提供了有力的工具。…

【重学 MySQL】二十、运算符的优先级

【重学 MySQL】二十、运算符的优先级 MySQL 运算符的优先级(由高到低)注意事项示例 在 MySQL 中,运算符的优先级决定了在表达式中各个运算符被计算的先后顺序。了解运算符的优先级对于编写正确且高效的 SQL 语句至关重要。以下是根据高权威性…

Rust运算符

【图书介绍】《Rust编程与项目实战》-CSDN博客 《Rust编程与项目实战》(朱文伟,李建英)【摘要 书评 试读】- 京东图书 (jd.com) https://blog.csdn.net/brucexia/category_12779443.html 前面已经学习了变量和常量,本节开始对它们进行操作&#xff0c…

【IPV6从入门到起飞】5-1 IPV6+Home Assistant(搭建基本环境)

【IPV6从入门到起飞】5-1 IPV6Home Assistant #搭建基本环境 1 背景2 docker下载 hass3 创建容器4 浏览器访问 hass5 手机APP远程访问hass6 更多玩法 1 背景 既然电脑可以IPV6入站,手机流量可以访问IPV6网络的服务,为什么不在电脑搭建Home Assistant&am…

springboot体会BIO(阻塞式IO)

使用springboot体会阻塞式IO 大致的思路为: 创建一个socket服务端,监听socket通道,并打印出socket通道中的内容。 创建两个socket客户端,向socket服务端写入消息。 1.创建服务端 public class RedisServer {public static void m…

Linux服务器应急响应(上)

目录 介绍步骤 介绍 网页篡改,即攻击者故意篡改网络上传送的报文,通常以入侵系统并篡改数据、劫持网络连接或插入数据等形式进行。 网页篡改一般有明显式和隐藏式两种。明显式网页篡改指攻击者为炫耀自己的技术技巧,或表明自己的观点实施的网…

《深入浅出WPF》读书笔记.11Template机制(下)

《深入浅出WPF》读书笔记.11Template机制(下) 背景 本文主要讲datatemplate和contenttemplate的联合使用,以及style的解析。 《深入浅出WPF》读书笔记.11Template机制(下) 代码 两者的作用域范围 datatemplate和contenttemplate的关系 两者的应用 指定目标类型…

Qt常用控件——QPushButton

QPushButton介绍 QWidget中涉及到的各种属性、函数、使用方法,对于Qt的各种控件都是有效的 使用QPushButton表示一个按钮,继承自QAbstracButton,这个类是一个抽象类 抽象类:包含纯虚函数,无法实例化出对象,…

第四届长城杯部分wp

还是太菜了,要经常练了 1.BrickGame 通过游戏就可以得到flag 2.SQLUP 一道文件上传的题目,在登陆页面我用admin和1登陆成功了,但是按照正常的应该是要爆破,用bp爆破得到下面的页面 登陆成功后,点击头像就可以进行文…

前端 PDF 预览技巧:标签 vs 插件,如何优雅地展示 PDF 文件

前言 pdf 作为一种常用的文档格式,相信很多同学都在项目中遇到过需要预览 pdf 文件的情况。其实实现的方式有很多,包括传统的标签 iframe 或 embed 方式,也可以运用一些插件,例如 pdf.js、vue-pdf 等等,本文将带大家一…

FastJson、Jackson、Gson、Hutool,JSON解析哪家强?JMH基准测试来排行

首发公众号:【赵侠客】 引言 在前面《释放你九成的带宽和内存:GZIP在解决Redis大Key方面的应用》一文中我使用GZIP算法对JSON格式数据进行了压缩,可以减小88%的空间,文中也提到了目前JSON格式在我们项目中应用的非常广泛几乎无处不在。压缩J…

整合Redis和RedisCacheManger

整合redis springboot在现在的版本中操作Redis数据库用到了lettuce,而不是Jedis,他们各有各的特点。Jedis以Redis命令作为方法名称,学习成本低,简单实用。但是Jedis实例是线程不安全的,多线程环境下需要基于连接池来使…

Java实现一个简单的本地群聊。可以多开Client。

网络编程也有趣的,Java中有对系统网络IO操作的封装包:Socket。现在我们在本地电脑(网络)用它来模拟一个简单的群聊功能,以便能更好地对网络编程进行深刻的理解。 "Client"去连接"Host",可同时多有…

JavaEE 第23节 TCP的流量控制与阻塞控制详解

目录 前言(必读)1、滑动窗口背景运行机制 2. 流量控制作用实现机制关键目标 3. 拥塞控制作用实现机制作用 4. 流量控制和拥塞控制的区别作用对象不同触发条件不同控制方式不同 5.总结 前言(必读) 流量控制(Flow Contr…

中科院院士薛其坤:通用量子计算机还得10-20年

说到量子计算机,很多人都抱有不切实际的幻想,甚至认为它无所不能,很快就能取代现有的电子计算机,但事实上,目前的量子计算机只能高效解决特定问题,不具备通用性。在2024年浦江创新论坛上,2023年…

linux日志备份

什么是日志文件?为什么要设立日志文件? 1、日志文件是用来记录事务对数据库的更新操作的文件。2、设立日志文件的目的是: 进行事务故障恢复;进行系统故障恢复;协助后备副本进行介质故障恢复。 但是,随着时间,日志文件内存过于增加,将会导…