吴恩达机器学习笔记：第 10 周-17大规模机器学习(Large Scale Machine Learning)17.1-17.2

吴恩达机器学习笔记：第 10 周-17大规模机器学习(Large Scale Machine Learning)17.1-17.2

news2026/2/15 15:57:39

目录

第 10 周 17、大规模机器学习(Large Scale Machine Learning)
- 17.1 大型数据集的学习
- 17.2 随机梯度下降法

第 10 周 17、大规模机器学习(Large Scale Machine Learning)

17.1 大型数据集的学习

如果我们有一个低方差的模型，增加数据集的规模可以帮助你获得更好的结果。我们应该怎样应对一个有 100 万条记录的训练集？

以线性回归模型为例，每一次梯度下降迭代，我们都需要计算训练集的误差的平方和，如果我们的学习算法需要有 20 次迭代，这便已经是非常大的计算代价。

首先应该做的事是去检查一个这么大规模的训练集是否真的必要，也许我们只用 1000个训练集也能获得较好的效果，我们可以绘制学习曲线来帮助判断。

在这里插入图片描述

17.2 随机梯度下降法

如果我们一定需要一个大规模的训练集，我们可以尝试使用随机梯度下降法（SGD）来代替批量梯度下降法。

在随机梯度下降法中，我们定义代价函数为一个单一训练实例的代价：
$(x^{(i)}, y^{(i)})) =\frac{1}{2}(h_θ(x^{(i)}) − y^{(i)})^2$
随机梯度下降算法为：首先对训练集随机“洗牌”，然后：

Repeat (usually anywhere between1-10){
for i = 1: m{
θ: = $θ_j − α(h_θ(x^{(i)}) − y^{(i)})x_j^{(i)}$
(for 𝑗 = 0: 𝑛)
}
}

随机梯度下降算法在每一次计算之后便更新参数 𝜃 ，而不需要首先将所有的训练集求和，在梯度下降算法还没有完成一次迭代时，随机梯度下降算法便已经走出了很远。但是这样的算法存在的问题是，不是每一步都是朝着”正确”的方向迈出的。因此算法虽然会逐渐走向全局最小值的位置，但是可能无法站到那个最小值的那一点，而是在最小值点附近徘徊。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1671036.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

8种常见的CMD命令

8种常见的CMD命令

1.怎么打开CMD窗口步骤1：winr 步骤2：在弹出的窗口输入cmd，然后点击确认，就会出现一个cmd的窗口 2.CMD的8种常见命令 2.1盘符名称冒号说明：切换盘的路径打开CMD窗口这里默认的是C盘的Users的27823路径底下&#xf…

阅读更多...

生产制造行业推拉式生产的复合应用

生产制造行业推拉式生产的复合应用

一、案例分析（汽配行业） 重点： 1. MTO/MTS 与 PUSH/PULL 有关系但是不是充分关系 2. MTO/MTS 是公司经营策略，更多是对市场需求的经营策略，体现在生产时机上的不同，一个是等客户需求，一个是填…

阅读更多...

程序员健康指南：运动，让代码更流畅

程序员健康指南：运动，让代码更流畅

程序员健康指南：运动，让代码更流畅程序员，一个与电脑相伴的群体，长时间的久坐和高强度的脑力劳动是他们的日常。然而，久坐不仅影响体态，更对心脏健康构成威胁。根据《欧洲心脏杂志》的研究，中…

阅读更多...

Caddy2使用阿里云DNS申请https证书，利用阿里云DNS境内外不同解析给Gone文档做一个同域名的国内镜像站点

Caddy2使用阿里云DNS申请https证书，利用阿里云DNS境内外不同解析给Gone文档做一个同域名的国内镜像站点

我从头到尾实现了一个Golang的依赖注入框架，并且集成了gin、xorm、redis、cron、消息中间件等功能；自己觉得还挺好用的，并且打算长期维护！ github地址：https://github.com/gone-io/gone 文档原地址：https:/…

阅读更多...

MTATLAB--一元线性回归分析

MTATLAB--一元线性回归分析

一文让你彻底搞懂最小二乘法（超详细推导） 在进行一元线性回归分析时，使用最小二乘法进行解题，关于最小二乘法具体看上述文章。数据文件在文章顶部可见，将第一列数据作为自变量x，第二列数据作为应变量y。建…

阅读更多...

使用java远程提交flink任务到yarn集群

使用java远程提交flink任务到yarn集群

使用java远程提交flink任务到yarn集群背景由于业务需要，使用命令行的方式提交flink任务比较麻烦，要么将后端任务部署到大数据集群，要么弄一个提交机，感觉都不是很离线。经过一些调研，发现可以实现远程的任务发布。…

阅读更多...

【RabbitMQ】消息队列 - RabbitMQ的使用记录

【RabbitMQ】消息队列 - RabbitMQ的使用记录

目录一、什么是消息队列二、什么是RabbitMQ 三、安装RabbitMQ 3.1 安装Erlang环境 3.2 安装RabbitMQ 3.3 打开服务管理界面 3.4 常用命令四、Python示例代码 4.1 发送数据 4.2 接收数据一、什么是消息队列消息队列(Message Queue)是一种用于在应用程序之间传递消…

阅读更多...

vue：网页icon无法显示

logo文件放在public文件夹下，在html里设置icon。本地源码运行后发现网页icon无法显示我们设置的logo，而是显示了浏览器默认icon。这个问题不需要解决，部署后网页icon显示就正常了。

阅读更多...

绝地求生PUBG新老艾伦格有什么差别老艾伦格什么时候回归

绝地求生PUBG新老艾伦格有什么差别老艾伦格什么时候回归

复古风格的艾伦格原始地图携带着那些标志性的记忆符号华丽回归，邀请您沉浸于往昔的每一处细节探索中。我们不仅还原了游戏诞生的起点，还在其中巧妙融入现代游戏元素，构筑一座连接昔日与今朝的桥梁，完美融合了经典与创新的游戏体验…

阅读更多...

【动态规划四】子序列问题

【动态规划四】子序列问题

目录 leetcode题目一、最长递增子序列二、摆动序列三、最长递增子序列的个数四、最长数对链五、最长定差子序列六、最长的斐波那契子序列的长度七、最长等差数列八、等差数列划分 II leetcode题目一、最长递增子序列 300. 最长递增子序列 - 力扣&#xff0…

阅读更多...

关于SQL

关于SQL

数据库简介： 数据库分类关系型数据库模型： 优点：易于维护，可以实现复杂的查询缺点：海量数据读取写入性能差，高并发下数据库的io是瓶颈是把复杂的数据结构归结为简单的二元关系（即二维表…

阅读更多...

Linux字符设备驱动设计

Linux字符设备驱动设计

Linux字符设备驱动设计概述驱动的定义与功能计算机系统中存在着大量的设备， 操作系统要求能够控制和管理这些硬件， 而驱动就是帮助操作系统完成这个任务。驱动相当于硬件的接口， 它直接操作、控制着我们的硬件， 操作系统通…

阅读更多...

工作太闲，平常有没有用手机能赚钱的，这里我推荐了4种可月入2000的副业

工作太闲，平常有没有用手机能赚钱的，这里我推荐了4种可月入2000的副业

确实有许多通过手机赚钱的方式，以下是一些常见的方法 1.拍照卖图如果你有一台相机或智能手机，喜欢拍照，那么可以将自己拍摄的图片上传到网站上，赚取稿费。 2. 做问卷调查许多公司需要了解消费者的意见，所以会通过…

阅读更多...

【XSRP软件无线电】基于软件无线电平台的QPSK频带通信系统设计

【XSRP软件无线电】基于软件无线电平台的QPSK频带通信系统设计

目录： 目录： 一、绪论 1.1 设计背景 1.2 设计目的二、系统总体方案 2.1 专题调研题目 2.2 调研背景 2.3 设计任务解读 2.4 设计原理 2.4.1 原理框图 2.4.2 功能验证三、软件设计 3.1 程序解读 3.2 程序设计 3.3 仿真结果： 四、程序代码分析…

阅读更多...

爬取深圳2024年链家二手房数据，共3000条数据（其他城市也可）

爬取深圳2024年链家二手房数据，共3000条数据（其他城市也可）

文章目录专栏导读1.目标2.导入相关库3.获取每个二手房的链接4.获取每个链接中的相关数据5.保存数据6.数据展示专栏导读 ✍ 作者简介：i阿极，CSDN 数据分析领域优质创作者，专注于分享python数据分析领域知识。 ✍ 本文录入于《python网络爬虫…

阅读更多...

二叉树OJ刷题

二叉树OJ刷题

制作不易，三连支持一下吧！！！ 文章目录前言一、相同的树二、单值二叉树三.对称二叉树四.二叉树的前序遍历五.另一棵树的子树六.二叉树遍历总结前言前三篇博客我们详细介绍了树形结构，及两种特殊的树：堆和…

阅读更多...

【Ubuntu永久授权串口设备读取权限“/dev/ttyUSB0”】

【Ubuntu永久授权串口设备读取权限“/dev/ttyUSB0”】

Ubuntu永久授权串口设备读取权限 1 问题描述2 解决方案2.1 查看ttyUSB0权限，拥有者是root，所属用户组为dialout2.2 查看dialout用户组成员，如图所示，普通用户y不在dialout组中2.3 将普通用户y加入dialout组中2.4 再次查看dialout用…

阅读更多...

云原生新手和开源教育分论坛 02-技术 or 非技术，参与 Kubernetes 社区丝滑路径【开源贡献】

云原生新手和开源教育分论坛 02-技术 or 非技术，参与 Kubernetes 社区丝滑路径【开源贡献】

https://www.kubernetes.dev/https://www.kubernetes.dev/community/community-groups/https://killercoda.com/https://kwok.sigs.k8s.io/https://training.linuxfoundation.cn/ 演讲

阅读更多...

pywinauto，一款Win自动化利器！

pywinauto，一款Win自动化利器！

pywinauto，一款Win自动化利器！ 1.安装 pywinauto是一个用于自动化Python模块，适合Windows系统的软件（GUI），可以通过Pywinauto遍历窗口（对话框）和窗口里的控件，也可以控…

阅读更多...

NeurIPS‘24 截稿日期逼近加拿大温哥华邀你共赴盛会

NeurIPS‘24 截稿日期逼近加拿大温哥华邀你共赴盛会

会议之眼快讯第38届NeurIPS24(Conference and Workshop on Neural Information Processing Systems)即神经信息处理系统研讨会将于 2024 年 12月9日-15日在加拿大温哥华会议中心举行！ NeurIPS 每一年都是全球AI领域的一场盛宴，吸引着来自世界各地的顶…

阅读更多...

推荐文章

最新文章