吴恩达机器学习WEEK1

news2024/12/28 22:47:03

COURSE 1 WEEK 1

机器学习的应用

当我们有一个目标,不知道如何显示地写出来一个程序时,例如自动驾驶等,这时候就需要制定某些规则,让计算机自己去学习,即机器学习

机器学习就是沿用人脑学习的过程,逐步对目标进行认知、学习

机器学习的定义

Arthur Samuel将机器学习定义为使计算机无需明确编程即可完成学习的研究领域

一般而言,给机器越多的训练,其最后表现得效果就会越好

机器学习主要分为:

  • 监督学习,实际应用中使用最多的算法模型
  • 无监督学习

监督学习

监督学习是指学习从 x x x y y y,即从输入到输出映射的算法,关键是人为提供学习算法实例以供学习,即我们的数据集,根据我们提供的数据,使得机器尽可能准确(与数据相符)的获得一个输出,从而用来预测

一些领域的应用:
在这里插入图片描述

在这些程序中,我们首先使用输入事例 x x x 和正确答案 y y y 来训练模型,在模型通过这些数据中学习之后,他们可以采用全新的输入 x x x ,并尝试产生对应的适当的输出 y y y

Learns from being given “right answers”

在监督学习中,又可以分为:

  • 回归,从无限多的可能数字中预测数字,例如房价的预测

  • 分类,输出的值是一组有限的集合,且输出不必是数字,例如乳腺癌肿瘤分类。

    分类算法的学习任务就相当于是找到不同类别的分界线,用于做分类
    在这里插入图片描述

在分类中,输出是一组离散的、有限可能的输出

在回归中,输出是无限多可能的数字

无监督学习

无监督学习中,给定的数据与任何输出标签 y y y 无关,即例如乳腺癌预测,只给出了患者年龄和肿瘤块大小,但我们不知道是否患有肿瘤,即没有任何标签
在这里插入图片描述

因此,如上图中,无监督学习的任务就是找到数据的集群,即哪些数据聚集在一起,例如经常使用的聚类算法

就像推荐系统,在阅读文章时,通常会有推荐阅读,这就是无监督算法,他通过我们阅读的文章中的关键词,进行搜索,把关键词相同的文章进行聚类,从而形成推荐阅读

总的来说,聚类算法就是获取没有标签的数据并尝试自动将他们分组到集群中

无监督学习类型:

  • 聚类算法
  • 异常检测
  • 降维,将大数据压缩成一个小得多的数据集,同时丢失尽可能少的信息

线性回归模型

模型介绍

线性回归是监督学习中一个重要的模型,其具体做法是利用一条直线来拟合我们当前的数据,例如房价预测

在这里插入图片描述

常用术语

  • 输入 x x xfeature,即特征
  • 输出 y y ytarget,即目标
  • 训练样本的总数 m m m
  • ( x ( i ) , y ( i ) ) (x^{(i)},y^{(i)}) (x(i),y(i)) 代表这是第 i 个训练示例

整体过程:
在这里插入图片描述

  • 首先定义训练集,即training set,其中包括特征与目标
  • 然后设置学习算法,模型通过这个算法去进行学习
  • 最终得到一个函数f,称为我们的模型
  • 通过输入一些值,并且定义他的大小,得到预测值

关键:模型函数f的定义

由于我们是线性模型,因此,在这里定义模型为:
f w , b ( x ) = w x + b f_{w, b}(x) = wx + b fw,b(x)=wx+b
这是一个关于 x x x 的函数,输出为 y ^ \hat y y^,并且通过学习合适的参数 w 、 b w、b wb 来使预测值足够准确

损失函数

损失函数能够告诉我们模型的运行情况,以便我们可以尝试让他做得更好

在我们的模型中, w 、 b w、b wb 称为参数,即 parameters

当参数不同时,我们的模型就会不同,最终的预测结果也就不同

在这里插入图片描述

因此,对于我们的线性回归模型,就是要找到最合适的一组参数,使得我们的预测值尽量准确,尽量的的接近训练示例

因此,为了表示准确程度,我们需要设置损失函数,来表示我们模型的直线与训练数据的匹配程度

误差项err
( y ^ ( i ) − y ( i ) ) (\hat y^{(i)} - y^{(i)}) (y^(i)y(i))
损失函数cost function
J ( w , b ) = 1 2 m ∑ i = 1 m ( y ^ ( i ) − y ( i ) ) 2 = 1 2 m ∑ i = 1 m ( f w , b ( x ( i ) ) − y ( i ) ) 2 J(w,b) = \frac{1}{2m}\sum_{i=1}^{m}(\hat y^{(i)} - y^{(i)})^2 = \frac{1}{2m}\sum_{i=1}^{m}(f_{w, b}(x^{(i)}) - y^{(i)})^2 J(w,b)=2m1i=1m(y^(i)y(i))2=2m1i=1m(fw,b(x(i))y(i))2
即,平方误差损失函数

最前面除以2是为了后续的计算中表达更简洁

因此,最终我们的目标是通过训练来更新参数的值,使得损失函数最小,即
min ⁡ w , b = J ( w , b ) \mathop{\min}\limits_{w,b} =J(w,b) w,bmin=J(w,b)
为了简化操作方便可视化,这里去掉参数 b b b,把误差函数作为 J ( w ) J(w) J(w),通过选取不同的参数 w w w,误差函数曲线如下所示:

在这里插入图片描述

梯度下降

梯度下降算法是通过对损失函数求解梯度计算,找到损失函数最小时对应的参数的值

一般而言,我们并不需要关注参数的初始值,因此一般在算法初始阶段会将参数设置为 0

梯度下降算法的整体流程就相当于下山的过程,当我们想要迅速下山至山谷时,每一次都要朝着一个方向迈出一小步,为了尽快下山,每一步的方向应该是当前山坡中最陡的方向
在这里插入图片描述

其中,下山的方向就是我们的梯度,迈出的步伐大小就是学习率

同时,由于初始点的选取不同,我们可能会下山到不同的山谷,即对应了各种局部最优解

梯度下降算法公式

w = w − α ∂ ∂ w J ( w , b ) b = b − α ∂ ∂ b J ( w , b ) w = w - \alpha \frac{\partial}{\partial w}J(w,b) \\ b = b - \alpha \frac{\partial}{\partial b}J(w,b) w=wαwJ(w,b)b=bαbJ(w,b)

其中, α \alpha α 是学习率

注意:

在执行梯度下降算法计算梯度时,上述两个梯度的计算是同时的,即损失函数 J ( w , b ) J(w,b) J(w,b)中的值是相同的,且两个参数的更新是同时的,这样做的目的是能够确保是在源点寻找到最陡的地方

在这里插入图片描述

学习率的选取

当学习率选择较小时,意味着我们下山时每一步的步长比较小,需要较多次数才能到达山谷,虽然最终会得到正确的答案,但需要耗费较长的时间
在这里插入图片描述

当学习率比较大时,意味着我们下山时每一步的步长比较大,可能会加速我们下山的过程,但由于步长较大,因此会错过山谷,即结果不会收敛到最小值点
在这里插入图片描述

但是,使用梯度下降算法时,经常遇到的一个问题是陷入局部最优解,此时该点的梯度值为 0,参数不能更新

因此,通常,在使用梯度下降算法时,我们通常会对学习率做自适应的变化,即随着迭代次数的增加,学习率逐步减小:

  • 在算法的初步阶段,学习率较大,提高全局搜索能力,使得参数快速收敛到最优值附近
  • 在算法的结尾阶段,学习率较小,提高局部搜索能力,使得参数精确收敛到精确值的位置

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1972073.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

目录文件;链接文件;函数stat/lstat

1.目录文件的操作: 1. mkdir int mkdir(const char *pathname, mode_t mode); 功能: 创建目录 参数: pathname:目录文件的路径 mode:目录文件的权限 返回值: …

6581 Number Triangle

这个问题可以通过动态规划来解决。我们可以从三角形的顶部开始,然后逐行向下计算每个位置的最大和。对于三角形中的每个位置,我们可以选择从其上方或左上方的位置移动到该位置,所以该位置的最大和就是其上方或左上方位置的最大和加上该位置的…

动态规划---观察优化枚举(股票系列问题)

121. 买卖股票的最佳时机 - 力扣&#xff08;LeetCode&#xff09; public class Code01_Stock1 {public static int maxProfit(int[] prices) {int ans 0;for (int i 1, min prices[0]; i < prices.length; i) {// min : 0...i范围上的最小值min Math.min(min, prices…

Android图像显示SurfaceFlinger总结

1 介绍 1.1 框架中位置 ​​ 上图为Android的图形显示系统框架图。 首先上层应用通过ViewRoot的scheduleTraversals函数发起绘制任务&#xff0c;并通过HWUI调用OpenGL接口将绘制数据传递给GPU处理&#xff1b;SF会接收所有应用更新的绘制数据&#xff0c;并根据Z-Order、透明…

实现一个自定义前端脚手架

一、背景 什么前端脚手架&#xff1f; 前端脚手架是一种工具&#xff0c;用于快速搭建前端项目的基础结构&#xff0c;提供了一套约定和标准&#xff0c;帮助开发人员快速启动项目开发。常见的前端脚手架包括Create React App、Vue CLI、Angular CLI、nestjs/cli等。 我为什么…

C语言——二维数组和字符数组

二维数组 二维数组本质上是一个行列式的组合&#xff0c;也就是二维数组是有行和列两部分构成。二维数组数据是通过行列进行解读。 定义形式&#xff1a; 类型&#xff08;说明符&#xff09; 数组名[行数&#xff08;常量表达式1&#xff09;][列数&#xff08;常量表达式…

nginx负载均衡、java、tomcat装包

一、nginx 七层负载均衡 1、七层负载均衡基础配置 2、负载均衡状态 [rootserver]# vim /usr/local/nginx/conf/nginx.confworker_processes 1;event {worker_connections 1024&#xff1b;}http { # 七层负载均衡支持http、ftp协议include mime.types;default_type app…

T3学员领取资料通知0803

T3学员领取资料通知0803 各位学员∶本周MF系列VBA技术资料增加671-680讲&#xff0c;T3学员看到通知后请免费领取,领取时间8月2日晚上19:00-8月3日12:00。本次增加内容&#xff1a; MF671:Shell命令输出计算机的详细信息 MF672:Shell命令输出网络配置信息 MF673:解锁和启用…

QtQuick Text-文本省略

效果 import QtQuickColumn{spacing: 20Text{width: 200text: qsTr("1使文本在单行中对于超出部分不要进行省略")font.pointSize: 20}Text{width: 200elide: Text.ElideLefttext: qsTr("2使文本在单行中对于超出部分从左边进行省略")font.pointSize: 20}Te…

【协作提效 Go - gin ! swagger】

什么是swagger Swagger 是一个用于设计、构建、记录和使用 RESTful Web 服务的工具集。它的主要作用包括&#xff1a; API 文档生成&#xff1a;Swagger 可以自动生成详细的 API 文档&#xff0c;包括每个端点的请求和响应格式、参数、状态码等。这使得开发者和用户可以轻松理…

【香橙派系列教程】(五)Linux的热拔插UDEV机制

【五】Linux的热拔插UDEV机制 在上一篇中我们发现&#xff0c;当手机接入开发板时&#xff0c;系统并不认识&#xff0c;当我们在/etc/udev目录下创建一个规则后&#xff0c;就可以通过adb访问到手机了&#xff0c;这里到底是怎么回事&#xff1f; 文章目录 【五】Linux的热拔插…

【Python】数据类型(上)

本篇文章将讲解&#xff1a; &#xff08;1&#xff09;整型 &#xff08;2&#xff09;布尔类型 一&#xff1a;整型 整型其实就是十进制整数的统称&#xff0c;例如&#xff1a;1 666 都属于整型。 &#xff08;1&#xff09;定义 num11 age45 &#xff08…

【网络】网络入门(第一篇)

网络入门可以从多个方面开始&#xff0c;以下是一个基本的网络入门指南&#xff0c;涵盖了网络的基本概念、网络类型、网络协议、网络拓扑、网络设备以及网络地址等方面。 一、网络基本概念 计算机网络&#xff1a;将多个计算机系统和设备连接在一起&#xff0c;以实现资源共…

Opencv学习-LUT函数

这个函数大概意思根据自己设定的查找表&#xff0c;改变原本像素点值 例如&#xff1a;我们想将一张图片灰度为0-100的像素的灰度变成0,101-200的变成100,201-255的变成255。我们就可已建立如下的一张表格 ​​​​​​​ ​​​​​​​ ​​​​​​​…

Studying-代码随想录训练营day52| 101.孤岛的总面积、102沉没孤岛、103.水流问题、104.建造最大岛屿

第52天&#xff0c;图论part03&#xff0c;岛屿问题继续&#xff01;&#xff01;&#x1f4aa;(ง •_•)ง&#xff0c;编程语言&#xff1a;C 目录 101.孤岛的总面积 102沉没孤岛 103.水流问题 104.建造最大岛屿 101.孤岛的总面积 文档讲解&#xff1a;手撕孤岛的总…

昇思25天学习打卡营第XX天|SSD目标检测

感觉目标检测还是yolo相对最火&#xff1f;ssd有点老了可以更新下 SSD算法数学描述 SSD算法使用卷积神经网络&#xff08;CNN&#xff09;进行特征提取&#xff0c;并通过多尺度的特征图进行目标检测。设 ( C ) 为CNN输出的特征层数量&#xff0c;( F_i ) 为第 ( i ) 层特征…

【Postman的接口测试工具介绍】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步! 👉Postman接口.👋 👉Postman是一款常用的API开发测试工具,它提…

Harmony学习(四)(应用程序框架基础)

1.应该程序框架基础 多Module设计机制 模块化开发&#xff1a;一个应用多个功能&#xff0c;每个功能可作为一个模块&#xff0c;Module中可以包含源代码、资源文件、第三方库、配置文件等&#xff0c;每一个Module可以独立编译&#xff0c;实现特定的功能支持多设备&#xf…

jdk的版本匹配 Usage of ApI documented as @since 11+

IDEA 解决 Usage of API documented as since XX 的方法 如下所示&#xff0c;代码已经报错提示。 这个问题的原因是IDEA 设置的jdk Language level 语法级别太低&#xff0c;不适配代码导致的&#xff0c;只要在项目结构中将语法级别调相应的级别就可以了。具体解决思路见下图…

vue-创建自己的CLI脚手架

1.自定义命令和入口配置 首先创建一个文件夹&#xff0c;然后npm init -y生成package.json文件 添加bin命令配置入口文件 新建lib/index.js文件 然后在控制台npm link 建立软连接 、然后执行felix-cli 就可以输出代码 2.查看当前版本号命令 安装 commander npm i commander…