吴恩达机器学习课程笔记:模型描述、假设函数、代价函数

news2024/11/25 4:54:24

1.吴恩达机器学习课程笔记:模型描述、假设函数、代价函数

吴恩达机器学习课程笔记:模型描述
吴恩达机器学习课程笔记:代价函数

仅作为个人学习笔记,若各位大佬发现错误请指正

什么是模型?

机器学习模型简单来说,即是学习数据特征与标签的关系或者学习数据特征内部的规律的一个函数。摘自:机器学习中的模型到底是指什么?

先选一个模型,然后根据数据样本学习,不断调整优化参数得到最优参数,最终获得决策函数,之后使用该决策函数进行预测

视频中以回归问题为例介绍什么是模型?如何优化参数?
例子:房价预测

样本数据如下:
符号解释:m代表样本容量、x代表输入值(特征)、y代表输出值

根据经验先大概选一个初始模型(假设函数),这里选的是单变量线性回归模型

假设函数: h ( x ) = θ 0 + θ 1 x h(x)=\theta_0+\theta_1x h(x)=θ0+θ1x
不同的参数对应不同的函数

我们怎样调整参数才能使得模型更好地符合样本数据?也就是如何在整体上使得预测值 h ( x ) h(x) h(x)与样本值y的距离更近?由此引入最小二乘法
minimize  J ( θ 1 ) = minimize  1 2 m ∑ i = 1 m ( h ( x ( i ) ) − y ( i ) ) 2 \text{minimize}\ J(\theta_1)=\text{minimize}\ \frac{1}{2m}\sum_{i=1}^{m}\left(h(x^{(i)})-y^{(i)}\right)^2 minimize J(θ1)=minimize 2m1i=1m(h(x(i))y(i))2
注:右上角标代表第 i i i个样本数据、m代表样本容量
我们通过最小化代价函数 J ( θ 1 ) J(\theta_1) J(θ1)来寻找最优参数
假设函数 h ( x ( i ) ) = θ 1 x ( i ) h(x^{(i)})=\theta_1x^{(i)} h(x(i))=θ1x(i)的函数值为模型预测值、样本数据 y ( i ) y^{(i)} y(i)为真实值

例如样本数据(1,1)、(2,2)、(3,3),根据这些样本数据我们大致认为截距为0的函数可以较好拟合这些数据,所以我们就假设只有一个参数(斜率)
我们首先假设参数 θ 1 = 1 \theta_1=1 θ1=1,则假设函数为 h ( x ( i ) ) = θ 1 x ( i ) = x h(x^{(i)})=\theta_1x^{(i)}=x h(x(i))=θ1x(i)=x
x = 1 x=1 x=1代入假设函数 h ( 1 ) = 1 h(1)=1 h(1)=1
x = 2 x=2 x=2代入假设函数 h ( 2 ) = 2 h(2)=2 h(2)=2
x = 3 x=3 x=3代入假设函数 h ( 3 ) = 3 h(3)=3 h(3)=3
将样本数据代入代价函数计算, y ( 1 ) = 1 、 y ( 2 ) = 2 、 y ( 3 ) = 3 y^{(1)}=1、y^{(2)}=2、y^{(3)}=3 y(1)=1y(2)=2y(3)=3,计算结果代价函数值为 0 0 0,以参数 θ 1 \theta_1 θ1为横轴,以代价函数值为纵轴绘制图像,通过不断更新参数 θ 1 \theta_1 θ1得到不同的代价函数值,最终可以得到一个最小代价,此时代价函数值对应的参数 θ 1 \theta_1 θ1的值便是最优值

我们将参数 θ 1 \theta_1 θ1调整为 0.5 0.5 0.5,并计算代价函数值

我们将参数 θ 1 \theta_1 θ1调整为 0 0 0,并计算代价函数值

通过对参数不断调整,我们可以最终在以参数 θ 1 \theta_1 θ1为横轴,以代价函数值为纵轴的函数图像中找到代价最小时对应的参数值,此时的参数值就是最优值,
当样本数据如下图,我们大致认为假设函数有两个参数 θ 0 \theta_0 θ0(截距)、 θ 1 \theta_1 θ1(斜率),假设函数为 h ( x ) = θ 0 + θ 1 x h(x)=\theta_0+\theta_1x h(x)=θ0+θ1x

当我们有两个参数需要确定时,对应的代价函数为 J ( θ 0 , θ 1 ) J(\theta_0,\theta_1) J(θ0,θ1)
minimize  J ( θ 0 , θ 1 ) = minimize  1 2 m ∑ i = 1 m ( h ( x ( i ) ) − y ( i ) ) 2 \text{minimize}\ J(\theta_0,\theta_1)=\text{minimize}\ \frac{1}{2m}\sum_{i=1}^{m}\left(h(x^{(i)})-y^{(i)}\right)^2 minimize J(θ0,θ1)=minimize 2m1i=1m(h(x(i))y(i))2
注:右上角标代表第 i i i个样本数据、 m m m代表样本容量
我们通过最小化代价函数 J ( θ 0 , θ 1 ) J(\theta_0,\theta_1) J(θ0,θ1)来寻找最优参数
假设函数 h ( x ( i ) ) = θ 0 + θ 1 x ( i ) h(x^{(i)})=\theta_0+\theta_1x^{(i)} h(x(i))=θ0+θ1x(i)的函数值为模型预测值、样本数据 y ( i ) y^{(i)} y(i)为真实值
首先给两个参数初始值,并计算对应代价函数值,而后对两个参数值进行调整,每次调整都计算出对应的代价函数值,最终得到类似下图右侧的函数图像, z z z轴为代价函数值, x x x轴与 y y y轴分别为两个参数,我们可以在此图像中找到最小的代价函数值,此值对应的参数即为最优参数,我们便得到了符合以下样本数据的最优模型 h ( x ) = θ 0 + θ 1 x h(x)=\theta_0+\theta_1x h(x)=θ0+θ1x(对应的最优值代入两个参数)

当然我们也可以用等高线图来表示代价函数图像
同一个椭圆上的所有点其代价函数值相等
不同椭圆上的点代价函数值不同,颜色代表了代价函数值的高低,从下图中我们可以得到最内部的点对应的代价函数值最小,通过此值我们找到了对应两个参数的值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/168214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

玩转数据结构前言

本章为数据结构学习前的一些学习方法建议 51刷题法 leetcode中文站点: https://leetcode-cn.com leetcode国际站点: https://leetcode.com 刷题方法 Round1 1.读题,思考,4-6分钟内有思路立马写,15分钟内写不出来直接放弃 有思路先别管算…

使用mongostat命令实现zabbix监控mongodb

zabbix监控mongodbmongostat命令监控脚本参考zabbix配置mongostat命令 mongostat是mongodb自带的状态检测工具,可以使用这个命令获取mongodb的当前运行状态,并输出。我们使用这个命令获取mongodb的状态。 本示例中是一个3节点的复制集群(一…

调用方系统禁止依赖传递后如何排查本系统所缺少依赖

订单系统依赖了好多其他系统&#xff0c;但当其他系统的service-api的包里依赖项加入了禁止依赖后&#xff0c;订单系统启动就会报错&#xff0c;具体排查那些包被禁止依赖了&#xff0c;方案如下 举例&#xff1a;会员系统后个包加入了禁止依赖<optional>true</opti…

Java中set的基本操作

文章目录1、定义Set2、增删改操作&#xff08;1&#xff09;新增&#xff08;2&#xff09;删出&#xff08;3&#xff09;修改3、访问set4、遍历set&#xff08;1&#xff09;foreach遍历&#xff08;2&#xff09;iterator迭代器遍历5、set转换6、其他操作set是一个无序的集合…

深度解析源码之SpringMVC文件上传为什么要用POST请求还要设置请求头

深度解析源码之SpringMVC文件上传为什么要用POST请求还要设置请求头 从本篇文章开始&#xff0c;来逐步介绍里面每一步的细节处理流程。 首先看到doDispatch方法的第一个重要操作就是校验文件上传请求。代码如下&#xff1a; 这个方法是如何校验文件上传请求的呢&#xff1f;…

软件测试最常用的 SQL 命令 | 通过实例掌握基本查询、条件查询、聚合查询

本文为霍格沃兹测试学院优秀学员学习笔记&#xff0c;汇总了软件测试人员经常使用&#xff0c;必须掌握的 SQL 基础命令1、DML核心CRUD增删改查缩写全称和对应 SQL&#xff1a;* DML 数据操纵语言&#xff1a;Data Manipulation Language* Create 增加&#xff1a;insert* Ret…

工作和学习遇到的技术问题

写在前面 记录工作和学习遇到的技术问题,以求再次遇到可以快速解决。 1&#xff1a;Ubuntu TSL换源报错&#xff1a;Err:1 http://mirrors.aliyun.com/ubuntu focal InRelease 执行如下操作&#xff08;已经操作的则忽略&#xff09;&#xff0c;首先在文件/etc/apt/sources…

Vue.js 数据双向绑定的实现

前言 在我们使用vue的时候&#xff0c;当数据发生了改变&#xff0c;界面也会跟着更新&#xff0c;但这并不是理所当然的&#xff0c;我们修改数据的时候vue是如何监听数据的改变以及当数据发生改变的时候vue如何让界面刷新的&#xff1f; 当我们修改数据的时候vue是通过es5中…

DataGear 制作基于Vue2、Element UI弹窗效果的数据可视化看板

DataGear 在4.4.0版本新增了dg-chart-manual-render特性&#xff0c;用于手动控制看板内图表的渲染&#xff0c;而非在页面加载时自动渲染。利用这一特性&#xff0c;可以很方便制作具有弹窗效果的数据可视化看板。 本文以Vue2、Element UI 前端框架为例&#xff0c;介绍如何制…

【C语言】通讯录—静态版

前言: 刚学完结构体和枚举&#xff0c;在网上找了个通讯录的项目&#xff0c;用来练手 目标:该通讯录可存储千人个人信息 包括:姓名&#xff0c;年龄&#xff0c;性别&#xff0c;电话&#xff0c;地址 实现功能: 1.添加联系人 2.删除联系人 …

Web 安全漏洞之 XSS 攻击

什么是 XSS 攻击 XSS&#xff08;Cross-Site Scripting&#xff09;又称跨站脚本&#xff0c;XSS的重点不在于跨站点&#xff0c;而是在于脚本的执行。XSS是一种经常出现在 Web 应用程序中的计算机安全漏洞&#xff0c;是由于 Web 应用程序对用户的输入过滤不足而产生的。 常…

MyBatis -- 多表查询

MyBatis -- 多表查询一、准备工作二、多表查询属性名与字段名不匹配一、准备工作 博客系统场景。 创建库、表&#xff1a; -- 创建数据库 drop database if exists mycnblog; create database mycnblog DEFAULT CHARACTER SET utf8mb4;-- 使用数据数据 use mycnblog;-- 创建…

小程序样式和组件基础

小程序样式和组件基础小程序样式样式wxss简介响应式单位rpx其它css单位支持的单位内置组件简介image组件-基础组件介绍常用属性示例image组件-懒加载与基础库版本用法swiper组件组件介绍常用属性示例navigator组件-基础组件介绍常用属性示例navigator组件-页面栈页面栈返回按钮…

常用windows自带程序对应的命令

敲winr键&#xff0c;调出 运行 框&#xff1b; 输入命令回车&#xff0c;打开对应程序&#xff1b; 输入cmd&#xff0c;调出命令行窗口&#xff1b; gpedit&#xff0c;组策略编辑器&#xff0c; 有的电脑没有组策略编辑器&#xff1b; 资源管理器&#xff1b; dvdplay&…

【BP靶场portswigger-客户端15】基于DOM的漏洞-7个实验(全)

前言&#xff1a; 介绍&#xff1a; 博主&#xff1a;网络安全领域狂热爱好者&#xff08;承诺在CSDN永久无偿分享文章&#xff09;。 殊荣&#xff1a;CSDN网络安全领域优质创作者&#xff0c;2022年双十一业务安全保卫战-某厂第一名&#xff0c;某厂特邀数字业务安全研究员&…

使用PyTorch构建GAN生成对抗网络源码(详细步骤讲解+注释版)02 人脸识别 上

文章目录1 数据集描述2 GPU设置3 设置Dataset类4 设置辨别器类5 辅助函数与辅助类1 数据集描述 此项目使用的是著名的celebA&#xff08;CelebFaces Attribute&#xff09;数据集。其包含10,177个名人身份的202,599张人脸图片&#xff0c;每张图片都做好了特征标记&#xff0c…

【数据结构】顺序表的原理及实现

1.什么是顺序表 顺序表是用一段物理地址连续的存储单元进行存储元素的线性结构&#xff0c;通常是以数组进行存储。通过数据元素物理存储的相邻关系来反映数据元素之间逻辑上的相邻关系。 2.顺序表的实现 判断顺序表是否为空表public boolean isEmpty()判断顺序表是否满publi…

复旦MBA海外短期课程 | 善用ESG金融,共创可持续未来

2022年&#xff0c;世界在颠簸中向前迈进&#xff1a;全球气候变化、能源危机、大国博弈……在这样的背景下&#xff0c;近年来备受瞩目的ESG价值、“双碳”目标、可持续发展、责任投资等话题愈发成为焦点。今年复旦MBA培养体系全面升级之际&#xff0c;在新增的“未来发展模块…

Pandas CSV 文件

Pandas CSV 文件CSV&#xff08;Comma-Separated Values&#xff0c;逗号分隔值&#xff0c;有时也称为字符分隔值&#xff0c;因为分隔字符也可以不是逗号&#xff09;&#xff0c;其文件以纯文本形式存储表格数据&#xff08;数字和文本&#xff09;。CSV 是一种通用的、相对…

【沐风老师】3dMax一键生成中央空调排风口插件使用教程

3dMax一键创建中央空调排风口插件&#xff0c;快捷生成矩形或菱形两种形状的排风口。 【版本要求】 不确定。3dmax2020环境测试可用&#xff0c;其他版本自行测试&#xff0c;欢迎反馈测试结果。 【安装方法】 方法一&#xff1a;拖动插件文件到3dMax窗口打开。 方法二&#x…