吴恩达机器学习笔记(三)逻辑回归

news2024/10/6 0:29:43

机器学习(三)

学习机器学习过程中的心得体会以及知识点的整理,方便我自己查找,也希望可以和大家一起交流。

—— 吴恩达机器学习第五章 ——

四、逻辑回归

  1. 线性回归局限性
    线性回归对于分类问题的局限性:由于离群点的存在,线性回归不适用于分类问题。如下图(阈值为0.5),由于最右离群点,再用线性回归与实际情况不拟合。
    在这里插入图片描述
    因此,我们引入 逻辑回归 算法,来解决这个问题。

  2. 假设陈述
    逻辑回归的假设函数值总是在0到1之间,逻辑回归模型: h θ ( x ) h_{θ}(x) hθ(x), 使得 0 ≤ h θ ( x ) ≤ 1 0 ≤ h_{θ}(x) ≤ 1 0hθ(x)1
    在线性回归中, h θ ( x ) = θ T x h_{θ}(x) = θ^{T}x hθ(x)=θTx ,在逻辑回归中令 h θ ( x ) = g ( θ T x ) h_{θ}(x) = g(θ^{T}x ) hθ(x)=g(θTx) ,将 θ x T θ^{T}_{x} θxT带入g(x)得:
    在这里插入图片描述
    其中 g ( z ) = 1 1 + e − z g(z)=\frac{1}{1+e^{-z}} g(z)=1+ez1被称为Sigmoid函数,也叫Logistic函数。
    在这里插入图片描述
    h θ ( x ) = P ( y = 1 ∣ x ; θ ) h_{θ}(x)=P ( y=1∣x ;θ ) hθ(x)=P(y=1x;θ)( 对于输入的x,y=1的概率估计)

  3. 决策界限
    决策边界不是训练集的属性,而是假设本身及其参数的属性。
    假设有一个训练集: h θ ( x ) = g ( θ 0 + θ 1 x 1 + θ 2 x 2 ) h_{θ}(x)=g(θ_{0}+θ_{1}x_{1}+θ_{2}x_{2}) hθ(x)=g(θ0+θ1x1+θ2x2)。用一种方法或者假设,得到参数 θ 0 = − 3 , θ 1 = 1 , θ 2 = 1 θ_{0} = -3,θ_{1} = 1,θ_{2} = 1 θ0=3θ1=1θ2=1。预测 y = 1 i f − 3 + x 1 + x 2 ≥ 0 y = 1 if -3 + x_{1} + x_{2} ≥ 0 y=1if3+x1+x20,即 x 1 + x 2 ≥ 3 x_{1} + x_{2} ≥ 3 x1+x23。则有下图,中间洋红色直线即为 决策边界 ( x 1 + x 2 = 3 ) (x_{1}+ x_{2} = 3) x1+x2=3
    在这里插入图片描述
    其他的例子如下图:
    在这里插入图片描述
    其他参数更多更复杂的也同理。

  4. 代价函数
    将线性回归的代价函数改写为如下形式:
    J ( θ ) = 1 m ∑ i = 1 m 1 2 ( h θ ( x ( i ) ) − y ( i ) ) 2 J(θ)=\frac{1}{m}\sum_{i=1}^{m}\frac{1}{2}(h_{θ}(x^{(i)})-y^{(i)})^{2} J(θ)=m1i=1m21(hθ(x(i))y(i))2,进而定义cost函数为 C o s t ( h θ ( x ( i ) , y ( i ) ) = 1 2 ( h θ ( x ( i ) − y ( i ) ) 2 Cost(h_{θ}(x^{(i)},y^{(i)})=\frac{1}{2}(h_{θ}(x^{(i)}-y^{(i)})^{2} Cost(hθ(x(i),y(i))=21(hθ(x(i)y(i))2
    在这里插入图片描述
    将cost function 运用到逻辑回归中:.
    在这里插入图片描述
    其中 y 表示实际,hθ(x)表示预测。

  • 当y = 1时:
    i f   h θ ( x ) = 1 , c o s t = 0 if \ h_{θ}(x) = 1, cost = 0 if hθ(x)=1,cost=0
    i f   h θ ( x ) = 0 , c o s t = ∞ if \ h_{θ}(x) = 0, cost = ∞ if hθ(x)=0,cost=(预测与实际完全不一致,要花费很大的代价惩罚算法)
    在这里插入图片描述
  • 当y = 0时:
    i f   h θ ( x ) = 0 , c o s t = 0 if\ h_{θ}(x) = 0, cost = 0 if hθ(x)=0,cost=0
    i f   h θ ( x ) = 1 , c o s t = ∞ if\ h_{θ}(x) = 1, cost = ∞ if hθ(x)=1,cost= (预测与实际完全不一致,要花费很大的代价惩罚算法)
    在这里插入图片描述
  1. 简化代价函数与梯度下降
    在这里插入图片描述
    将上述式子合并为一个式子: C o s t ( h θ ( x ) , y ) = − y ( h θ ( x ) ) − ( 1 − y ) l o g ( 1 − h θ ( x ) ) Cost(h_{θ}(x),y)=-y(h_{θ}(x))-(1-y)log(1-h_{θ}(x)) Cost(hθ(x),y)=y(hθ(x))(1y)log(1hθ(x))
    当y = 1时,后一个式子整体为0;当y = 0时,前一个式子整体为0。进而得到:
    J ( θ ) = 1 m [ ∑ i = 1 m y ( i ) l o g h θ ( x ( i ) ) + ( 1 − y ( i ) ) l o g ( 1 − h θ ( x ( i ) ) ) ] J(θ)=\frac{1}{m}[\sum_{i=1}^{m}y^{(i)}logh_{θ}(x^{(i)})+(1-y^{(i)})log(1-h_{θ}(x^{(i)}))] J(θ)=m1[i=1my(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]
    求最小代价函数由 θ j : = θ j − α ∂ ∂ θ j J ( θ ) θ_{j}:=θ_{j}-\alpha\frac{\partial }{\partial θ_{j} }J(θ) θj:=θjαθjJ(θ),得 θ j : = θ j − α ∑ i = 1 m ( h θ ( x ( i ) ) − y ( i ) ) x j ( i ) θ_{j}:=θ_{j}-\alpha\sum_{i=1}^{m}(h_{θ}(x^{(i)})-y^{(i)})x_{j}^{(i)} θj:=θjαi=1m(hθ(x(i))y(i))xj(i)

注意:

  • 逻辑回归的代价函数看似与线性回归的代价函数相同,但本质不同。
  • 逻辑回归中的 h θ ( x ) = 1 e − θ T x h_{θ}(x)=\frac{1}{e-θ^{T}x} hθ(x)=eθTx1
  • 线性回归中的 h θ ( x ) = θ T x h_{θ}(x) = θ^{T}x hθ(x)=θTx
  1. 逻辑回归解决问题:多元分类
    多元分类即结果有多种可能。如下图,有三种可能结果。
    在这里插入图片描述
    将它们两两作为一组,方法是将其中一个类别作为正类,其他作为负类,依次建立新的训练集,得到
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    即为 h θ ( i ) ( x ) = P ( y = i ∣ x ; θ )   ( i = 1 , 2 , 3 ) h_{θ}^{(i)}(x)=P(y=i|x;θ)\ (i=1,2,3) hθ(i)(x)=P(y=ix;θ) (i=1,2,3),最后需要输入一个x,选择h最大的类别,也即在三个分类器中选择可信度最高,效果最好的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/179864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode动态规划经典题目(九):入门

学习目标: 了解动态规划 学习内容: 1. LeetCode509. 斐波那契数https://leetcode.cn/problems/fibonacci-number/ 2. LeetCode70. 爬楼梯https://leetcode.cn/problems/climbing-stairs/ 3. LeetCode746. 使用最小花费爬楼梯https://leetcode.cn/proble…

ice规则引擎==启动流程和源码分析

启动 git clone代码 创建数据库ice,执行ice server里的sql,修改ice server的配置文件中的数据库信息 启动ice server 和ice test 访问ice server localhost:8121 新增一个app,默认给了个id为1,这个1可以看到在ice test的配置文件中指定…

MP503空气质量气体传感器介绍

MP503空气质量气体传感器简介MP503空气质量气体传感器采用多层厚膜制造工艺,在微型Al2O3陶瓷基片的两面分别制作加热器和金属氧化物半导体气敏层,封装在金属壳体内。当环境空气中有被检测气体存在时传感器电导率发生变化,该气体的浓度越高&am…

Spring Boot开发自定义的starter

目录 一、Spring Boot的starter概述 二、自定义starter的命名规则 三、自定义starter实战 1. 创建spring工程 2. 修改pom.xml 3. 编写配置类 4. 安装到本地maven仓库 5. 在其他项目中引入 6. 测试 一、Spring Boot的starter概述 SpringBoot中的starter是一种非常重要的机…

【web前端】CSS浮动

多个块级元素纵向排列找标准流,横向排列找浮动 浮动的特性: (1)浮动元素会脱离标准流(脱标) (有的浮动,有的没浮) (2)浮动的元素会在一行内显示…

C#中[]的几种用法

一、导入外部DLL函数 如[DllImport(“kernel32.dll”)]这叫引入kernel32.dll这个动态连接库。这个动态连接库里面包含了很多WindowsAPI函数,如果你想使用这面的函数,就需要这么引入。举个例子: [DllImport(“kernel32.dll”)] private static extern vo…

栈与队列总结

文章目录栈栈的概述栈的实现栈API设计栈代码实现栈的应用栈在系统中的应用括号匹配问题字符串去重问题逆波兰表达式问题队列队列的概述队列的实现队列的API设计队列代码实现队列的经典题目滑动窗口最大值问题求前 K 个高频元素栈 栈的概述 栈是一种基于先进后出(FILO)的数据结…

Android开发环境搭建

前面从全局和整体角度看了下Android包含哪些东西,自然,也涵盖了开发需要了解的内容,具体参见博文:从技术角度看Android大系统的构成_龙赤子的博客-CSDN博客 写完博文,感觉对Android开发也胸有成竹了,于是就…

ActiveReports.NET 17.0 Crack

ActiveReports.NET 17 添加新的 RDL 仪表板报告类型、新的 Blazor Web Designer,以及对 .NET 7 的全面支持。 2023 年 1 月 25 日 - 15:28新版本 特征 RDL 仪表板 - 新报告类型 RDL 仪表板提供了一种在可滚动的交互式容器中显示数据可视化控件(例如图表、…

【Typescript学习】使用 React 和 TypeScript 构建web应用(三)所有组件

教程来自freecodeCamp:【英字】使用 React 和 TypeScript 构建应用程序 跟做,仅记录用 其他资料:https://www.freecodecamp.org/chinese/news/learn-typescript-beginners-guide/ 第三天 以下是视频(0:40-0:60) 的内容 目录第三天1 创建Todo…

JavaEE day6 初识JavaScript

什么是JS JS是通行在各种浏览器的一种语言,JAVA后端代码运行在服务器上,JS代码内容配合HTML,浏览器对JS代码进行解释运行,然后展现在浏览器上,web开发离不开JS。 一般步骤为:(index.html与scr…

LinuxC—高级IO

高级IO 1 非阻塞IO/有限状态机编程 1.1 基本概念 定义 有限状态机(Finite State Machine) 缩写为 FSM,状态机有 3 个组成部分:状态、事件、动作。 状态:所有可能存在的状态。包括当前状态和条件满足后要迁移的状态。事件:也称为…

自动驾驶环境感知——视觉传感器技术

文章目录1. 摄像头的成像原理1.1 单目视觉传感器的硬件结构1.2 单目视觉的成像原理 –小孔成像模型1.3 单目视觉的成像原理 – 像素坐标系1.4 单目视觉三维坐标系转换 – 外参1.5 单目视觉的坐标系转换 – 从世界坐标点到像素坐标1.6 单目视觉的特性2. 视觉传感器的标定2.1 视觉…

CSS之精灵图

1. 精灵图 1.1 为什么需要精灵图 一个网页中往往会应用很多小的背景图像作为修饰,当网页中的图像过多时,服务器就会频繁地接收和发送请求图片,造成服务器请求压力过大,这将大大降低页面的加载速度。 为什么使用精灵图&#xff…

9、断点调试

文章目录9、断点调试9.1 为什么需要Debug9.2 Debug的步骤1 添加断点2 启动调试3 单步调试工具介绍9.3 多种Debug情况介绍1 行断点2 方法断点3 字段断点4 条件断点5 异常断点6 线程断点7 强制结束9.4 自定义调试数据视图9.5 常见问题【尚硅谷】idea实战教程-讲师:宋红…

Linux安装mysql--CentOS系统

Linux安装mysql 安装包: https://pan.baidu.com/s/10xvFpfl4nTktaEdhKbY3og 首先启动虚拟机,我是用FinalShell连接的 然后将下载的安装包上传至Linux系统中,直接rz回车就会跳出选择文件的窗口,选择需要上传的安装包即可等待上传…

计算机网络01_---软考高级系统架构师010

计算机网络知识点汇总: IPV4中有单播,组播,广播.IPV6没有广播 网络标准喝协议中要知道有IEEE802.3 以太网协议 局域网是以太网的一种 然后,IEEE802.11是无线局域网协议. TCP/IP协议族,这里,要知道从网络层开始,这里到传输层,然后传输层有个 TCP协议,这里TCP链接的时候有…

【沐风老师】3DMAX地板生成器插件FloorGenerator使用教程

FloorGenerator地板生成器插件,创建任何形状的地板几何图形,你可以完全控制从斜边到木板倾斜的所有参数。 伴随该地板的是”多重纹理贴图(MultiTexture)“插件,它使你能够将任意数量的位图随机指定给生成的地板。还提…

听障人士亲述:我们在VRChat用手语交流,成员规模5000人

如果你在B站上搜索VRChat,排在前面的热门视频几乎都是与老外聊天的内容。除了练习语言、交文化流外,你还能在VRChat上遇到不少哇哇乱叫的小孩。作为一款VR社交应用,除了有趣的小游戏外,说话聊天也是VRChat关键的玩法之一。而有这么…

离线ctr特征中心更新

3.8 离线ctr特征中心更新 学习目标 目标 了解特征服务中心的作用应用 无 3.8.1 特征服务中心 特征服务中心可以作为离线计算用户与文章的高级特征,充当着重要的角色。可以为程序提供快速的特征处理与特征结果,而且不仅仅提供给离线使用。还可以作为实时…