吃透《西瓜书》第三章 线性模型:对数几率回归

news2024/9/30 15:32:47

🍉 吃瓜系列 教材:《机器学习》 周志华著

🕒时间:2023/7/26

目录

一、对数几率回归

1.1 定义和基本思想

1.2 对数记录回归建模 

1.3 广义线性模型

1.3.1 指数族分布

1.3.2 广义线性模型的三条假设

1.4 对数几率回归的广义线性模型推导

1.5 最大似然估计

1.6 对数几率回归的参数估计(公式推导)


一、对数几率回归

1.1 定义和基本思想

定义:

对数几率回归(Logistic Regression)是一种常用的分类算法,主要用于将样本根据特征分成不同的类别。

线性回归模型返回的是一个实值

但是分类问题返回的是一个概率

基本思想是:

通过对数据进行建模,得到一个函数,将输入特征映射到一个概率值,该概率表示样本属于某一类别的概率。

具体来说,对数几率回归首先使用线性函数拟合输入特征,然后对线性函数的输出结果应用一个逻辑函数(sigmoid函数),将输出结果映射到0到1之间的概率值,进而进行分类。

优缺点:

对数几率回归有以下优点:

1. 运算速度快,适用于大规模数据集;
2. 不需要对输入数据做太多假设,表现较为稳定;
3. 输出结果为概率值,能够给出明确的分类结果。

但是,对数几率回归也存在以下缺点:

1. 对于非线性可分的数据,分类效果不佳;
2. 对于特征空间的高维度数据,容易出现“过拟合”情况,需要进行正则化处理;
3. 对噪声比较敏感。

1.2 对数几率回归建模 

因为单位跃迁函数是不连续的函数,在数据处理的时候比较困难

所以在此使用了一个替代函数

在机器学习中,我们通常使用对数几率函数去做一个替代函数

这种方法有很多优点,例如它是直接对分类可能性进行建模无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题

它不是仅预测出“类别”,而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用:

此外对率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解

对数几率的由来

得到 3.23 3.24 两个式子之后,对数几率回归的建模就算完成了!

 

1.3 广义线性模型

1.3.1 指数族分布

证明伯努利分布属于指数族分布

 

 这里变形的依据是:

 再次拆分成加法 

 

 对比指数分布的一般形式得出对应的参数

 

1.3.2 广义线性模型的三条假设

广义线性模型的三条假设:

1. 在给定 x  的条件下,假设随机变量 y 服从某个指数族分布

2.在给定 x 的条件下,我们的目标是得到一个模型 h(x)能预测出T(y)的期望值

3.假设该指数族分布中的自然参数  n 和 x 呈线性关系

 

 

1.4 对数几率回归的广义线性模型推导

 

使用上面的三个假设

 而 E[ y|x ] = E[ y ]

y 是服从伯努利分布的 所以期望是很好求出来的

 到此处,假设3 还没有用上

1.5 最大似然估计

最大似然估计

 

上面的转化,把累乘转换换成了累加

似然函数就转换成了对数似然函数

这样的话后续的求导会很方便

 

 

 或者

 这个式子相比于 3.26式子更容易进行公式的推导

1.6 对数几率回归的参数估计(公式推导)

  • 先使用 3.26 进行公式推导

 

 综合整理一下

 似然函数是求最大值的

损失函数求最小值,所以加一个负号  得到式子 3.27 

  • 另一种公式推导(更容易推导一点)

 

 似然函数是求最大值的

损失函数求最小值,所以加一个负号  得到式子 3.27 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/807717.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

百城巡展 | 人大金仓7月携手全国伙伴赋能“一带一路”沿线区域协同创新

盛夏7月,人大金仓“百城巡展”来到西宁、乌鲁木齐、银川、拉萨,携手核心伙伴、用户,打造科技创新合作平台,不断打磨数据库领域中国方案,赋能“一带一路”沿线区域协同创新,助力信创产业高质量发展&#xff…

【C++】Day7 标准莫板库

1. 实现vector相关函数 #include <iostream>using namespace std;template <typename T> class Myvector { private:T* first;T* last;T* end; public:Myvector(int size 10){ //构造函数this->first new T[size];this->last this->first;this-&g…

【计算机视觉中的 GAN 】 - 条件图像合成和 3D 对象生成(2)

一、说明 上文 【计算机视觉中的 GAN 】或多或少是GANs&#xff0c;生成学习和计算机视觉的介绍。我们达到了在 128x128 图像中生成可区分图像特征的程度。但是&#xff0c;如果你真的想了解GAN在计算机视觉方面的进展&#xff0c;你肯定必须深入研究图像到图像的翻译。…

【广州华锐互动】自来水厂净水流程3D模拟还原有哪些作用?

自来水厂净水流程3D模拟还原是一种新型的培训方式&#xff0c;它通过虚拟现实技术&#xff0c;将自来水工艺流程以三维立体的形式呈现出来&#xff0c;为学员提供直观、真实的学习体验。这种培训方式具有以下意义&#xff1a; 首先&#xff0c;自来水厂净水流程3D模拟还原可以…

SpringMvc+阿贾克斯

0目录 1.SpringMVC 加阿贾克斯 2.分页版 1.实战 创建数据库 创建工程和pom依赖 配置web.xml和applicationContext.xml 实体类 Mapper接口方法 Mapper.xml BookService BookSeriviceImpl 控制层 测试 加入findAll.html 测试 2.分页版 控制层 PostMan测…

六个步骤学会简单的数据清洗

在使用机器学习等各种模型来分析数据的时候&#xff0c;最重要的就是如何对原始数据进行清洗和加工&#xff0c;以下几个步骤实现最简单的数据清洗&#xff1b; 以下使用 kaggle 上的泰坦尼克号经典数据集为例子&#xff1b; daownload link&#xff1a;https://link.zhihu.c…

ModuleNotFoundError: No module named ‘xxx‘ 问题解决

ModuleNotFoundError: No module named ‘utils’ 这个问题发生的主要原因&#xff0c;我搜索网络&#xff0c;大概意思就是在py文件中使用了__main__函数&#xff0c;破坏了什么路径识别什么的&#xff0c; 遇到这个问题我发现我导入的utils这个pacakge是有的&#xff0c;那就…

【AutoGluon_02】更优精度与特征重要性

【AutoGluon_02】更优精度与特征重要性 1、优化改良版autogluon2、快速使用3、模型训练4、更高的输出精度5、模型评估&#xff08;1&#xff09;模型排行榜&#xff08;2&#xff09;输出各特征重要性&#xff08;3&#xff09;模型性能可视化 6、输出最终模型7、预测 除了auto…

Scala的trait和extend代码运用实战Demo例子

1、概述 在Scala中&#xff0c;trait是一种特殊的概念&#xff0c;它类似于Java中的接口。trait可以定义方法和字段&#xff0c;但是不能实例化。类可以扩展trait&#xff0c;从而获得trait中定义的方法和字段。 在Scala中&#xff0c;extend关键字用于扩展类或特质。当一个类…

2.playbook剧本

文章目录 playbook剧本创建剧本运行剧本定义和引用变量指定远程主机sudo切换用户when条件判断剧本格式迭代with_itemswith_listwith_flattenedwith_togetherwith_cartesianwith_nested Templates模块tags模块 playbook剧本 playbooks 本身由以下各部分组成 Tasks&#xff1a;任…

基于javeSprict的WebAPI详解

一、前言 作为后端开发&#xff0c;前端其实只需要了解一些就可以了&#xff0c;不需要了解多么深入。在前面我们已经学习了ECMAScript:的基础语法部分&#xff0c;还有DOM API和BOM API需要学习。 DOM API主要负责操作页面结构。 所有的WebAPI可以参考下面这个网址里面的信息…

高清视频制作GIF怎么操作?一个工具在线完成视频转GIF

一段视频为了方便传输分享想要做成GIF动画的时候要怎么操作呢&#xff1f;很简单&#xff0c;只需要一款专业的GIF在线制作工具-GIF中文网&#xff0c;使用视频转GIF&#xff08;https://www.gif.cn/&#xff09;功能&#xff0c;上新MP4格式视频&#xff0c;能够快速制作1分钟…

arm neon/fpu/mfloat

neon官网介绍: Arm Neon technology is an advanced Single Instruction Multiple Data (SIMD) architecture extension for the A-profile and R-profile processors. Neon technology is a packed SIMD architecture. Neon registers are considered as vectors of elements …

【达哥讲网络】第3集:数据交换的垫基石——二层交换原理

专业的网络工程师在进行网络设计时&#xff0c;会事先规划好不同业务数据的转发路径&#xff0c;一方面是为了满足用户应用需求&#xff0c;另一方面是为了提高数据转发效率、充分利用各设备/各链路的硬件或带宽资源。在进行网络故障排除时&#xff0c;理顺各路数据的转发路径也…

Android 开发代码规范

一. AndroidStudio开发工具规范 使用最新的稳定版本.统一文件的编码格式为utf-8. 清除每个类里面的无效的import导包.代码样式统一,比如&#xff0c;tab缩进4个空格&#xff0c;或者 tab size等如果没有特殊情况使用默认的配置即可。每行字数每行字符数不得超过 160 字符&…

C++笔记之++i和i++是原子操作吗?

C笔记之i和i是原子操作吗&#xff1f; code review! 文章目录 C笔记之i和i是原子操作吗&#xff1f;1.i是原子操作吗&#xff1f;2.i是原子操作吗&#xff1f;3.前置递增和后置递增 1.i是原子操作吗&#xff1f; 2.i是原子操作吗&#xff1f; 3.前置递增和后置递增

绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 摄影写真面临AI技术洗牌&#xff0c;一键生成杂志大片的时代来了 软件&#xff1a;midjourney & Stable Diffusion 模型&#xff…

Appium+python自动化(三十四)- 有图有真相,很美很精彩 - 屏幕截图和Android APP类型简介

简介 在实际自动化项目运行过程中&#xff0c;很多时候App可以会出现各种异常&#xff0c;为了更好的定位问题&#xff0c;除了捕捉日志我们还需要对运行时的设备状态来进行截屏。从而达到一种“有图有真相”的效果。 截图方法 方法1 save_screenshot() 该方法直接保存当前…

传统计算机视觉

传统计算机视觉 计算机视觉难点图像分割基于主动轮廓的图像分割基于水平集的图像分割交互式图像分割基于模型的运动分割 目标跟踪基于光流的点目标跟踪基于均值漂移的块目标跟踪基于粒子滤波的目标跟踪基于核相关滤波的目标跟踪 目标检测一般目标检测识别之特征一般目标检测识别…

【深度学习】生成对抗网络Generative Adversarial Nets

序言 本文是GAN网络的原始论文&#xff0c;发表于2014年&#xff0c;我们知道&#xff0c;对抗网络是深度学习中&#xff0c;CNN基础上的一大进步&#xff1b; 它最大的好处是&#xff0c;让网络摆脱训练成“死模型”到固定场所处去应用&#xff0c;而是对于变化的场景&#xf…