机器学习——线性模型学习

news2025/1/13 7:48:48

线性回归

主要目标确定
在这里插入图片描述
如何确定w和b呢?关键在于如何衡量f(x)与y的差别
在这里插入图片描述
此种衡量误差的方法称为均方误差也称为欧式距离
求解w和b使上述方程最小化的过程称为线性回归模型的最小二乘”参数估计“

多元线性回归

针对多个属性的数据集D,此时试图学得
在这里插入图片描述
我们把w和b吸收入向量形式在这里插入图片描述
再将数据集表示为一个 m ∗ ( d + 1 ) m*(d+1) m(d+1)的矩阵X
在这里插入图片描述
令上式为零可得 w w w最优解的闭式解
在这里插入图片描述

X T X X^TX XTX为满秩矩阵或正定矩阵时,令式 ( 3.10 ) (3.10) (3.10)为零,得
在这里插入图片描述
则最终学习到的线性回归模型为
在这里插入图片描述
然而,现实任务中 X T X X^TX XTX 往往不是满秩矩阵 。例如在许多任务中我们会遇到大量的变量,其数目甚至超过样例数,导致 X X X的列数多于行 数。 X T X X^TX XTX显然不满秩.此时可解出多个解,它们都能使均方误差小化。选择哪个解作为输出将由学习算法的归纳偏好决定, 常见的做法是引入正则化 (regularization) 项。

对数线性回归

目的令模型预测值逼近y的衍生物。例如我们认为示例所对应的输出标记是在指数尺度上变化,则可将输出标记的对数作为线性模型逼近的目标。
l n y = w T x + b ln y=w^Tx+b lny=wTx+b
这里的对数函数起到了将线性回归型的预测值与真实标记联系起来的作用。
在这里插入图片描述

更一般地,考虑单调可微函数 g ( . ) g(.) g(.),令
y = g − 1 ( w T x + b ) y=g^{-1}(w^Tx+b) y=g1(wTx+b)
这样得到的模型称为广义线性模型,其中函数 g ( . ) g(.) g(.)称为联系函数

对数几率回归

目的时应用于分类任务。
答案蕴含在 y = g − 1 ( w T x + b ) y=g^{-1}(w^Tx+b) y=g1(wTx+b)中,只需要找到一个单调可微函数将分类任务的真实标记y与预测值联系起来。
二分类任务:
单位阶跃函数
在这里插入图片描述
但从图可看出,单位阶跃函数不连续,因此不能直接用作式(3.15)
g − ( . ) g^-(.) g(.). 于是我们希望找到能在一定程度上近似单位阶跃函数的**“替
代函数”** ,并希望它单调可微。对数几率函数正是这样一个常用的替代函数:
y = 1 1 + e − z y=\cfrac{1}{1+e^{-z}} y=1+ez1 Sigmoid函数

代入 y = g − 1 ( w T x + b ) y=g^{-1}(w^Tx+b) y=g1(wTx+b)此式

y = 1 1 + e − ( w T x + b ) y=\cfrac{1}{1+e^{-(w^Tx+b)}} y=1+e(wTx+b)1

l n y 1 − y = w T x + b ln\cfrac{y}{1-y}=w^Tx+b ln1yy=wTx+b ( 3.19 ) (3.19) (3.19)

若将y视为样本 x x x作为正例的可能性,则 1 − y 1-y 1y是其反例可能性。两者比值称为几率。

( 3.19 ) (3.19) (3.19)进行改写
l n p ( y = 1 ∣ x ) p ( y = 0 ∣ x ) = w T x + b ln\cfrac{p(y=1\mid{x})}{p(y=0\mid{x})}=w^Tx+b lnp(y=0x)p(y=1x)=wTx+b
显然有:
p ( y = 1 ∣ x ) = e w T x + b 1 + e w T x + b p(y=1\mid{x})=\cfrac{e^{w^Tx+b}}{1+e^{w^Tx+b}} p(y=1x)=1+ewTx+bewTx+b

p ( y = 0 ∣ x ) = 1 1 + e w T x + b p(y=0\mid{x})=\cfrac{1}{1+e^{w^Tx+b}} p(y=0x)=1+ewTx+b1

于是可通过极大似然法来估计 w w w b b b

l ( w , b ) = ∑ i = 1 m l n p ( y i ∣ x i ; w , b ) l(w,b)=\sum_{i = 1} ^mlnp(y_i\mid{x_i};w,b) l(w,b)=i=1mlnp(yixi;w,b)

这个式子的意思是以参数 w b wb wb确定的概率估计越接近于其真实标记越好。
PS:后面的公式太多懒得打了,这些公式大家最好自己推导一遍。对于学习理解有帮助
在这里插入图片描述

优点:特别需注意到,虽然它的名字是"回归",但实际却是一种分类学习方法。
这种方法有很多优点,例如它是直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题
它不是仅预测出"类别",而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用;
此外,对率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解

线性判别分析(LDA)

LDA 的思想非常朴素: 给定训练样例集,设法将样例投影到一条直线上,使得同样例的投影点尽可能接近、异类样例的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定样本的类别。
在这里插入图片描述
前提定义: X i X_i Xi:类示例集合
μ i \mu_i μi:均值向量
∑ i \sum_{i} i:协方差矩阵
观察图像,两类样本的中心在直线上的投影分别为
w T μ 0 w^T\mu_0 wTμ0 w T μ 1 w^T\mu_1 wTμ1
若将所有样本点都投影到直线上,则两类样本的协方差为
w T ∑ 0 μ 0 w^T\sum_{0} \mu_0 wT0μ0 w T ∑ 1 μ 1 w^T\sum_{1}\mu_1 wT1μ1
目的希望同类样例的投影点尽可能接近,即同类样本的协方差尽可能小
希望异类样本的投影点尽可能远离,即类中心之间的距离( ∥ w T μ 0 − w T μ 1 ∥ 2 2 \Vert w^T\mu_0- w^T\mu_1\Vert_2^2 wTμ0wTμ122)尽可能大
在这里插入图片描述
对于3.33式的计算,参照协方差矩阵
在这里插入图片描述

好,得出阶段性目标
最大化
J = w T S b w w T S w w J=\cfrac{w^TS_bw}{w^TS_ww} J=wTSwwwTSbw
依据这个式子,如何确定 w w w
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多分类任务中的LDA

在这里插入图片描述
多分类LDA将样本投影到 d ′ d' d维空间, d ′ d' d通常远小于数据原有的属性 d d d。于是,可通过投影减小样本点维数,且投影过程中使用了类别信息。LDA是一种经典的监督降维技术

多分类学习

多分类学习的基本思路是”拆解法“。将多分类任务拆为若干个二分类任务求解。
在这里插入图片描述

OvR、OvO

在这里插入图片描述
区别:容易看出,OvR 只需训练 N N N个分类器 OvO 需训练 N ( N − 1 ) / 2 N(N - 1)/2 N(N1)/2 个分类器。因此,OvO的存储开销和测试时间开销通常比 OvR 更大。但在训练时,OvR 的每个分类器均使用全部训练样例,而 OvO 的每个分类器仅用到两个类的样例,因此,在类别很多时, OvO 的训练时间开销通常比 OvR 更小 至于预测性能则取决于具体的数据分布,在多数情形下两者差不多。

MvM

MvM 是每次将若干个类作为正类,若干个其他类作为反类。显然, OvO、OvR 是MvM 的特例。MvM 的正、反类构造必须有特殊的设计,不能随意选取。这里我们介绍 种最常用的 MvM 技术"纠错输出码" (ECOC)。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/117851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DHCP学习

目录 DHCP基本认识和原理 场景一、同网段DHCP 场景二、不同段DHCP(中继DHCP) DHCP基本认识和原理 DHCP(Dynamic Host Configuration Protocol动态主机协议)。 作用:为局域网络中主机动态分发地址,以及…

INMP441麦克风芯片--支持I2S、ESP32

1.简介 INMP441是InvenSense公司推出的一款具有底部端口的高信噪比、低功耗、数字输出的全向MEMS麦克风,信噪比高达61dB,使其成为近场应用的绝佳选择。INMP441的电路结构如图所示,包括MEMS声音传感器、模数转换器(ADC&#xff09…

人工智能的2022:技术的价值在于生产力

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注…

孤独的照片(思维)

Farmer John 最近购入了 NN 头新的奶牛,每头奶牛的品种是更赛牛(Guernsey)或荷斯坦牛(Holstein)之一。 奶牛目前排成一排,Farmer John 想要为每个连续不少于三头奶牛的序列拍摄一张照片。 然而&#xff0…

初识Kubernetes:(2)Kubernetes环境搭建

初识Kubernetes:(2)Kubernetes环境搭建1 环境规划1.1 集群类型1.2 安装方式2 环境搭建2.1 minikube安装2.2 启动集群3 服务部署1 环境规划 1.1 集群类型 Kubernetes集群大致分为两类:一主多从和多主多从。 一主多从&#xff1a…

UE4 shader编程 基础学习笔记 --- 熟悉各个节点

Texture Sample:用所需要的纹理覆盖到Mesh上,展示效果,Mesh上存在漫反射 高光 环境变量的和制造出了左上角的纹理光照效果 该节点只能设置其黑白效果 0为黑,1为白 该节点可以调节R、G两个参数 该节点可以调节RGB三个参数 该节…

C#---第十八课:Debug调试技巧--Debug类、pin 、add watch、拖动断点、修改变量、两个断点的联动

文章目录1. 在output窗口中输出变量的内容----Debug类2. Pin变量 / add watch 实时监控变量的变化(1) pin to sources(2) add watch3. 自由拖动黄色箭头图标4. 直接修改变量的值5. 两个断点的联动(当一个断点触发,另一个断点才会触发debug)1.…

变革:区块链上的政府和企业应用

发表时间:2022年5月12日 信息来源:coingeek.com 区块链只与数字货币和金融交易挂钩的时代已经过去了。这项技术在过去十年中不断发展,今天,它为游戏、社交媒体应用、医疗保健以及供应链管理等多个领域提供着支持。相比其它领域&am…

SpringBoot 整合【Mybatis-Plus实现分页查询】

目录 1. 添加pom.xml依赖 2. 配置application.yml文件 3. mybatis-plus插件配置核心类 4. 启动类配置 5. 测试数据Sql脚本 6. mybatis-plus代码生成 7. 测试分页查询 1. 添加pom.xml依赖 <!--mybatis-plus--><dependency><groupId>com.baomidou</g…

Weighted Logistic Regression和Youtube时长预估

前段时间阅读了youtube的经典论文《Deep Neural Networks for YouTube Recommendations》&#xff0c;其通过weighted LR来实现时长预估&#xff0c;在其原文中对实现的描述非常短&#xff0c;大概意思是在损失函数中&#xff0c;对正例&#xff08;点击&#xff09;的交叉熵项…

中断的分类,中断指令,中断类型码,中断向量表,中断优先级

目录 PC机的中断系统 中断的分类 内部中断&#xff08;软件中断&#xff09; 故障 陷阱 异常终止 中断指令 指令类型中断指令 INT N 溢出中断指令 INTO 中断返回指令 IRET 外部中断&#xff08;硬件中断&#xff09; 非屏蔽中断&#xff08;NMI&#xff09; 可…

Springboot实现定时任务调度

前言 今天给大家分享一下&#xff0c;如何使用springboot快速实现简单的定时调度任务&#xff1f;有两种方法&#xff1a;基于注解的声明式调度任务注册&#xff1b;另外一种是基于实现SchedulingConfigurer的编程式的调度任务注册。 1. 基于注解&#xff08;Scheduled&#…

Problem Set 2

Regularized Normal Equation for Linear Re-gression Given a data set {ar(), y()}i1,.-.,m with x()∈ R" and g(∈ R, the generalform of regularized linear regression is as follows n (he(zr)- g)3入>0号 (1) ” 2m i1 j1 Derive the normal equation. 设 X[(…

P7 PyTorch 属性统计

目录 Norm min max argmax argmin prod sum dim keepdim topk & kthvalue eq&equal一 Norm 作用&#xff1a; 求范数 1.1 1阶范数 # -*- coding: utf-8 -*- """ Created on Thu Dec 22 21:48:02 2022author: cxf """ import torc…

前端_Vue_8.生命周期钩子、侦听器

文章目录一、生命周期钩子1.1. 注册生命周期钩子1.2. 生命周期图示二、侦听器2.1. 基本示例2.2. 深层侦听器2.3. 即时回调的侦听器2.4. 回调的触发时机2.5. this.$watch()2.6. 停止侦听器一、生命周期钩子 每个Vue组件实例在创建时都需要经历一系列的初始化步骤&#xff0c;比…

重要升级:SpreadJS 16.0 crack SpreadJS 2023

SpreadJS 16.0 crack&#xff0c;建议大家赶紧升级&#xff0c;速度提升65% Adds enhancements for TableSheet, Designer, Calculation, Shape and Workbook. December 22, 2022 - 16:53New Version Features New File Format New .sjs file format makes the ExcelIO process…

Java语法:final关键字

一、final是什么&#xff1f; final关键字是最终的意思&#xff0c;可以修饰&#xff08;类、方法、变量&#xff09;。 二、final的作用 修饰类&#xff1a;表明该类是最终类&#xff0c;不能被继承&#xff1b; 报错说明&#xff1a;不发从最终的Animal类继承 修饰方法&…

数论专题(2)莫比乌斯反演

今天我们开始莫比乌斯反演的学习.这篇博文特别多的公式,强迫症患者请勿观看 莫比乌斯反演 莫比乌斯函数: 定义莫比乌斯函数,当时,. 当是square-free number时,设的质因数分解有项,则; 否则,; 根据上面,我们不难验证也是积性函数 定理 ,即和互为彼此的逆 证明 设n的不…

4.防止数据权限越权

涉及的修改 这次提交内容很简单&#xff0c;就是在这些类的操作上&#xff0c;添加了 checkXxxDataScope()方法校验&#xff0c;下面来看下这个方法的实现 /*** 校验用户是否有数据权限* * param userId 用户id*/ Override public void checkUserDataScope(Long userId) {if (…

RMQ延迟队列

目录一、场景二、TTL和DLX三、开发步骤一、场景 “订单下单成功后&#xff0c;15分钟未支付自动取消” 1.传统处理超时订单 采取定时任务轮训数据库订单&#xff0c;并且批量处理。其弊端也是显而易见的&#xff1b;对服务器、数据库性会有很大的要求&#xff0c; 并且当处理大…