《机器学习》周志华-CH6(支持向量机)

news2024/9/20 14:43:12

6.1间隔与支持向量

  给定训练样本 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } , y i ∈ { − 1 , + 1 } D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\},y_i\in\{-1,+1\} D={(x1,y1),(x2,y2),...,(xm,ym)},yi{1,+1}分类学习最基本的想法是基于训练集 D D D在样本空间找到一个划分超平面,将不同类别样本分析。

在这里插入图片描述

  应该找位于两类训练样本“正空间”的划分超平面,如红色的,泛化能力最强,鲁棒性最强。

  划分超平面可通过如下线性方程描述:
w T x + b = 0 \begin{equation} w^Tx+b=0 \tag{6.1} \end{equation} wTx+b=0(6.1)

   w = ( w 1 , ; w 2 ; . . . w d ) w=(w_1,;w_2;...w_d) w=(w1,;w2;...wd)为法向量, b b b为维向量,决定超平面与原点之间距离

  划分超平面由法向量 w w w和位移 b b b确定,记为 ( w , b ) (w,b) (w,b)

  任意点 x x x到超平面 ( w , b ) (w,b) (w,b)的距离可写为:
r = ∣ w T x + b ∣ ∣ ∣ x ∣ ∣ \begin{equation} r=\frac{|w^{T}x+b|}{||x||} \tag{6.2} \end{equation} r=∣∣x∣∣wTx+b(6.2)
  假设超平面 ( w , b ) (w,b) (w,b)可将训练样本正确分类
在这里插入图片描述

  欲找到具有“最大间隔”(maximum margin)的划分超平面,也就是要找满足约束的 w w w b b b,使得 γ \gamma γ最大,即:
在这里插入图片描述

6.2对偶问题

  求解(6.6)来得到最大划分对应模型
在这里插入图片描述

  解出 α \alpha α后,求出 w w w b b b即可得模型

f ( x ) = w T + b = ∑ i = 1 m α i y i x i T x + b \begin{equation} f(x)=w^T+b=\sum_{i=1}^m\alpha_{i}y_{i}x_{i}^{T}x+b \tag{6.12} \end{equation} f(x)=wT+b=i=1mαiyixiTx+b(6.12)
在这里插入图片描述

  对任意训练样本 ( x i , y i ) (x_i,y_i) (xi,yi)总有 α i = 0 \alpha_i=0 αi=0 y i f ( x i ) = 1 y_if(x_i)=1 yif(xi)=1

  若 α i = 0 \alpha_i=0 αi=0,则样本不会在(6.12)中出现,不会对 f ( x ) f(x) f(x)有影响

  若 α i > 0 \alpha_i>0 αi>0,则必有 y i f ( x i ) = 1 y_if(x_i)=1 yif(xi)=1,对应样本点位于最大间隔边界上,是支持向量。

  支持向量机性质:

  训练完成后,大部分训练样本都不需要保留,最终模型仅与支持向量有关。

  如何求解(6.11)?

  二次规划算法正比于训练样本数,会造成较大开销。

  SMO(Sequential Minimal Optimization)是高效算法,著名代表。

  SMO基本思路:

  先固定 α i \alpha_i αi之外的所有参数,然后求 α i \alpha_i αi上的极值。

在这里插入图片描述

  参数初始化后,SMO不断执行如下两个步骤至收敛:

  • 选取一对需更新的变量 α i \alpha_i αi α j \alpha_j αj
  • 固定 α i \alpha_i αi α j \alpha_j αj以外的参数,求解(6.11)获得更新后的 α i \alpha_i αi α j \alpha_j αj

  KKT条件违背的程度越大,则变量更新后可能导致的目标函数值减幅越大

  使选取的两变量所对应样本之间的间隔最大

  SMO高效因为在固定其他参数后,优化两个参数的过程能做到非常高效

  仅考虑 α i \alpha_i αi α j \alpha_j αj时,(6.11)约束可写为:

在这里插入图片描述

6.3核函数

在这里插入图片描述

  可将样本从原始空间映射到一个更高维的特征空间

  如果原始空间是有限维,属性数有限,一定存在一个高维特征空间使样本可分:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  (6.24)显示模型最优解可通过训练样本的核函数展开,亦称“支持向量展开式”

  若已知合适映射 ϕ ( ⋅ ) \phi(\cdot) ϕ()的具体形式,则可写成核函数 κ ( ⋅ , ⋅ ) \kappa(\cdot,\cdot) κ(,)

  定理6.1(核函数):

  令 χ \chi χ为输入空间, κ ( ⋅ , ⋅ ) \kappa(\cdot,\cdot) κ(,)是定义在 χ × χ \chi\times\chi χ×χ对称函数,则 κ \kappa κ是核函数当且仅当对于任意数据 D = { x , , x 2 , . . . , x m } D=\{x_,,x_2,...,x_m\} D={x,,x2,...,xm},“核矩阵”(kernel matrix) K K K总是半正定的;

  只要一个对称函数所对应的矩阵半正定,它总能作为核函数使用

  对于一个半正定核矩阵,总能找到一个与之对应的映射 ϕ \phi ϕ

  任意一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”(Reproducing Kernel Hilbert Space,简称RKHS)的特征空间

  我们希望样本在特征空间内线性可分,因此特征空间的好坏对支持向量机的性能至关重要。

在这里插入图片描述

  也可通过函数组合得到:

  • κ 1 \kappa_1 κ1 κ 2 \kappa_2 κ2为核函数,则对于任意正数 γ 1 、 γ 2 \gamma_1、\gamma_2 γ1γ2,其线性组合
    γ 1 κ 1 + γ 2 κ 2 也是核函数 \begin{equation} \gamma_1\kappa_1+\gamma_2\kappa_2 \quad\quad\quad也是核函数 \tag{6.25} \end{equation} γ1κ1+γ2κ2也是核函数(6.25)
  • κ 1 \kappa_1 κ1 κ 2 \kappa_2 κ2为核函数,则核函数的直积

κ 1 ⊗ κ 2 ( x , z ) = κ 1 ( x , z ) κ 2 ( x , z ) 也是核函数 \begin{equation} \kappa_1\otimes\kappa_2(x,z)=\kappa_1(x,z)\kappa_2(x,z) \quad\quad\quad也是核函数 \tag{6.26} \end{equation} κ1κ2(x,z)=κ1(x,z)κ2(x,z)也是核函数(6.26)

  • κ 1 \kappa_1 κ1为核函数,则对于任意函数 g ( x ) g(x) g(x)

κ 1 ( x , z ) = g ( x ) κ 1 ( x , z ) g ( z ) 也是核函数 \begin{equation} \kappa_1(x,z)=g(x)\kappa_1(x,z)g(z) \quad\quad\quad也是核函数 \tag{6.26} \end{equation} κ1(x,z)=g(x)κ1(x,z)g(z)也是核函数(6.26)

6.4软间隔与正则化

  前面讨论在,假定存在一个超平面可将不同类样本完全分开。然而,现实中很难出现这种完美情况,缓解该问题办法是允许支持向量机在一些样本上出错,引出“软间隔”(soft margin)概念。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述在这里插入图片描述

  能否用对率损失函数来替代损失函数?

  • 支持向量机与对率回归优化目标相近,通常性能相当
  • 优势在于输出具有自然的概率意义
  • 对率回归可直接用于多分类任务
  • 对率回归的解依赖于更多的训练样本,预测开销更大

在这里插入图片描述
在这里插入图片描述

6.5支持向量回归

  给定训练样本 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } , y i ∈ R D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\},y_i\in{R} D={(x1,y1),(x2,y2),...,(xm,ym)},yiR,希望学得一个形如(6.7) f ( x ) = w T + b f(x)=w^T+b f(x)=wT+b的回归模型,使得 f ( x ) f(x) f(x) y y y尽可能相近, w , b w,b w,b得求。

  支持向量回归(Suport Vector Regressiom,SVR) 假设完美能容忍 f ( x ) f(x) f(x) y y y之间最多有 ξ \xi ξ的偏差,仅当 f ( x ) f(x) f(x) y y y之间差别绝对值大于 ξ \xi ξ才计算损失。
在这里插入图片描述

  相当于以 f ( x ) f(x) f(x)为中心,构建了一个宽度为 ξ \xi ξ的间隔带,若落入此带,则认为被预测正确,带中不计算损失
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

  观察(6.52),仅当样本不落入间隔带中,相应的

  将(6.47)代入(6.7) f ( x ) = w T x + b f(x)=w^Tx+b f(x)=wTx+b中,则SVR解形如:
在这里插入图片描述
在这里插入图片描述

6.6核方法

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

  

  

  

  

  

  

  

  

  

  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103847.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SQL优化神器 SQLAdvisor

简介 SQLAdvisor是一款开源的SQL优化工具,由美团点评公司的技术工程部DBA团队开发与维护。作为一个分析SQL语句并提出索引优化建议的工具,它基于MySQL原生词法解析,结合SQL中的where条件、字段选择度、聚合条件、多表Join关系等,…

爆改YOLOv8|利用yolov10的C2fCIB改进yolov8-高效涨点

1,本文介绍 本文介绍了一种改进机制,通过引入 YOLOv10 的 C2fCIB 模块来提升 YOLOv8 的性能。C2fCIB 模块中的 CIB(Compact Inverted Bottleneck)结构采用了高效的深度卷积进行空间特征混合,并使用点卷积进行通道特征…

PLM系统在企业数字化转型中的关键作用 三品PLM在制造业转型实例分析

在当今数字化时代,企业面临着日益激烈的市场竞争和快速变化的客户需求。为了保持竞争力并实现可持续发展,企业纷纷进行数字化转型。而PLM产品生命周期管理系统作为数字化转型的关键组成部分,其在企业中的应用显得尤为重要。本文将探讨PLM系统…

AAA原理与配置

定义 AAA是Authentication(认证)、Authorization(授权)和Accounting(计费)的简称,是网络安全的一种管理机制,提供了认证、授权、计费三种安全功能。 这三种安全功能的具体作用如下…

Java如何计算一个数的阶乘末尾有多少个零?

文章有点长,请耐心看完~~~ 这个问题涉及到阶乘(factorial)的一个有趣特性,即阶乘结果末尾零的数量。要理解这一点,我们首先要知道什么情况下一个数的末尾会产生零。 什么情况下一个数的末尾会产生零 在十进制数制中…

代码随想录训练营day35|46. 携带研究材料,416. 分割等和子集

46. 携带研究材料 思路:用一个数组来记录?dp[i]带i件物品的最大价值 好吧,这里用的是一个二维数组dp[i][j],表示从[0,i]的物间任选武平,能用容量为j的背包装下的最大价值 重量 价值 物品0 1 15 物品1 3 2…

AI绘画|Stable Diffusion高质量提示词收集(附提示词手册以及提示词插件)

使用平台:comfyui 模型:AlbedoBase-XL 图片尺寸:768x1280 提示词万字手册,可以扫描下方,免费获取 图1 提示词 an attractive rough cyborg woman with a serious look in her eyes, messy conceptual felt-tip pen (drawing:1.3) by (Yoji Shinkawa:…

“三年级英语”暴增5亿搜索量?需求来了!附2个极品AI吸粉玩法!

家人们!在英语细分领域,一直都是付费知识中的风口黄金大赛道。 而这两天“英语”这个关键词,在微信指数上的日搜索量突然猛增到5个亿。 这两天全网热词“三年级英语”,日环比搜索指数更是486.2%增长率,一天时间内就增…

vsftpd的安装和配置

目录 vsftpd的下载与配置 下载vsftpd vsftpd的配置 测试服务的功能 vsftpd的下载与配置 下载vsftpd rpm -qc vsftpd,检查vsftpd安装包是否存在,存在则不需要安装。 yum install -y vsftpd,不存在则yum安装vsftpd。 安装成功 vsftpd的…

早上醒来嗓子干、喉咙痛、咳嗽……快用这个润养好物,给嗓子做个spa,让身体润起来~

进入秋季,很多人出现了眼睛干涩、大便干燥、嘴唇干裂、咽喉疼痛等症状,虽说这些还能够忍受,但它却影响了正常的饮食和休息。 秋季气候干燥,外界燥邪侵犯肺部,易伤津液,肺失滋润,清肃失司&#x…

宣布 Vue 3.5 版发布

宣布 Vue 3.5 版发布 今天我们很高兴地宣布 Vue 3.5 版“天元突破红莲螺岩”正式发布! 这一小版本发布没有破坏性更改,包括内部改进和一些有用的新特性。我们将在这篇博客中介绍一些亮点 - 详细的更改和新特性请查阅 GitHub 上的完整变更日志。 响应式…

单片机上搭配的SPI NOR FLASH容量告急!扩容新选择

文章目录 前言:正文: 为便于理解并省去容量单位转换的麻烦,以下容量单位均使用Byte单位(128Mbit16MByte) 前言: NOR FLASH 是市场上两种主要的非易失闪存技术之一。Intel于1988年首先开发出NOR Flash 技术…

代码审计总结

代码审计总结 概述 一、代码审计 1.1什么是代码审计? 1.2为什么要执行代码审核? 1.3代码审计的好处 二、代码审计流程 2.1代码检查方法 2.2代码检查项目 2.3编码规范 2.4代码检查规范 2.5缺陷检查表 2.6代码审计复查 2.7代码审计结果总结 三…

由一个 SwiftData “诡异”运行时崩溃而引发的钩深索隐(一)

概述 从 WWDC 23 开始,苹果推出了全新的数据库框架 SwiftData。它借助于 Swift 语言简洁而富有表现力的特点,抛弃了以往数据库所有的额外配置文件,只靠纯代码描述就可以干脆利索的让数据库的创建和增删改查(CRUD)一气…

10分钟了解OPPO中间件容器化实践

背景 OPPO是一家全球化的科技公司,随着公司的快速发展,业务方向越来越多,对中间件的依赖也越来越紧密,中间件的集群的数量成倍数增长,在中间件的部署,使用,以及运维出现各种问题。 1.中间件与业…

CAD图纸防泄密有哪些方法?五个防泄密方法分享

CAD图纸作为工程设计的重要资料,其防泄密工作至关重要。以下将分享五个有效的CAD图纸防泄密方法,旨在确保图纸的安全性和机密性。 1. 使用CAD软件自带的加密功能 大多数CAD软件,如AutoCAD,都内置了加密功能。在保存CAD图纸时&am…

MySQL主从复制(Linux篇)

1.概述 MySQL的主从复制(Master-Slave Replication)是一种数据复制解决方案,将主数据库的DDL和DML操作通过二进制日志传到从库服务器中,然后在从库上对这些日志重新执行(也叫重做),从而是的从库…

MES系统:现代工厂生产车间的科技与管理创新

一、现代工厂生产车间:高度集成、自动化与智能化 在当今这个日新月异的工业时代,工厂生产车间已经远远超越了传统意义上的简单生产线概念,它们正逐步演变为一个高度集成、自动化与智能化的生态系统。这一变革不仅极大地提升了生产效率&#…

实战项目:俄罗斯方块(七)

文章目录 🍊自我介绍🍊图形存储及输出设置类型设计图形输出代码设计要实现的结果展示user_global.c(全局变量的C文件)user_print.huser_print.cmain.c 你的点赞评论就是对博主最大的鼓励 当然喜欢的小伙伴可以:点赞关注评论收藏(一…

股指期货与股指期权为什么是熊市中的风险管理利器?

在如今波动剧烈的熊市环境中,期货市场的多空双边机制和T0的交易制度显得尤为灵活和必要。对于投资者而言,利用期货市场对冲股票现货风险成为了一种重要的策略。在期货市场中,股指期货、股指期权以及股票期权是三大得力工具,它们为…