周志华机器学习(6):支持向量机

news2025/4/15 22:16:51

周志华机器学习(6):支持向量机

  • 6 支持向量机
    • 6.1 间隔与支持向量
    • 6.2 对偶问题(dual problem)
    • 6.3 核函数
    • 6.4 软间隔与正则化

基本是大段摘录加上一些自己的补充,去除了冗余的话。

6 支持向量机

6.1 间隔与支持向量

给定训练样本集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , ⋯   , ( x m , y m ) } D=\{(\boldsymbol x_1,y_1),(\boldsymbol x_2,y_2),\cdots,(\boldsymbol x_m,y_m)\} D={(x1,y1),(x2,y2),,(xm,ym)} y ∈ { − 1 , + 1 } y\in\{-1,+1\} y{1,+1}, 分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。但能将训练样本分开的划分超平面可能有很多,所以应该努力去找划分结果最鲁棒的那个平面,也就是图6.1中中间那条加粗的。
在这里插入图片描述
这张图中,两个轴 x 1 x_1 x1 x 2 x_2 x2 x \boldsymbol x x 的属性,这里假定有两个属性。其实应该加上垂直于纸面表示标记的y轴,在这里,从y轴垂直往下看,y轴被压缩成了一个点。划分超平面公式:
在这里插入图片描述
在这里插入图片描述
如图6.2所示,距离超平面最近的这几个训练样本点使式(6.3)的等号成立,它们被称为“支持向量”(support vector),两个异类支持向量到超平面的距离之和为:
在这里插入图片描述
这个约束就是式(6.3)的变种。式(6.5)可以重写为:
在这里插入图片描述

6.2 对偶问题(dual problem)

拉格朗日:通过拉格朗日的办法重新定义一个无约束问题这个无约束问题等价于原来的约束优化问题,从而将约束问题无约束化。
如果原始问题求解棘手,在满足KKT的条件下用求解对偶问题来代替求解原始问题,使得问题求解更加容易。
对偶问题的上界在KKT条件下等于原始问题的下界,因为原问题求解太复杂,就可以在满足KKT条件下求解对偶问题。
拉格朗日对偶问题(Lagrange duality)

希望求解式(6.6),用拉格朗日乘子法得到其对偶问题,就是对每一个约束都添加拉格朗日乘子 α i ≥ 0 \alpha_i\geq 0 αi0,则拉格朗日函数为:
在这里插入图片描述
在这里插入图片描述

如何求解式(6.11)?——SMO(Sequential Minimal Optimization)
在这里插入图片描述

6.3 核函数

现实任务中,原始样本空间内也许并不存在一个能正确划分两类样本的超平面。
可将样本从原始空间映射到一个更高维的特征空间,使其在更高维特征空间内线性可分。
如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分。

在特征空间划分超平面对应的模型:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
式(6.24)显示出模型最优解可通过训练样本的核函数展开,这一展式亦称“支持向量展式”(supportvector expansion). .

显然,若已知映射 ϕ ( ⋅ ) \phi(\cdot) ϕ()的具体形式,则可写出核函数 κ ( ⋅ , ⋅ ) \kappa(\cdot,\cdot) κ(,)
但在现实任务中我们通常不知道 ϕ ( ⋅ ) \phi(\cdot) ϕ()是什么形式,是否存在合适的核函数?什么样的函数能做核函数?定理如下:
在这里插入图片描述

核函数选择是SVM的最大变数,几种常用的核函数:
在这里插入图片描述
核函数还可以通过核函数的线性组合、直积、对核函数进行函数操作来得到。

6.4 软间隔与正则化

软间隔(soft margin):现实任务中很难有合适的核函数使得训练样本在特征空间中线性可分,即使有,也可能是过拟合。
在这里插入图片描述
上图中(6.3)的约束被写为一个不等式,即为式(6.28)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

还可以把式(6.29)中的0/1损失函数换成别的替代损失函数以得到其他学习模型,这些模型的性质与所用的替代函数直接相关:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/29004.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实体店应该围绕什么核心来打造自己体系多模式多平台的生态

大家好,我是阿璋,阿璋时不时会发布一些创新的电商资讯,经过电商与疫情的反复摧残,实体商家的收益大不如从前,营业额一跌再跌,迎来实体寒潮,本期给大家分享一个实体店结合共享消费积分联盟广告生…

封神之作,超火Java面试突击手册,进大厂真的就这么简单?

2022年的互联网行业竞争越来越严峻,面试也是越来越难,一直以来我都想整理一套完美的面试宝典,奈何难抽出时间,这套完整的java后端学习路线以及1000道的Java面试手册我整理了整整1个月,上传到Git上目前star数达到了30K …

MCE | 阿尔兹海默症发病机制

阿尔兹海默症 (Alzheimers Disease, AD),俗语常说的“老年痴呆症”,在奥斯卡提名短片《勿忘我》中以动画形式展现出了阿尔兹海默症患者的世界,动画中的老人,逐渐失去自己的记忆,甚至忘记最爱的人,他的脑海中…

学习软件测试需要注意的几点

⒈ 测试主页技能掌握 关于软件测试,所需要的专业技能: l 基础测试技术:黑盒测试、白盒测试、测试用例设计等; l 软件测试方法:单元测试、功能测试、集成测试、系统测试、性能测试; l 软件测试知识:基础的测试流程管理、…

孩子没有感统失调的表现,还有必要做感统训练吗?

孩子没有感统失调表现,是不是就可以放心了? 孩子训练一段时间,进步非常大,是不是就不需要再继续做训练了? 答案是:无论孩子能力发展如何,感统训练都必不可少。 为什么每个孩子都需要感统训练…

Git——IDEA集成GitHub详细操作

目录 一、 设置GitHub账号 二、分享项目到GitHub 三、push推送本地库到远程库 3.1 第一种方法: 3.2 第二种方法:SSH 四、pull拉取远程库到本地库 五、clone克隆远程库到本地 一、 设置GitHub账号 可以使用下面这个token登录,第一个太慢太慢…

CodeBlocks C++开发环境的配置及使用

CodeBlocks C开发环境的配置及使用 本文引用自作者编写的下述图书; 本文允许以个人学习、教学等目的引用、讲授或转载,但需要注明原作者"海洋饼干叔 叔";本文不允许以纸质及电子出版为目的进行抄摘或改编。 1.《Python编程基础及应用》&#x…

前端开发性能优化方案-14条

1、减少http请求数量。 单独得一个图片,js,css都是一个请求,将同类合并可以有效得减少请求个数。 2、使用CDN(内容分发网络) 需要新增服务器减少请求得站点个数(靠钱解决需要买服务器)。 3、添加Expire/Cache-Control头 Expi…

GitHub标星百万的程序员转架构之路,竟被阿里用作内部晋升参考

架构师是很多程序员的奋斗目标,也可以说是职场生涯的一个重要选择方向,今天我就跟大家聊一聊如何从一个程序员成长为一个架构师。 首先我们先来看看架构师的定义到底是什么? 系统架构师是一个不仅需要主持整体又得需体察局部瓶颈并且依据详…

Vulkan API的性能及兼容性

1)Vulkan API的性能及兼容性 ​2)FrameTiming.gpuFrameTime获取GPU耗时有什么条件 3)MMO里面的寻路网格如何制作 4)万国这种联盟边界的实现思路 这是第314篇UWA技术知识分享的推送。今天我们继续为大家精选了若干和开发、优化相关…

(九)笔记.net学习之委托和事件、多播委托、观察者模式

1.委托得声明、实例化和调用 (1)委托:本质是一个类,继承自System.MulticastDelegate,里面内置了几个方法,如构造函数等。 (2)声明委托:委托无方法体,可以有返回值或参数…

Linux文件系统和软硬连接

目录 1.文件组成 2.文件系统 3.软硬连接 1.文件组成 先来看看文件的属性部分: 文件属性由权限,硬连接数量,所属组,所属人,大小和修改时间构成。 再来看看文件由的一个的东西inode 793395 793328就是inode 2.文件系…

聚观早报 |中国企业成世界杯最大金主;马斯克恐失去世界首富位置

今日要闻:中国企业成世界杯最大金主;马斯克恐失去世界首富位置;刘强东称对不起京东高管;苹果在沪最大代工厂重启招工;威马汽车上海全员工资打折中国企业成世界杯最大金主 据报道,作为全球最为瞩目的赛事之一…

谁懂,java后端面试多次惨败并发的苦!幸好有阿里首发并发编程学习文档,系统全面还便于上手!

什么是并发 并发指的在操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行。 并发和并行是十分容易混淆的概念。并发指的是多个任务交…

如何测试 esp-matter_example_light 例程

此例程支持三种配网方式: 苹果手机扫码配网chip-tool 命令配网Matter 指令配网 1 使用苹果手机扫码配网 说明文档:Apple Matter 测试方法 所需设备: 苹果手机(最新版本 IOS 系统)苹果音响(Apple-Matter&a…

【文本挖掘】业绩预告原因·其一

下载数据及提取信息 在此单列前15行: 000001,平安银行,预计本公司2006年度净利润与上一年度相比将增长300%-350%。2)业绩变化原因:利润的显著增长主要是由于利差的改善、资金运用效率的提高和贷款的良好增长,不良资产的成功清收和资产质量的…

基于PHP+MySQL企业网站的设计与开发

现如今,企业网站是商业贸易中的一条非常重要的道路,可以把其从传统的实体模式中解放中来,让用户足不出户就了解到企业的各种信息,为用户提供了极大的方便,网新帮德网站的主要功能包含:企业简介,新闻功能信息,企业业务信息,在线留言等功能。网站分为管理员、会员用户…

计算机组成原理期末复习第三章-1(唐朔飞)

计算机组成原理期末复习第三章-1(唐朔飞) ✨欢迎关注🖱点赞🎀收藏⭐留言✒ 🔮本文由京与旧铺原创,csdn首发! 😘系列专栏:java学习 💻首发时间:&am…

Ubuntu 20.04安装ipopt和cppAD(安装全流程+报错解决)

文章目录参考资料1. Ipopt安装1. 方式1: 命令行安装2. 方式2:源码安装3. 方式3:源码安装4. Ipopt测试5. 报错修复2. CppAD安装1. 方式1:命令行安装2. 方式2:源码方式安装3. CppAD测试3. 测试Ipopt与CppAD是否可用1. 例…

uni——app、H5省市区选择

案例演示 步骤 封装的组件&#xff0c;之后引用组件。 父&#xff1a; <pickerAddress change"change"><input type"text" placeholder"请选择所在地区" :value"value" /><image :src"$common.image(/static/p…