从数学角度理解SVM分类算法

news2024/9/25 17:14:07

再谈间隔最大化

我们知道,支持向量机是以“间隔”作为损失函数的,支持向量机的学习过程就是使得间隔最大化的过程,若想要了解支持向量机的运转机制,首先就得知道间隔怎么计算。

“间隔大小”是由距离分类“界限”最近的两个数据点(即支持向量)决定的。支持向量机对“间隔”的定义非常简单,即处于最边缘的支持向量(样本点)到超平面距离的总和,这里所说的距离就是最常见的几何距离。如果我们用 wx+b 来表示超平面,那么点到三维平面的距离公式如下:
 



由此也可以推断出点到 N 平面的通式,如下所示:

点到n维平面的距离

注意:上述公式中被除数是分子,除数是 L2 范式的简要写法,当 i = 3 时,与上述点到三维平面的距离公式相同。

支持向量机算法使用 y =1 来表示正类的分类结果;使用 y = -1 来表示负类结果,所以 y =  wx+b 要么是大于或者等于 1,要么小于或等于 -1,由此得出间隔距离也可以表示如下:
 

通用距离公式


上述距离公式中被除数是 2 (常数),而我们的目的是要求间隔最大化距离,因此式子转换如下:
 

求得最大间隔距离


即求 max 1/||w|| 的最大值。此处需要注意,其中 s.t. 表示受约束的(即在某种条件下),上述公式要使左边式子最大,就要使分母越小,因为此处的分子是不变(常数),所以可将上述表达式转换为下列式子:
 

间隔最最大化


下面使用“拉格朗日乘子法”对上述表达式进一步转换:
 

拉格朗日乘子算法


 

上述公式中,α 被称为“拉格朗日乘子”,然后分别对上式子中的 w 和 b 求导,并令导数为 0,右侧的公式可表示为:


 

svm支持向量机


 

这时就转变成如何求极值的问题:
 

svm支持向量机


注意上式中的  xiTxj 是一组向量的内积运算,该式子的约束条件为:

SVM只是向量机


通过拉格朗日乘子法和 SMO(二次规划算法)算法,求出的最大间隔。

注意:拉格朗日乘子算法(以数学家 Joseph-Louis Lagrange 的名字命名)是一种多元函数在其变量受到一个或多个条件的约束时求极值方法。 这种方法可以将一个有 n 个变量与 k 个约束条件的最优化问题转换为一个解有 n + k 个变量的方程组的解的问题。关于拉格朗日乘子算法不做过多介绍,如感兴起可点击前往进行了解。

上述过程中涉及了大量数学概念和的数学运算,这些知识理解起来会比较繁琐,需要慢慢消化,甚至需要您恶补一些数学知识。如果实在看不懂,建议跳过,毕竟这些知识不会影响您使用支持向量机算法。

再谈核函数

高维映射说白了就是一种函数映射,在支持向量机中通常采用符号φ来表示这个函数,比如向量 xi 经过高维映射后就变成了  φ(xi),依次类推超平面的表达式如下所示:
 


在求解间隔最大化时,我们使用了拉格朗日函数,转化后的式子涉及了向量的内积运算,那么经过核函数映射后的内积运算为:
 


映射后向量变成高维向量,运算量将明显增加,直接运算会导致效率明显下降。不过,在间隔最大化的运算中只使用了高维向量内积运算的结果,并没有单独使用高维向量,也就是说,如果能简单地求出高维向量的内积,那么也可以满足求解间隔最大化的条件。下面假设存在函数 K,能够满足下列条件:
 

核函数转换


这里的函数 K 就是我们前面所讲的核函数。有了核函数,所有涉及的内积运算到的表达式,都可以通过 K 函数求解得出。

注意:对于已知的映射函数 φ,核函数是很容易计算的,但在大多数情况下,我们并不知道映射函数 φ 的具体形式,好在伟大的数学家们已经证明,在无法得出 φ 时,只要数学函数满足几个相应条件,同样可以将其作为核函数,因此不用担心找不到核函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1971181.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《计算机网络》(第8版)第1章 概述 复习笔记

第 1 章 概述 一、计算机网络在信息时代中的作用 计算机网络的两个重要功能: 1 .连通性 指互联网上的用户之间是相互连通的。 2 .共享(资源共享) 资源共享可以是信息共享、软件共享,也可以是硬件共享。此…

Meta新功能生成式AI意味着什么

去年,Meta 推出了 AI 功能,允许广告主创建动态背景、增强图像并生成源自其原始内容的各种广告文本版本。这主要是侧重于通过测试图片和文本等创意元素来优化广告效果。在最新的更新中,Meta 带来了全新的 AI 生成功能,允许广告主依…

Java高级工程师教你解决内存泄漏生产事故方法案例实战

Java高级工程师教你解决内存泄漏宕机生产事故案例实战 一、事故简述与核心日志分析 生产WEB项目,每隔一段时间就宕机了,没有反应,JAVA进程还在,但是请求都没有反应! 二、日志分析 org.springframework.web.util.Ne…

jeecg-boot框架activiti定时节点流转错误分析

文章目录 一、项目介绍二、问题复现三、排查过程1、找到报错信息2、找到报错的堆栈信息3.找到错误代码4.分析错误原因4.1、首先要明白SecurityManager是什么?4.2、定时器前的流程跟之前的流程不是同一个流程👉定时任务的数据已经生成,那么该如…

Moretl 日志采集 使用说明

永久免费: Gitee下载最新版本 使用咨询: 扫码添加QQ 1: 服务器 部署Moretl文件采集服务.(管理员身份运行) 2. 在<设备电脑>打开 [部署页面],下载 [Client.zip].解压打开[Start.exe] 步骤3: [部署页面]输入远程Token.看到刚刚部署的设备电脑. 3.1 点击[明细],修改[…

Java Excel复杂表头,表头合并单元格

Java Excel复杂表头&#xff0c;表头合并单元格 效果预览 一、maven依赖 <!--操作excel --><dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.1.1</version><scope>test</…

Sqlserver查询链接服务器数据问题,如何解决??

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…

群晖NAS使用Docker命令方式安装cpolar内网穿透工具详细流程

文章目录 前言1. 检查安装Container Manager2. 检查开启群晖SSH连接3. Windows SSH 连接群晖4. 下载Cpolar 镜像5. 群晖Docker安装Cpolar 前言 在某些群晖NAS型号版本&#xff0c;无法使用套件安装的时候&#xff0c;我们可以采用Docker的方式进行安装cpolar内网穿透工具&…

连接未来:幂简集成引领API新时代

写在前面 在这个信息爆炸的数字时代&#xff0c;我们迎来了所谓的"数据的黄金时代"。数据不仅仅是数字和信息的集合&#xff0c;它已经成为推动现代企业决策、创新和增长的关键资产。 而API作为数据流通的桥梁&#xff0c;在现代互联网架构中发挥着至关重要的作用。…

Stability AI推出Stable Fast 3D:从单个图像快速生成 3D 模型资产

Stable Fast 3D是Stability AI公司推出的一款革命性的3D资产生成技术&#xff0c;它能够在0.5秒内将单张输入图像转化为详尽的3D模型&#xff0c;为3D重建领域带来了速度和质量上的显著提升。这项技术不仅生成UV展开网格、材料参数和反照率颜色&#xff0c;还支持用户选择四边形…

thinkphp8开发的广告联盟网站系统源码

这款程序是采用国内主流的PHP框架&#xff0c;最新版本thinkphp8.0.4&#xff0c;也是目前市面上功能相对比较强大&#xff0c;界面比较好看的一款全开源的广告联盟系统&#xff0c;程序支持任意二开商业&#xff0c;并且代码无任何加密处理。 程序开发&#xff1a;PHPMySQL …

【ROS 最简单教程 001/300】ROS 概念介绍:机器人元操作系统

ROS&#xff1a;Robot Operating System 【适用于机器人的开源元操作系统】 ROS Plumbing Tools Capabilities Ecosystem 通讯 Plumbing ⭐ 实现ROS不同节点之间的交互工具 Tools ⭐ 工具软件包 (ROS中的开发和调试工具)&#xff0c;提供 仿真 功能&#xff1b;功能 Capabi…

苹果10使用操作

1、关闭应用&#xff1a;要关闭iPhone X的后台任务&#xff0c;必须在多任务界面长按应用卡片&#xff0c;这时缩略图左上角会出现关闭符号&#xff0c;点击关闭符号或者上滑卡片都可以关闭。 注意&#xff1a;在没有长按触发关闭符号的情况下&#xff0c;上滑任务卡片是无法关…

大数据技术原理-Hadoop的安装

摘要 随着大数据时代的到来&#xff0c;Hadoop作为一项重要的分布式计算框架&#xff0c;其安装与配置是大数据技术学习者必须掌握的技能。本文通过实验报告的形式&#xff0c;详细记录了在虚拟机环境下安装Hadoop并配置其为伪分布式模式的全过程。实验过程中&#xff0c;遇到…

【从零开始一步步学习VSOA开发】 概述

概述 概念 VSOA&#xff08;Vehicle SOA&#xff09;是翼辉为了解决任务关键型系统不能适用当前微服务通信架构问题而设计的⼀个轻量级适用于任务关键领域的微服务通信架构&#xff0c;以方便开发者构建大型分布式松耦合软件系统&#xff0c;且支持并行开发。 特点 其主要特…

PAI-DSW中对齐NoteBook和命令行的Python环境

我在命令行使用 pip 安装了neo4j&#xff0c;但是在NoteBook中却无法import成功&#xff0c;问了Chat-GPT才知道可能是NoteBook和命令行的Python不一致造成的。下面将介绍如何验证NoteBook和命令行的Python环境是否一致&#xff0c;以及如何将NoteBook的Python环境修改成命令行…

0702随机存取存储器RAM

随机存取存储器RAM 7.2随机存取存储器&#xff08;RAM&#xff09;7.2.1静态随机存取存储器&#xff08;SRAM&#xff09;7.2.2同步静态随机存取存储器&#xff08;SSRAM&#xff09;SSRAM的使用特点&#xff1a; 7.2.3 动态随机存取存储器2.DRAM的基本结构 7.2.4 存储器容量的…

抖音上传视频模糊怎么办?模糊视频怎么变高清?

抖音上传视频有时候会遇到视频不清晰的情况&#xff0c;那么自己在遇到不清楚的情况之下怎么办呢&#xff0c;抖音上传视频模糊怎么办&#xff0c;我们要怎么调整? 一、抖音上传视频模糊的原因是什么? 1.前期拍摄不清晰 2.视频压缩方法欠佳、视频传送被系统压缩 3.上传视频…

C++篇:C++入门基础(1)

C前言&#xff1a; C 的发展历史可以追溯到1979年&#xff0c;当时C语言以其效率和灵活性成为广泛使用的系统编程语言&#xff0c;但它也有一些限制&#xff0c;例如缺乏直接支持面向对象编程&#xff08;OOP&#xff09;的特性。 之后Bjarne Stroustrup(也就是C之父)是C的创始…

Linux服务器CPU使用率或CPU负载较高问题的排查及解决方案

本文主要介绍当Linux系统ECS实例CPU使用率或CPU负载较高时&#xff0c;如何排查分析及常见案例说明。 操作场景 在您使用ECS实例过程中&#xff0c;可能会遇到实例CPU使用率或CPU负载持续较高的情况&#xff0c;您可以按照以下步骤排查定位具体问题。 找到影响CPU使用率或CPU…