Problem Set 3

news2025/1/19 17:19:01

1Lagrange Duality Formulate the Lagrange dual problem of the following
linear programming prob-lem min cT rs.t.Ax 二b where a ∈R is variable,c
∈ R",A ∈Rk×n, b ∈ Rk.

在这里插入图片描述

解:设拉格朗日函数为 L ( x , λ ) = c T x + λ T ( A x − b ) \mathcal{L}(x,\lambda)=c^Tx+\lambda^T(Ax-b) L(x,λ)=cTx+λT(Axb),

对应的对偶函数为 G ( λ ) = i n f λ   L ( x , λ ) \mathcal{G}(\lambda)=inf_{\lambda}\ \mathcal{L}(x,\lambda) G(λ)=infλ L(x,λ)

而LP问题与对偶问题强对偶,KTT 条件成立,满足 stationarity

∇ x c T x ∗ + λ ∗ T ( A x − b ) = 0 \nabla_{x}c^Tx^*+{\lambda^*}^T(Ax-b)=0 xcTx+λT(Axb)=0

⟹ \Longrightarrow c T + λ ∗ T A = 0 c^T+{\lambda^*}^TA=0 cT+λTA=0

以及 A x ∗ − b = 0 Ax^*-b=0 Axb=0,因此该点处拉格朗日函数可以表达为

L ( x ∗ , λ ∗ ) = ( − λ T A ) ( A − 1 b ) + λ T ( A x ∗ − b ) \mathcal{L}(x^*,\lambda^*)=(-\lambda^TA)(A^{-1}b)+\lambda^T(Ax^*-b) L(x,λ)=(λTA)(A1b)+λT(Axb)

L ( x ∗ , λ ∗ ) = − λ T b \mathcal{L}(x^*,\lambda^*)=-\lambda^T b L(x,λ)=λTb

根据 Dual feasibility 得 λ i ≥ 0 \lambda_i\geq 0 λi0

LP问题的对偶问题标准形式为
m a x λ   − λ T b s . t . λ ≥ 0 , c T + λ T A = 0 max_{\lambda}\ -\lambda^T b \\ s.t. \lambda\geq 0,c^T+{\lambda}^TA=0 maxλ λTbs.t.λ0,cT+λTA=0
这里补充一种做法:
将拉格朗日对偶函数变换为 G ( λ ) = i n f L ( x , λ ) = i n f ( c T + λ T A ) x − λ T b \mathcal{G}(\lambda)=inf\mathcal{L}(x,\lambda)=inf(c^T+\lambda^TA)x-\lambda^Tb G(λ)=infL(x,λ)=inf(cT+λTA)xλTb
c T + λ T A = 0 c^T+\lambda^TA=0 cT+λTA=0 时, G ( λ ) = − λ T b \mathcal{G}(\lambda)=-\lambda^Tb G(λ)=λTb
否则, G ( λ ) = ∞ \mathcal{G}(\lambda)=\infty G(λ)=,不存在极值。

sVM
2.1Convex Functions Prove f(w) = w" . (where w ∈ R") is a convex function.2.2Soft-Margin for Separable Data Consider training a
soft-margin SVM with C set to some positive constant.Suppose the
training data is linearly separable. Since increasing the 6; can
onlyincrease the objective of the primal problem (which we are trying
to minimize),at the optimal solution to the primal problem,all the
training examples willhave functional margin at least 1 and all the i
will be equal to zero. True orfalse? Explain! Given a linearly
separable dataset, is it necessarily better to usea a hard margin SVM
over a soft-margin SVM?
2.3In-bound Support Vectors in Soft-Margin sVMs Examples ar() with a > 0 are called support vectors (SVs). For soft-marginsVM we distinguish
between in-bound SVs,for which 0 <Qi<C, and boundsVs for which a; = C.
Show that in-bound SVs lie exactly on the margin.Argue that bound SVs
can lie both on or in the margin,and that they will“usually” lie in
the margin. Hint: use the KKT conditions.

在这里插入图片描述

2.1证: ω T ω \omega^T\omega ωTω是凸函数

   ⟺    \iff ∣ ∣ λ x + ( 1 − λ ) y ∣ ∣ 2 ≤ λ ∣ ∣ x ∣ ∣ 2 + ( 1 − λ ) ∣ ∣ y ∣ ∣ ||\lambda x+(1-\lambda)y||^2\leq \lambda||x||^2+(1-\lambda)||y|| ∣∣λx+(1λ)y2λ∣∣x2+(1λ)∣∣y∣∣

   ⟺    \iff λ ∣ ∣ x ∣ ∣ 2 + ( 1 − λ ) ∣ ∣ y ∣ ∣ − ( λ x + ( 1 − λ ) y ) T ( λ x + ( 1 − λ ) y ) ≥ 0 \lambda||x||^2+(1-\lambda)||y||-(\lambda x+(1-\lambda)y)^T(\lambda x+(1-\lambda)y)\geq 0 λ∣∣x2+(1λ)∣∣y∣∣(λx+(1λ)y)T(λx+(1λ)y)0

   ⟺    \iff λ ∣ ∣ x ∣ ∣ 2 + ( 1 − λ ) ∣ ∣ y ∣ ∣ − ( λ x T + ( 1 − λ ) y T ) ( λ x + ( 1 − λ ) y ) ≥ 0 \lambda||x||^2+(1-\lambda)||y||-(\lambda x^T+(1-\lambda)y^T)(\lambda x+(1-\lambda)y)\geq 0 λ∣∣x2+(1λ)∣∣y∣∣(λxT+(1λ)yT)(λx+(1λ)y)0

   ⟺    \iff λ ∣ ∣ x ∣ ∣ 2 + ( 1 − λ ) ∣ ∣ y ∣ ∣ − ( λ 2 x T x + λ ( 1 − λ ) ( y T x + y T x ) + ( 1 − λ ) 2 y T y ) λ ( 1 − λ ) ( y T x + y T x ) ≥ 0 \lambda||x||^2+(1-\lambda)||y||-(\lambda^2 x^Tx+\lambda(1-\lambda)(y^Tx+y^Tx)+(1-\lambda)^2y^Ty)\lambda(1-\lambda)(y^Tx+y^Tx)\geq 0 λ∣∣x2+(1λ)∣∣y∣∣(λ2xTx+λ(1λ)(yTx+yTx)+(1λ)2yTy)λ(1λ)(yTx+yTx)0

   ⟺    \iff ( λ − λ 2 ) x T x + ( λ − λ 2 ) y T y − λ ( 1 − λ ) ( y T x + y T x ) ≥ 0 (\lambda-\lambda^2)x^Tx+(\lambda-\lambda^2)y^Ty-\lambda(1-\lambda)(y^Tx+y^Tx)\geq 0 (λλ2)xTx+(λλ2)yTyλ(1λ)(yTx+yTx)0

   ⟺    \iff ( λ − λ 2 ) x T x + ( λ − λ 2 ) y T y − λ ( 1 − λ ) ( y T x + y T x ) ≥ 0 (\lambda-\lambda^2)x^Tx+(\lambda-\lambda^2)y^Ty-\lambda(1-\lambda)(y^Tx+y^Tx)\geq 0 (λλ2)xTx+(λλ2)yTyλ(1λ)(yTx+yTx)0

λ ∈ [ 0 , 1 ] \lambda\in[0,1] λ[0,1],因此 λ ≥ λ 2 \lambda\geq \lambda^2 λλ2

   ⟺    \iff x T x + y T y − ( y T x + y T x ) ≥ 0 x^Tx+y^Ty-(y^Tx+y^Tx)\geq 0 xTx+yTy(yTx+yTx)0

   ⟺    \iff ( x T − y T ) ( x − y ) ≥ 0 (x^T-y^T)(x-y)\geq 0 (xTyT)(xy)0

   ⟺    \iff ∣ ∣ x − y ∣ ∣ 2 ≥ 0 ||x-y||^2\geq 0 ∣∣xy20

∣ ∣ x − y ∣ ∣ 2 ≥ 0 ||x-y||^2\geq 0 ∣∣xy20成立,故 ω T ω \omega^T\omega ωTω是凸函数,证毕。

2.2不一定,软间隔SVM模型表达为
m i n ω , b , ξ 1 2 ∣ ∣ ω ∣ ∣ 2 + C ∑ i = 1 m ξ i s . t . y ( i ) ( ω T x ( i ) + b ) ≥ 1 − ξ i ξ i ≥ 0 , ∀ i = 1 , 2 , . . . , m min_{\omega,b,\xi}\frac{1}{2}||\omega||^2+C\sum^m_{i=1}\xi_i \\ s.t. y^{(i)}(\omega^Tx^{(i)}+b)\geq1-\xi_i \\ \xi_i\geq0,\forall i=1,2,...,m minω,b,ξ21∣∣ω2+Ci=1mξis.t.y(i)(ωTx(i)+b)1ξiξi0,i=1,2,...,m
考虑一维情形如下
在这里插入图片描述

∀ ξ i = 0 \forall\xi_i=0 ξi=0,即退化为硬间隔SVM,求得决策边界为 ω 1 \omega_1 ω1

ξ j = 0 , j ≠ i \xi_j=0,j\neq i ξj=0,j=i,求得决策边界为 ω 2 \omega_2 ω2

目标函数设为 f f f f ( ω 1 ) = 1 2 ω 1 2 f(\omega_1)=\frac{1}{2}\omega_1^2 f(ω1)=21ω12 f ( ω 2 ) = 1 2 ω 2 2 + C ξ i f(\omega_2)=\frac{1}{2}\omega_2^2+C\xi_i f(ω2)=21ω22+Cξi

1 2 ω 1 2 > 1 2 ω 2 2 + C ξ i \frac{1}{2}\omega_1^2>\frac{1}{2}\omega_2^2+C\xi_i 21ω12>21ω22+Cξi时, ξ i \xi_i ξi可以不为0, ω 2 \omega_2 ω2优于 ω 1 \omega_1 ω1,因而最优解一定不是 ω 1 \omega_1 ω1.

软间隔SVM可以避免过拟合,正如上面的例子,右侧橙色点可能是噪声,用硬间隔SVM会拟合噪声;

相反,前者通过松弛变量,泛化模型,提高鲁棒性,因此某些情况下有必要使用软间隔SVM。

2.3①当 0 < α i ∗ < C 0<\alpha^*_i<C 0<αi<C时,

根据KTT条件 α i ∗ + r i ∗ = C \alpha^*_i+r^*_i=C αi+ri=C 0 < r i ∗ < C 0<r^*_i<C 0<ri<C

又因为 r i ∗ ξ i ∗ = 0 r^*_i\xi^*_i=0 riξi=0,所以 ξ i ∗ = 0 \xi^*_i=0 ξi=0

因为 α i ∗ ( y ( i ) ( ω ∗ T x ( i ) + b ∗ ) + ξ i ∗ − 1 ) = 0 \alpha^*_i(y^{(i)}({\omega^*}^Tx^{(i)}+b^*)+\xi^*_i-1)=0 αi(y(i)(ωTx(i)+b)+ξi1)=0

所以 y ( i ) ( ω ∗ T x ( i ) + b ∗ ) + ξ i ∗ − 1 = 0 y^{(i)}({\omega^*}^Tx^{(i)}+b^*)+\xi^*_i-1=0 y(i)(ωTx(i)+b)+ξi1=0

所以 y ( i ) ( ω ∗ T x ( i ) + b ∗ ) = 1 y^{(i)}({\omega^*}^Tx^{(i)}+b^*)=1 y(i)(ωTx(i)+b)=1

即 in-bound SVs 在支撑平面上。

②当 α i ∗ = C \alpha^*_i=C αi=C时,类似的可以得到 y ( i ) ( ω ∗ T x ( i ) + b ∗ ) + ξ i ∗ − 1 = 0 y^{(i)}({\omega^*}^Tx^{(i)}+b^*)+\xi^*_i-1=0 y(i)(ωTx(i)+b)+ξi1=0

ξ i ∗ ≥ 0 \xi^*_i\geq0 ξi0,因此 y ( i ) ( ω ∗ T x ( i ) + b ∗ ) ≤ 1 y^{(i)}({\omega^*}^Tx^{(i)}+b^*)\leq1 y(i)(ωTx(i)+b)1

即 bound SVs 在支撑平面上或者在间隔内。

而往往少数的点就能确定支撑平面(n 维空间 n 个点确定一个 boundary),因此大部分的点在间隔内。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/106190.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第十七章 webpack5项目搭建Vue-Cli(开发模式)

step1–创建项目目录 创建一个目录用来搭建vue-cli的项目 mkdir vue-cli cd vue-clistep2–初始化项目 初始化项目&#xff0c;生成一个package.json文件 npm init -ystep3–编写vue-cli的开发模式配置 新建目录 / |-config | |--webpack.dev.js | |--webpack.prod.js我…

USB TO SPI(上海同旺电子)调试器调试25LC020A

所需设备&#xff1a; 1、USB TO SPI(上海同旺电子)&#xff1b; 2、25LC020A 2Kb 2.5V SPI Serial EEPROM; Microchip 25LC020A 是一款 2 Kb 串行 EEPROM&#xff0c;采用行业标准串行外设接口 (SPI) 兼容串行总线。 该器件被组织为一个 256 x 8 位块&#xff0c;并针对消…

Java安全--CC7

在学CC7的时候我有这么几个疑问 1.为什么要两个LazyMap 2.hashCode那一步怎么计算的 3.为什么要remove yy 4.为什么put两个 我们可以先看一下CC7的链子是怎么走的: 其实分析链子还是从命令执行走到readObject比较好理解&#xff0c;虽然比较麻烦&#xff0c;比较繁琐&#xff0…

机器人机械臂运动学——逆运动学解算

1.情景概述 假设最一般的情况&#xff0c;我们的机械臂有六个自由度&#xff0c;那么从初始状态想要变化到目标的状态&#xff0c;一般情况下我们至少需要进行六次的变换&#xff0c;而这六次变换的矩阵参数隐含在整体的变换矩阵中。 根据之前的知识&#xff0c;左上角的3*3代表…

m基于隐马尔科夫模型(HMM)的手机用户行为预测(MMUB)算法matlab仿真

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 隐马尔可夫模型&#xff08;Hidden Markov Model&#xff0c;HMM&#xff09;是一种统计模型&#xff0c;广泛应用在语音识别&#xff0c;词性自动标注&#xff0c;音字转换&#xff0c;概率文法…

R语言中的Nelson-Siegel模型在汇率预测的应用

这篇文章的目的是指导读者逐步使用R编程语言实现Nelson-Siegel模型的步骤。 最近我们被客户要求撰写关于Nelson-Siegel模型的研究报告&#xff0c;包括一些图形和统计输出。 您可能已经知道&#xff0c;估计利率期限结构是任何资产定价的关键&#xff0c;因此对投资者和政策制…

5G无线技术基础自学系列 | 基于Massive MIMO的场景化波束优化

素材来源&#xff1a;《5G无线网络规划与优化》 一边学习一边整理内容&#xff0c;并与大家分享&#xff0c;侵权即删&#xff0c;谢谢支持&#xff01; 附上汇总贴&#xff1a;5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 前面内容提到&#xff0c; 5G中引入了M…

机器人机械臂运动学——运动学正向解算

本博客内容参考台湾大学_林沛群教授_机器人学的课程内容 1.相对运动关系的描述方法 假设有现在这样的一个情景&#xff0c;从左到右有三个转轴&#xff0c;转轴本身可以转动&#xff0c;也可以沿着轴线上下平动&#xff0c;那么我们如何描述其中的运动学关系及其位置关系呢&am…

Linux Red Hat 8.0 cat、cut、sed、tail命令

1.cat&#xff1a; 在终端设备上显示文件内容 常用选项&#xff1a; -n 显示行数&#xff08;空格有编号&#xff09; -b 显示行数&#xff08;空格没有编号&#xff09; 命令格式&#xff1a;cat 选项 文件 特殊用法tac&#xff1a;倒着显示内容 配合重定向使用 查看 test1…

DPDK 多进程

DPDK库里是支持多进程和多线程&#xff0c;本文主要总结多进程的相关的操作。 DPDK多进程使用的关键启动参数&#xff1a; --proc-type&#xff1a;指定一个dpdk进程是主进程还是副进程&#xff08;参数值就用上面的primary或是secondary&#xff0c;或者是auto&#xff09;-…

【Bio】基础生物学 - 五个重要官能团 five important functional group

文章目录1. 羟qiǎng基&#xff08;hydroxyl&#xff09;2. 羧suō基&#xff08;carboxyl&#xff09;3. 氨基&#xff08;amino&#xff09;4. 磷酸盐&#xff08;phosphate&#xff09;5. 巯基&#xff08;sulfhydryl&#xff09;1. 羟qiǎng基&#xff08;hydroxyl&#xf…

最新进展 | Android 自定义机器学习堆栈

作者 / Android 机器学习平台团队相较于服务器端机器学习 (ML)&#xff0c;设备端机器学习有其独特的优势&#xff0c;如支持离线使用、延迟更低、隐私性更高和推理成本更低&#xff0c;因此 Android 中设备端机器学习的使用迅速增长。在构建基于设备端 ML 的功能时&#xff0c…

Android基于perfetto分析native内存泄露

官方文档(可在Chome直接翻译) https://perfetto.dev/docs/data-sources/native-heap-profiler 示例 raw-trace 资源地址 https://download.csdn.net/download/CSqingchen/87321798 本文示例是windows&#xff0c;这里使用了python工具&#xff0c;在Linux和mac同样适用 首先安装…

胡凡 《算法笔记》 上机实战训练指南 3.1 简单模拟

胡凡 《算法笔记》 上机实战训练指南 3.1 持续更新中 , 菜鸡的刷题笔记… 大学到现在了还没咋好好刷过题&#xff0c;该push自己了… 文章目录胡凡 《算法笔记》 上机实战训练指南 3.13.1 简单模拟【PAT B1001】害死人不偿命的&#xff08;3n1&#xff09;猜想【PAT B1032】挖掘…

spring扩展之基于HandlerMapping实现接口灰度发布的demo

背景 面试经常被问到&#xff0c;你了解spring源码吗&#xff1f;有基于spring做过什么扩展吗&#xff1f;除了PropertyPlaceholderConfigurer处理占位符(被说烂了)还有其他的吗&#xff1f; 看了springmvc的源码&#xff0c;有了一个新的案例可讲(吹) 基于HandlerMapping实现…

运营活动没做好,是没有明确目标

有很多运营人在做项目的时候&#xff0c;其实没有一个明确的目标&#xff0c;不清楚自己究竟为什么要做这件事。 我们在做运营方案前&#xff0c;要分析用户的需求有哪些&#xff0c;如何达成目标&#xff0c;制定出一个计划&#xff1a; 1、要做什么——计划 我们需要掌握运…

ES基础入门

ES 一、简介 1、Elastic Stack ES技术栈&#xff1a; ElasticSearch&#xff1a;存数据搜索&#xff1b;QL&#xff1b;Kibana&#xff1a;Web可视化平台&#xff0c;分析。LogStash&#xff1a;日志收集&#xff0c;Log4j:产生日志&#xff1b;log.info(xxx)。。。。 使用…

软件测试面试题和面试流程

自我介绍部分 .... 项目经历 .... 技能部分 性能 使用什么工具&#xff1f;介绍下最近做的性能测试项目&#xff0c;性能测试过程中遇到哪些问题&#xff1f;性能标准谁来定&#xff1f;你们性能测试的流程是什么&#xff1f;什么是分布式&#xff1f;为什么要用分布式&a…

硅片检测半导体运动台控制器的设计(二)

虽然我国目前对于精密硅片检测运动平台的整机研发还比较空白&#xff0c;但是值得注意的是&#xff0c;对于 X、Y 两自由度运动平台&#xff0c;甚至多自由度运动平台、先进驱动方式和控制策略的研究已经积累了一定的经验&#xff0c;吸收这些经验并应用于本运动平台的研发对选…

分布式系统(事务处理)

文章目录事务&#xff08;Transaction&#xff09;分布式事务原子提交协议单阶段提交两阶段提交三阶段提交串行等价 / 并发控制分布式死锁锁超时全局等待图边追逐算法事务放弃时的恢复服务器崩溃后的恢复恢复文件重组恢复文件日志从Crash 中恢复2PC 的恢复事务&#xff08;Tran…