求解包含约束的最优化问题:罚函数法

news2025/1/11 14:10:58

文章目录

  • 外点罚函数法
  • 内点罚函数法
  • 罚函数法 vs 拉格朗日乘子法

外点罚函数法

针对包含约束条件的最优化问题,此前介绍的拉格朗日乘子法和KKT条件已经提供一种有效的解决方案。但由于我是从智能优化算法入门运筹优化行业的,所以在遇到这类问题时,更直接的思路其实是:罚函数法。

假设原问题(P)定义如下
min f ( x ) s.t. g i ( x ) ≤ 0 i = 1 , 2 , . . . , l \text{min} \quad f(\pmb x) \\ \text{s.t.} \quad g_i(\pmb x)≤0 \quad i=1,2,...,l \\ minf(x)s.t.gi(x)0i=1,2,...,l

在罚函数法中,通常会构造如下的一个新问题(P1)
min F ( x , M ) = f ( x ) + M ⋅ ∑ i = 1 l { m a x [ g i ( x ) , 0 ] } 2 \text{min} \quad F(\pmb x,M)=f(\pmb x)+M·\sum_{i=1}^l\{max[g_i(\pmb x), 0]\}^2 minF(x,M)=f(x)+Mi=1l{max[gi(x),0]}2
此处, M M M为惩罚因子。

设计上式的基本思路是:当 g i ( x ) ≤ 0 g_i(\pmb x)≤0 gi(x)0时,约束已满足,P1目标函数中的后一项为0,P1等价于P;当 g i ( x ) > 0 g_i(\pmb x)>0 gi(x)>0时,此时不再满足约束,后一项变为 M ⋅ g i ( x ) 2 M·g_i(\pmb x)^2 Mgi(x)2,只要 M M M值被设置的足够大,第一项就会显著小于第二项,为了让整体最小化,迭代过程会更倾向于优先减小 g i ( x ) g_i(\pmb x) gi(x)的值,即降低约束不满足的程度,从而先将不可行解快速迭代为可行解,再逐步从可行解过渡至最优解。

当然,以上过程是通过朴素的认知推演出来的。如果要严谨一点,就需要思考,P的最优解和P1的最优解之间是怎样的关系?对 M M M的值是否有什么要求?

首先,假设P的可行域为 S S S。在可行域范围内,P和P1显然是等价的,且该结论和 M M M的取值无关。

其次,P1中的 x \pmb x x事实上并没有约束,所以其范围可以从可行域扩展到整个实数域,因为 x \pmb x x的可选范围增加了,所以P1还有机会找到更好的解,所以P≥P1。也就是说,P1为P提供了下界,即P≥P1能够取到的最大值。

然后,在P1中,如果只看 M M M,其系数为正,所以是单调递增的,即如果存在 M 1 < M 2 M_1 < M_2 M1<M2,那么必然有
min F ( x , M 1 ) < min F ( x , M 2 ) \text{min} \quad F(\pmb x,M_1) < \text{min} \quad F(\pmb x,M_2) minF(x,M1)<minF(x,M2)
所以,当 M → + ∞ M\rightarrow +\infty M+时,P1取到最大值。

至此,我们可以得到结论:P1为P提供了下界,并且该下界在 M M M趋向于正无穷时取到。

举个简单的例子看一下。

min ( x 1 − 3 ) 2 + ( x 2 − 2 ) 2 s.t. 4 − x 1 − x 2 ≥ 0 \text{min} \quad (x_1-3)^2+(x_2-2)^2 \nonumber \\ \text{s.t.} \quad 4-x_1-x_2≥0 \nonumber \\ min(x13)2+(x22)2s.t.4x1x20
以上问题中,包含2个优化变量,1个约束条件。
如果使用罚函数法,则目标函数变为
F ( x 1 , x 2 , M ) = ( x 1 − 3 ) 2 + ( x 2 − 2 ) 2 + M { m a x [ x 1 + x 2 − 4 , 0 ] } 2 F(x_1,x_2,M)=(x_1-3)^2+(x_2-2)^2+M \{max [x_1+x_2-4, 0]\}^2 F(x1,x2,M)=(x13)2+(x22)2+M{max[x1+x24,0]}2
分开来写
F ( x 1 , x 2 , M ) = { ( x 1 − 3 ) 2 + ( x 2 − 2 ) 2 x 1 + x 2 − 4 ≤ 0 ( x 1 − 3 ) 2 + ( x 2 − 2 ) 2 + M ( x 1 + x 2 − 4 ) 2 x 1 + x 2 − 4 ≥ 0 F(x_1,x_2,M)= \begin{cases} (x_1-3)^2+(x_2-2)^2& x_1+x_2-4≤0\\ (x_1-3)^2+(x_2-2)^2+M(x_1+x_2-4)^2& x_1+x_2-4≥0 \end{cases} F(x1,x2,M)={(x13)2+(x22)2(x13)2+(x22)2+M(x1+x24)2x1+x240x1+x240
针对每种情形,分别计算梯度
∂ F ( x 1 , x 2 , M ) ∂ x 1 = { 2 ( x 1 − 3 ) x 1 + x 2 − 4 ≤ 0 2 ( x 1 − 3 ) + 2 M ( x 1 + x 2 − 4 ) x 1 + x 2 − 4 ≥ 0 \frac{\partial F(x_1,x_2,M)}{\partial x_1}= \begin{cases} 2(x_1-3)& x_1+x_2-4≤0\\ 2(x_1-3)+2M(x_1+x_2-4)& x_1+x_2-4≥0 \end{cases} x1F(x1,x2,M)={2(x13)2(x13)+2M(x1+x24)x1+x240x1+x240

∂ F ( x 1 , x 2 , M ) ∂ x 2 = { 2 ( x 2 − 2 ) x 1 + x 2 − 4 ≤ 0 2 ( x 2 − 2 ) + 2 M ( x 1 + x 2 − 4 ) x 1 + x 2 − 4 ≥ 0 \frac{\partial F(x_1,x_2,M)}{\partial x_2}= \begin{cases} 2(x_2-2)& x_1+x_2-4≤0\\ 2(x_2-2)+2M(x_1+x_2-4)& x_1+x_2-4≥0 \end{cases} x2F(x1,x2,M)={2(x22)2(x22)+2M(x1+x24)x1+x240x1+x240

最优性必要条件是:梯度值为0。
如果 x 1 + x 2 − 4 ≤ 0 x_1+x_2-4≤0 x1+x240,那么
x 1 = 3 x 2 = 2 x_1=3 \\ x_2=2 x1=3x2=2
此时 x 1 + x 2 − 4 = 1 > 0 x_1+x_2-4=1>0 x1+x24=1>0,与假设条件不符合,舍去。

如果 x 1 + x 2 − 4 ≥ 0 x_1+x_2-4≥0 x1+x240,那么可以得到
x 1 = 5 M + 3 2 M + 1 x 2 = 3 M + 2 2 M + 1 x_1=\frac{5M+3}{2M+1} \\ x_2=\frac{3M+2}{2M+1} x1=2M+15M+3x2=2M+13M+2
M → + ∞ M\rightarrow +\infty M+时, x 1 , x 2 x_1,x_2 x1,x2的值可以通过洛必达法则得到
x 1 = 5 2 x 2 = 3 2 x_1=\frac{5}{2} \\ x_2=\frac{3}{2} x1=25x2=23
此时, x 1 + x 2 − 4 = 0 x_1+x_2-4=0 x1+x24=0,符合假设条件。

另外,海森矩阵为
∇ 2 F ( x 1 , x 2 , M ) = [ ∂ F ∂ x 1 2 ∂ F ∂ x 1 x 2 ∂ F ∂ x 2 x 1 ∂ F ∂ x 2 2 ] = [ 2 M + 2 2 M 2 M 2 M + 2 ] \nabla^2F(x_1,x_2,M)= \begin{bmatrix} \frac{\partial F}{\partial x_1^2}&\frac{\partial F}{\partial x_1x_2}\\ \frac{\partial F}{\partial x_2x_1}&\frac{\partial F}{\partial x_2^2} \end{bmatrix}= \begin{bmatrix} 2M+2&2M\\ 2M&2M+2 \end{bmatrix} 2F(x1,x2,M)=[x12Fx2x1Fx1x2Fx22F]=[2M+22M2M2M+2]
因为 M > 0 M>0 M>0,所以 ∇ 2 F \nabla^2F 2F为正定阵,即上述解为极小值。

看起来挺简单的,那是不是针对任意的约束优化问题,都可以通过构造罚函数,然后直接求梯度等于0,并让 M M M趋向无穷大后,得到最优解呢?

理论上好像可以,但实际上并不可行。主要原因有两点:
(1)很多优化问题的梯度计算特别复杂,甚至无法计算,比如使用各种智能优化算法求解的复杂问题;(2)即使可以推导出梯度公式,但是随着 M M M的增加,在边界处的梯度值越来越大,当 M M M已经极大时,可能会出现梯度爆炸的现象,而很多问题的最优解恰恰是在边界处取得,这就会给数值计算带来较大误差,下图中,由于加入了惩罚项,边界处(两个圆点)的左右值显然变化很大。

为了更好地使用使用罚函数法,一般的求解框架是这样设计的:

(1)给定初始点 x 0 \pmb x^0 x0,允许的惩罚项误差精度 ϵ \epsilon ϵ,初始 M 0 M_0 M0,以及每次 M M M的增长幅度 c ( c > 1 ) c(c>1) c(c>1)

(2)以 x k − 1 \pmb x^{k-1} xk1为初始点,求解无约束优化问题P1,得到最优解 x k \pmb x^k xk

(3)如果 g ( x k ) ≤ ϵ g(\pmb x^k)≤\epsilon g(xk)ϵ,则停止迭代, x k \pmb x^k xk作为P的最优解;否则,令 M k + 1 = c M k M_{k+1}=cM_k Mk+1=cMk,转步骤2。

这里需要解释一下给定 x 0 \pmb x^0 x0的原因。求解P1时主要使用梯度类算法,所以是需要有个初值的,只不过此处初始点的选取是任意的,即可以在可行域外,也可以在可行域内;此外,求解 M k + 1 M_{k+1} Mk+1对应的P1时,需要使用 M k M_k Mk对应P1的最优解作为初值。

上述这种解决办法,在学术上还有一个更专业的称呼:外点罚函数法。

内点罚函数法

既然有外点罚函数法,那自然就还有内点罚函数法。

内点罚函数法的基本思想是在目标函数上引入一个关于约束的惩罚项,当迭代点由可行域的内部接近可行域的边界时, 惩罚项将趋于无穷大来迫使迭代点返回可行域的内部, 从而保持迭代点的严格可行性。

一种常见的新问题(P2)定义方式为:
min F ( x , R ) = f ( x ) − R ⋅ ∑ i = 1 l 1 g i ( x ) \text{min} \quad F(\pmb x,R)=f(\pmb x)-R·\sum_{i=1}^l\frac{1}{g_i(\pmb x)} minF(x,R)=f(x)Ri=1lgi(x)1
此处, R R R为惩罚因子。

参考上一节的推理方式,我们可以得到如下结论:P2为P提供了上界,并且该上界在 R R R趋向于0时取到。

还是以上节的例子为例,目标函数变为
F ( x 1 , x 2 , M ) = ( x 1 − 3 ) 2 + ( x 2 − 2 ) 2 − R ⋅ 1 x 1 + x 2 − 4 F(x_1,x_2,M)=(x_1-3)^2+(x_2-2)^2-R·\frac{1}{x_1+x_2-4} F(x1,x2,M)=(x13)2+(x22)2Rx1+x241
求梯度并令其等于0
∂ F ∂ x 1 = 2 ( x 1 − 3 ) + R ⋅ 1 ( x 1 + x 2 − 4 ) 2 = 0 \frac{\partial F}{\partial x_1}=2(x_1-3)+R·\frac{1}{(x_1+x_2-4)^2}=0 x1F=2(x13)+R(x1+x24)21=0
∂ F ∂ x 2 = 2 ( x 2 − 2 ) + R ⋅ 1 ( x 1 + x 2 − 4 ) 2 = 0 \frac{\partial F}{\partial x_2}=2(x_2-2)+R·\frac{1}{(x_1+x_2-4)^2}=0 x2F=2(x22)+R(x1+x24)21=0
上述两式相减,先得到变量间的对应关系
x 1 = x 2 + 1 x_1=x_2+1 x1=x2+1
将该对应关系带入第二个梯度公式
( x 2 − 2 ) ( 2 x 2 − 3 ) 2 = − R 2 (x_2-2)(2x_2-3)^2=-\frac{R}{2} (x22)(2x23)2=2R
R → 0 R\rightarrow 0 R0时, x 2 x_2 x2存在两个可行解:2和3/2。

回到刚刚的对应关系,可以得到 x 1 = 3 x_1=3 x1=3 x 1 = 5 / 2 x_1=5/2 x1=5/2

显然,只有第二组解符合约束条件 x 1 + x 2 − 4 ≤ 0 x_1+x_2-4≤0 x1+x240。而该解和外点罚函数法的解是完全一致的。

需要说明的是,相比外点罚函数法,内点罚函数法要求可行解始终保持在可行域内,并且不能直接处理含等式约束的最优化问题。受限于这些条件,内点罚函数法在实际问题中的通用性不如外点罚函数法。

罚函数法 vs 拉格朗日乘子法

既然罚函数法和拉格朗日乘子法都是解决约束优化问题的方法,那么就有必要放在一起横向对比一下。

浏览了一些网上关于这两种方法的对比,很多是从对偶角度入手的,不过暂时我还不太懂对偶,所以打算从算法设计的思路来阐述。

罚函数法的思路,有种逐步逼近最优解的状态:持续增加惩罚因子值后,新构造的无约束优化问题的最优解便会越来越逼近原约束优化问题的上界(内惩罚)或下界(外惩罚);在此过程中,惩罚因子是以参数形式被引入的,所以原问题未扩维。

拉格朗日乘子法的思路,则更像是一步到位的策略:直接证明了新构造的无约束优化问题的最优解等价于原约束优化问题的最优解;在此过程中,拉格朗日乘子则是以优化变量的身份被引入的,所以原问题相当于被升维到更高空间去解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/778548.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

day35-Image Carousel(图片轮播图简易版)

50 天学习 50 个项目 - HTMLCSS and JavaScript day35-Image Carousel&#xff08;图片轮播图简易版&#xff09; 效果 index.html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport…

93、简述kafka架构设计

kafka架构设计 Consumer Group&#xff1a;消费者组&#xff0c;消费者组内每个消费者负责消费不同分区的数据&#xff0c;提高消费能力。逻辑上的一个订阅者。Topic: 可以理解为一个队列&#xff0c;Topic 将消息分类&#xff0c;生产者和消费者面向的是同一个 Topic。Partiti…

netty组件详解-中

接着之前的博客netty组件详解-上&#xff0c;我们继续深入到源码层面&#xff0c;来探究netty的各个组件和其设计思想&#xff1a; netty内置的通讯模式 我们在编写netty代码时&#xff0c;经常使用NioServerSocketChannel 作为通讯模式。 例如下面的简单netty客户端示例: pri…

Docker迁移默认的/var/lib/docker目录

安装完Docker后&#xff0c;默认存储路径在/var/lib/docker目录&#xff0c;如果服务器挂载的硬盘不是根目录的话&#xff0c;可能会造成资源不够用。这时候就需要迁移docker默认的目录。 1.停止docker服务 systemctl stop docker 复制 2.创建docker新目录 mkdir -p /data…

airtest-selenium 脚本爬取百度热搜标题

目录 1. 前言 2. 爬取标题的脚本 3. 命令行运行 Web 自动化脚本 1&#xff09;python 环境准备 2&#xff09;chrome 与 chromedriver 版本对应 3&#xff09;命令行运行 1. 前言 airtest-selenium是一个基于Python的UI自动化测试框架&#xff0c;它结合了airtest和sele…

【Redis】缓存问题小记

文章目录 1、缓存模型和思路1.1、缓存更新策略1.2、具体实现思路 2、缓存穿透问题2.1、方案分析2.2、缓存空对象实现思路2.3、小总结 3、缓存雪崩4、缓存击穿4.1、方案分析4.1.1、互斥锁4.1.2、逻辑过期4.1.3、方案对比 4.2、互斥锁实现思路4.3、逻辑过期实现思路 1、缓存模型和…

微服务——统一网关Getway

为什么需要网关&#xff1f; 网关的两种实现: 网关Getway——快速入门 步骤一 网关背身也是一个微服务&#xff0c;需要注册到nacos中去 步骤二 成功运行后 可以通过网关进行请求转发到对应服务。 流程如下&#xff1a; 路由断言工厂 网关路由可以配置的东西有如下。 spri…

RocketMQ分布式事务 -> 最终一致性实现

文章目录 前言事务消息场景代码示例订单服务事务日志表TransactionMQProducerOrderTransactionListener业务实现类调用总结 积分服务积分记录表消费者启动消费者监听器增加积分幂等性消费消费异常 前言 分布式事务的问题常在业务与面试中被提及, 近日摸鱼看到这篇文章, 阐述的…

Web前端开发概述(二)

&#x1f60a;Web前端开发概述&#xff08;二&#xff09; &#x1f47b;前言&#x1fa81;前端开发背景&#x1f50d;当下前端开发要求&#x1f526;Web前端开发技术&#x1f3ad;HTML&#x1f3ad;CSS&#x1f3ad;JavaScript&#x1f3ad;HTML DOM&#x1f3ad;BOM&#x1f…

Spring中AOP的通知类型和执行顺序

Spring中AOP的通知类型&#xff1a; Around&#xff1a;环绕通知&#xff0c;此注解标注的通知方法在目标方法前、后都被执行Before&#xff1a;前置通知&#xff0c;此注解标注的通知方法在目标方法前被执行After &#xff1a;后置通知&#xff0c;此注解标注的通知方法在目标…

Jmeter+Jenkins+Ant自动化持续集成环境搭建

一、安装准备 1.JDK:jdk-8u121-windows-x64 2.jmeter工具&#xff1a;apache-jmeter-2.13 3.ANT工具&#xff1a;apache-ant-1.9.7-bin 4.jenkins工具&#xff1a;jenkins-2.32.2 二、软件安装 1.JDK的安装 >双击JDK安装包&#xff0c;选择安装路径&#xff08;本人是…

论文笔记--ERNIE: Enhanced Language Representation with Informative Entities

论文笔记--ERNIE: Enhanced Language Representation with Informative Entities 1. 文章简介2. 文章概括3 文章重点技术3.1 模型框架3.2 K-Encoder(Knowledgeable Encoder)3.3 预训练任务3.4 微调 4. 文章亮点5. 原文传送门6. References 1. 文章简介 标题&#xff1a;ERNIE:…

每天五分钟计算机视觉:单卷积层的前向传播过程

什么是单卷积层? 一张图片(输入)经过多个卷积核卷积就会得到一个输出,而这多个卷积核的组合就是一个单卷积层。 这些卷积核可能大小是不一样的,但是他们接收同样大小是输入,他们的输出必须是一般大小,所以不同的卷积核需要具备不同的步长和填充值。 单层卷积网络前向传…

springboot+vue开发后台增删改查

效果图 前端代码【User.vue】 <template><div class"data-container"><!--添加 start--><div class"data-header"><el-button round click"addHander" size"large" type"primary"><el-ic…

Cesium态势标绘专题-普通点(标绘+编辑)

标绘专题介绍:态势标绘专题介绍_总要学点什么的博客-CSDN博客 入口文件:Cesium态势标绘专题-入口_总要学点什么的博客-CSDN博客 辅助文件:Cesium态势标绘专题-辅助文件_总要学点什么的博客-CSDN博客 本专题没有废话,只有代码,代码中涉及到的引入文件方法,从上面三个链…

ORB-SLAM2学习笔记5之EuRoc、TUM和KITTI开源数据运行ROS版ORB-SLAM2生成轨迹

文章目录 0 引言1 数据预处理1.1 EuRoc数据1.2 TUM数据1.3 KITTI数据 2 代码修改2.1 单目2.2 双目2.3 RGB-D 3 运行ROS版ORB-SLAM23.1 单目3.2 双目3.3 RGB-D ORB-SLAM2学习笔记系列&#xff1a; 0 引言 ORB-SLAM2学习笔记1已成功编译安装ROS版本ORB-SLAM2到本地&#xff0c;本…

3、基于Zookeeper实现分布式锁

目录 3.1、Zookeeper安装和相关概念3.1.1 安装启动3.1.2 相关概念3.1.3 Java客户端 3.2 Zookeeper实现分布式锁的思路分析3.3 ZooKeeper分布式锁的基本实现 3.1、Zookeeper安装和相关概念 3.1.1 安装启动 # 解压到/mysoft文件夹下 tar -zxvf zookeeper-3.7.0-bin.tar.gz # 重…

SAP从放弃到入门系列之批次派生-Batch Derivation-Part1

文章目录 一、概述二、系统配置三、主数据3.1 分类主数据3.2 派生规则设置3.2.1发送物料3.2.2 接收物料 四、 测试数据&#xff08;生产订单&#xff09;五、 最后 Batch Derivation翻译成批次派生&#xff08;衍生&#xff09;或批次继承都是问题不大&#xff0c;继承和派生个…

day31贪心算法 用最少数量的箭引爆气球 和无重叠区间

题目描述 题目分析&#xff1a; x轴向上射箭&#xff0c;12一支&#xff0c;重叠的需要一支&#xff0c;3-8一支&#xff0c;7-16一支 返回2&#xff1b; 就是让重叠的气球尽量在一起&#xff0c;局部最优&#xff1b;用一支弓箭&#xff0c;全局最优就是最少弓箭&#xff1b…

ShardingSphere分库分表实战之MySQL主从集群搭建

&#x1f680; ShardingSphere &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&…