约束优化:PHR-ALM 增广拉格朗日函数法

news2025/2/25 3:04:02

文章目录

  • 约束优化:PHR-ALM 增广拉格朗日函数法
    • 等式约束非凸优化问题的PHR-ALM
    • 不等式约束非凸优化问题的PHR-ALM
    • 对于一般非凸优化问题的PHR-ALM
    • 参考文献

约束优化:PHR-ALM 增广拉格朗日函数法

基础预备:

约束优化:约束优化的三种序列无约束优化方法

凸优化学习笔记:Lagrange函数、对偶函数、对偶问题、KKT条件

由前面的分析我们已经知道,在约束优化的三种序列无约束优化方法中,罚函数法存在Hessian矩阵条件数爆炸而难以求解的问题,Uzawa’s Method要求原目标函数必须为连续凸,这些都对适用范围存在严苛限制。增广拉格朗日函数法对原问题的凸性不做要求,并可以通过对二次罚函数进行某种修正,使得对有限的罚因子,得到的逼近最优解也是可行的。

等式约束非凸优化问题的PHR-ALM

从前面文章中的分析可知,不管原问题是不是凸优化问题,原问题的对偶问题一定是凸优化问题,这是因为对偶问题极大化的目标函数是凹函数,且约束集合为凸集,这是一个非常重要且有用的性质。如下图所示,在Uzawa’s method中,优化问题 d ( λ ) : = min ⁡ x f ( x ) + λ T h ( x ) , s . t . λ ≤ 0 d(\lambda):=\min _x f(x)+\lambda^{\mathrm{T}} h(x),s.t. \lambda \leq0 d(λ):=minxf(x)+λTh(x)s.t.λ0非凸,因为函数 f ( x ) + λ T h ( x ) f(x)+\lambda^{\mathrm{T}} h(x) f(x)+λTh(x)非凸,则无法求出唯一的最优 x x x带入下一步的 λ \lambda λ更新计算。

已知 max ⁡ λ f ( x ) + λ T h ( x ) = { f ( x ) , h ( x ) = 0 ∞ ,  otherwise  \max _\lambda f(x)+\lambda^{\mathrm T}h(x)=\left\{\begin{array}{l}f(x), h(x)=0 \\ \infty, \text { otherwise }\end{array}\right. maxλf(x)+λTh(x)={f(x),h(x)=0, otherwise 是一个不连续函数,如何处理这个不连续的函数,一个非常直观的方法就是将该问题近似成一个连续问题,这是PHR方法的基本思想。增加一项 − 1 2 ρ ∥ λ − λ ˉ ∥ 2 -\frac{1}{2 \rho}\|\lambda-\bar{\lambda}\|^2 2ρ1λλˉ2,用来近似平滑原来不连续的函数 max ⁡ λ f ( x ) + λ T h ( x ) \max _\lambda f(x)+\lambda^{\mathrm T}h(x) maxλf(x)+λTh(x),其中 ρ > 0 \rho>0 ρ>0用来惩罚 λ \lambda λ与先验值 λ ˉ \bar{\lambda} λˉ之间的偏差。

在这里插入图片描述

这样一来,函数 f ( x ) + λ T h ( x ) − 1 2 ρ ∥ λ − λ ˉ ∥ 2 f(x)+\lambda^{\mathrm{T}} h(x)-\frac{1}{2 \rho}\|\lambda-\bar{\lambda}\|^2 f(x)+λTh(x)2ρ1λλˉ2被近似成一个光滑函数,同时 f ( x ) + λ T h ( x ) f(x)+\lambda^{\mathrm T}h(x) f(x)+λTh(x)是关于 λ \lambda λ的线性函数,既是凸函数也是凹函数, − 1 2 ρ ∥ λ − λ ˉ ∥ 2 -\frac{1}{2 \rho}\|\lambda-\bar{\lambda}\|^2 2ρ1λλˉ2是关于 λ \lambda λ的严格凹函数,因此整个函数仍为严格凹,对于严格凹问题 max ⁡ λ f ( x ) + λ T h ( x ) − 1 2 ρ ∥ λ − λ ˉ ∥ 2 \max _\lambda f(x)+\lambda^{\mathrm{T}} h(x)-\frac{1}{2 \rho}\|\lambda-\bar{\lambda}\|^2 maxλf(x)+λTh(x)2ρ1λλˉ2有唯一最优解 λ ∗ \lambda^* λ满足:
∂ { f ( x ) + λ ⊤ h ( x ) − 1 2 ρ ∥ λ − λ ∥ 2 } ∂ λ = h ( x ) − 1 ρ ( λ − λ ˉ ) = 0 \frac{\partial\left\{f(x)+\lambda^{\top} h(x)-\frac{1}{2 \rho}\|\lambda-\lambda\|^2\right\}}{\partial \lambda}=h(x)-\frac{1}{\rho}(\lambda-\bar{\lambda})=0 λ{f(x)+λh(x)2ρ1λλ2}=h(x)ρ1(λλˉ)=0
可解得 λ ∗ ( λ ˉ ) = λ ˉ + ρ h ( x ) \lambda^*(\bar{\lambda})=\bar{\lambda}+\rho h(x) λ(λˉ)=λˉ+ρh(x),即最优解 λ ∗ \lambda^* λ是关于 λ \lambda λ的函数。将 λ ∗ \lambda^* λ带入原问题:
min ⁡ x max ⁡ λ f ( x ) + λ T h ( x ) − 1 2 ρ ∥ λ − λ ˉ ∥ 2 = min ⁡ x f ( x ) + λ ∗ ( λ ˉ ) T h ( x ) − 1 2 ρ ∥ λ ∗ ( λ ˉ ) − λ ˉ ∥ 2 = min ⁡ x f ( x ) + ( λ ˉ + ρ h ( x ) ) T h ( x ) − ρ 2 ∥ h ( x ) ∥ 2 = min ⁡ x f ( x ) + λ ˉ T h ( x ) + ρ 2 ∥ h ( x ) ∥ 2 \begin{aligned} & \min _x \max _\lambda f(x)+\lambda^{\mathrm{T}} h(x)-\frac{1}{2 \rho}\|\lambda-\bar{\lambda}\|^2 \\ = & \min _x f(x)+\lambda^*(\bar{\lambda})^{\mathrm{T}} h(x)-\frac{1}{2 \rho}\left\|\lambda^*(\bar{\lambda})-\bar{\lambda}\right\|^2 \\ = & \min _x f(x)+(\bar{\lambda}+\rho h(x))^{\mathrm{T}} h(x)-\frac{\rho}{2}\|h(x)\|^2 \\ = & \min _x f(x)+\bar{\lambda}^{\mathrm{T}} h(x)+\frac{\rho}{2}\|h(x)\|^2 \end{aligned} ===xminλmaxf(x)+λTh(x)2ρ1λλˉ2xminf(x)+λ(λˉ)Th(x)2ρ1 λ(λˉ)λˉ 2xminf(x)+(λˉ+ρh(x))Th(x)2ρh(x)2xminf(x)+λˉTh(x)+2ρh(x)2
在这里插入图片描述

此时得到一个与原问题近似的无约束最优化问题,可以用例如L-BFGS方法求解。这就是PHR-ALM的基本思路,通过在原拉格朗日函数的基础之上增加一个增广项获得一个增广拉格朗日函数 L ( x , λ ; ρ ) \mathcal{L}(x, \lambda ; \rho) L(x,λ;ρ),来得到近似光滑且容易解的优化问题。为了更接近于原问题,有两种措施:(1)使 1 ρ → 0 \frac{1}{\rho} \rightarrow 0 ρ10 或者 ρ → + ∞ \rho \rightarrow+\infty ρ+,以获取二次罚函数的效果,但 ρ \rho ρ如果很大则和前面分析的罚函数缺陷一样,成为一个Hessian矩阵条件数爆炸的病态问题;(2)迭代更新先验值 λ ˉ ← λ ∗ ( λ ˉ ) \bar{\lambda} \leftarrow \lambda^*(\bar{\lambda}) λˉλ(λˉ)

下面介绍一种更为常用的增广拉格朗日函数形式。在迭代过程中,子内循环无约束优化问题 x k + 1 = argmin ⁡ x L ρ k ( x , λ k ) x^{k+1}=\operatorname{argmin}_x \mathcal{L}_{\rho^k}\left(x, \lambda^k\right) xk+1=argminxLρk(x,λk)每次都不需要求解很精确的 x k x^k xk,因为外循环会不断细化 λ k \lambda^k λk x k x^k xk

在这里插入图片描述

不等式约束非凸优化问题的PHR-ALM

对于不等式约束的非凸问题,核心思想是通过引入松弛变量 s s s,将不等式约束转化为等式约束,然后再写成增广拉格朗日函数形式。如下图所示,引入松弛变量 s s s,原问题维度从n维上升到n+m维。原问题为:
min ⁡ x ∈ R n f ( x )  s.t.  g ( x ) ≤ 0 \begin{array}{rl} \min _{x \in \mathbb{R}^n} & f(x) \\ \text { s.t. } & g(x) \leq 0 \end{array} minxRn s.t. f(x)g(x)0
引入松弛变量后变为等式约束的非凸优化问题:
min ⁡ x ∈ R n , s ∈ R m f ( x )  s.t.  g ( x ) + [ s ] 2 = 0 \begin{aligned} & \min _{x \in \mathbb{R}^n, s \in \mathbb{R}^m} f(x) \\ & \text { s.t. } \quad g(x)+[s]^2=0 \\ & \end{aligned} xRn,sRmminf(x) s.t. g(x)+[s]2=0
将转化后的问题写成增广拉格朗日函数形式:
min ⁡ x ∈ R n , s ∈ R m f ( x ) + ρ 2 ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 = min ⁡ x ∈ R n min ⁡ s ∈ R m f ( x ) + ρ 2 ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 = min ⁡ x ∈ R n f ( x ) + ρ 2 ∥ max ⁡ [ g ( x ) + λ ρ , 0 ] ∥ 2 \min _{x \in \mathbb{R}^n, s \in \mathbb{R}^m} f(x)+\frac{\rho}{2}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2=\min _{x \in \mathbb{R}^n} \min _{s \in \mathbb{R}^m} f(x)+\frac{\rho}{2}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2=\min _{x \in \mathbb{R}^n} f(x)+\frac{\rho}{2}\left\|\max \left[g(x)+\frac{\lambda}{\rho}, 0\right]\right\|^2 xRn,sRmminf(x)+2ρ g(x)+[s]2+ρλ 2=xRnminsRmminf(x)+2ρ g(x)+[s]2+ρλ 2=xRnminf(x)+2ρ max[g(x)+ρλ,0] 2
为与等式约束的拉格朗日乘子 λ \lambda λ区分开,将不等式约束非凸问题的增广拉格朗日函数写成:
L ρ ( x , μ ) : = f ( x ) + ρ 2 ∥ max ⁡ [ g ( x ) + μ ρ , 0 ] ∥ 2 \mathcal{L}_\rho(x, \mu):=f(x)+\frac{\rho}{2}\left\|\max \left[g(x)+\frac{\mu}{\rho}, 0\right]\right\|^2 Lρ(x,μ):=f(x)+2ρ max[g(x)+ρμ,0] 2
更新拉格朗日乘子 μ k + 1 = μ k + ρ h ( x k + 1 ) = μ k + ρ ( g ( x k + 1 ) + [ s k + 1 ] 2 ) \mu^{k+1}=\mu^k+\rho h(x^{k+1})=\mu^k+\rho\left(g\left(x^{k+1}\right)+\left[s^{k+1}\right]^2\right) μk+1=μk+ρh(xk+1)=μk+ρ(g(xk+1)+[sk+1]2)。对于 g ( x k + 1 ) + [ s k + 1 ] 2 g\left(x^{k+1}\right)+\left[s^{k+1}\right]^2 g(xk+1)+[sk+1]2,当 g ( x k + 1 ) > 0 g\left(x^{k+1}\right)>0 g(xk+1)>0,取 [ s ] 2 [s]^2 [s]2=0,当 g ( x k + 1 ) ≤ 0 g\left(x^{k+1}\right)\leq0 g(xk+1)0,取 [ s ] 2 = ∣ g ( x x + 1 ) ∣ [s]^2=\left|g\left(x^{x+1}\right)\right| [s]2= g(xx+1) ,因此有 g ( x k + 1 ) + [ s k + 1 ] 2 = max ⁡ [ g ( x k + 1 ) , 0 ] g\left(x^{k+1}\right)+\left[s^{k+1}\right]^2=\max \left[g\left(x^{k+1}\right), 0\right] g(xk+1)+[sk+1]2=max[g(xk+1),0]。综上,可消除松弛变量的影响从而得到:
μ k + 1 = max ⁡ [ μ k + ρ g ( x k + 1 ) , 0 ] \mu^{k+1}=\max \left[\mu^k+\rho g\left(x^{k+1}\right), 0\right] μk+1=max[μk+ρg(xk+1),0]
在这里插入图片描述

求证: min ⁡ x ∈ R n min ⁡ s ∈ R m f ( x ) + ρ 2 ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 = min ⁡ x ∈ R n f ( x ) + ρ 2 ∥ max ⁡ [ g ( x ) + λ ρ , 0 ] ∥ 2 \min _{x \in \mathbb{R}^n} \min _{s \in \mathbb{R}^m} f(x)+\frac{\rho}{2}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2=\min _{x \in \mathbb{R}^n} f(x)+\frac{\rho}{2}\left\|\max \left[g(x)+\frac{\lambda}{\rho}, 0\right]\right\|^2 minxRnminsRmf(x)+2ρ g(x)+[s]2+ρλ 2=minxRnf(x)+2ρ max[g(x)+ρλ,0] 2

证明:在前述问题中,已知 min ⁡ x ∈ R n , s ∈ R m f ( x ) + ρ 2 ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 \min _{x \in \mathbb{R}^n, s \in \mathbb{R}^m} f(x)+\frac{\rho}{2}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2 minxRn,sRmf(x)+2ρ g(x)+[s]2+ρλ 2 等价于 min ⁡ x ∈ R n min ⁡ s ∈ R m f ( x ) + ρ 2 ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 \min _{x \in \mathbb{R}^n} \min _{s \in \mathbb{R}^m} f(x)+\frac{\rho}{2}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2 minxRnminsRmf(x)+2ρ g(x)+[s]2+ρλ 2

对于松弛变量 s ∈ R m s \in \mathbb R^m sRm而言,其最优化问题为:
min ⁡ s ∈ R m ∥ g ( x ) + [ s ] 2 + λ p ∥ 2 \min _{s \in \mathbb{R}^m}\left\|g(x)+[s]^2+\frac{\lambda}{p}\right\|^2 sRmmin g(x)+[s]2+pλ 2
g ( x ) + λ ρ = a g(x)+\frac{\lambda}{\rho}=a g(x)+ρλ=a,有 min ⁡ s ∈ R m ∥ a + [ s ] 2 ∥ 2 \min _{s \in \mathbb{R}^m}\left\|a+[s]^2\right\|^2 minsRm a+[s]2 2

a > 0 a>0 a>0时, min ⁡ ( ∥ a + [ s ] 2 ∥ 2 ) = a \min \left(\left\|a+[s]^2\right\|^2\right)=a min( a+[s]2 2)=a,取 [ s ] 2 = 0 [s]^2=0 [s]2=0

a ≤ 0 a \leq 0 a0时, min ⁡ ( ∥ a + [ s ] 2 ∥ 2 ) = 0 \min \left(\left\|a+[s]^2\right\|^2\right)=0 min( a+[s]2 2)=0,取 [ s ] 2 = ∣ a ∣ [s]^2=|a| [s]2=a

所以,
min ⁡ s ∈ R m ∥ g ( x ) + [ s ] 2 + λ ρ ∥ 2 = ∥ max ⁡ [ g ( x ) + λ ρ , 0 ] ∥ 2 \min _{s \in \mathbb{R}^m}\left\|g(x)+[s]^2+\frac{\lambda}{\rho}\right\|^2=\left\|\max \left[g(x)+\frac{\lambda}{\rho}, 0\right]\right\|^2 sRmmin g(x)+[s]2+ρλ 2= max[g(x)+ρλ,0] 2

对于一般非凸优化问题的PHR-ALM

结合等式约束和不等式约束的分析,直接将等式约束拉格朗日函数的增广项和不等式约束拉格朗日函数的增广项相加,得到:
L ρ ( x , λ , μ ) : = f ( x ) + ρ 2 { ∥ h ( x ) + λ ρ ∥ 2 + ∥ max ⁡ [ g ( x ) + μ ρ , 0 ] ∥ 2 } \mathcal{L}_\rho(x, \lambda, \mu):=f(x)+\frac{\rho}{2}\left\{\left\|h(x)+\frac{\lambda}{\rho}\right\|^2+\left\|\max \left[g(x)+\frac{\mu}{\rho}, 0\right]\right\|^2\right\} Lρ(x,λ,μ):=f(x)+2ρ{ h(x)+ρλ 2+ max[g(x)+ρμ,0] 2}
在这里插入图片描述


参考文献

机器人中的数值优化

最优化:建模、算法与理论/最优化计算方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/361921.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【MyBatis】逆向工程与分页插件

11、MyBatis的逆向工程 11.1、创建逆向工程的步骤 正向工程:先创建Java实体类,由框架负责根据实体类生成数据库表。 Hibernate是支持正向工程的。 逆向工程:先创建数据库表,由框架负责根据数据库表,反向生成如下资源…

公司技术团队为什么选择使用 YApi 作为 Api 管理平台?

在 2021 年 12 月份的时候我就推荐过一款软件程序员软件推荐:Apifox,当时体验了一下里面的功能确实很实用,但是当时公司有一套自己的 API 管理方案,所有 Apifox 暂时就没在内部使用。 直到最近要使用其他的 API 管理方案的时候才…

SAP ERP系统PP模块MRP运行参数说明

SAP/PP模块运行MRP(MD01/MD02)的界面有很多参数,这些参数的设置上线前由PP业务顾问根据实际业务需求定义好的,上线后一般不会轻易去调整,对于一般操作用户,按手册操作就行,不需要深入了解这些参数,但作为负…

收藏这几个开源管理系统做项目,领导看了直呼牛X!

项目SCUI Admin 中后台前端解决方案Vue .NetCore 前后端分离的快速发开框架next-admin 适配移动端、pc的后台模板django-vue-admin-pro 快速开发平台Admin.NET 通用管理平台RuoYi 若依权限管理系统Vue3.2 Element-Plus 后台管理框架Pig RABC权限管理系统zheng 分布式敏捷开发…

Redis的下载与安装

为便于大多数读者学习本套教程,教程中采用 Windows 系统对 Redis 数据库进行讲解。虽然 Redis 官方网站没有提供 Windows 版的安装包,但可以通过 GitHub 来下载 Windows 版 Redis 安装包,下载地址:点击前往。 注意:Win…

企业级解决方案Redis

缓存预热“宕机”服务器启动后迅速宕机1. 请求数量较高2. 主从之间数据吞吐量较大,数据同步操作频度较高解决方案前置准备工作:1. 日常例行统计数据访问记录,统计访问频度较高的热点数据2. 利用LRU数据删除策略,构建数据留存队列例…

全链路压力测试

压力测试的目标: 探索线上系统流量承载极限,保障线上系统具备抗压能力 复制代码 如何做全链路压力测试: 全链路压力测试:整体步骤 容量洪峰 -》 容量评估 -》 问题发现 -》 容量规划 全链路压力测试:细化过程 整体目…

Apache Shiro与Spring Security对比

Apache Shiro VS Spring Security 1.Spring Security 官方文档:https://spring.io/projects/spring-security#overview介绍: Spring Security是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架。它提供了一组可以在Spr…

Java 基础(3)—synchornized 关键字简单理解

一、synchronized 修饰同步代码块 用 synchronized 修饰代码段作为同步锁,代码如下: public class LockDemo {public Object object new Object();public void show(){synchronized (object) {System.out.println(">>>>>>hell…

java Spring aop多个增强类作用于同一个方法时,设置优先级

我们先来模拟这种情况 我们先创建一个java项目 然后 引入Spring aop需要的基本依赖 然后 在src下创建一个包 我这里叫 Aop 在Aop包下创建一个类 叫 User 参考代码如下 package Aop;import org.springframework.stereotype.Component;Component public class User {public vo…

Java-形参与返回值

Java学习之道-1 一、形参与返回值 平时在进行代码编写的时候大多都是以变量作为形参或者以某种数据类型比如int、String或者Boolean等等作为返回值,本次主要介绍以下三种作为形参与返回值的情况 1、类名作为形参与返回值 类名,顾名思义是定义的class类&a…

国家级高新区企业主要经济指标(2012-2021年)

数据来源:国家统计局 时间跨度:2012-2021 区域范围:全国(及各分类统计指标) 指标说明:手工提取最新的中国统计年鉴数据中各个excel指标表,形成各个指标文件的多年度数据,便于多年…

物联网发展的重要通信技术Wi-Fi

Wi-Fi 可以适应各种场景的联网需求 Wi-Fi 在实现物联网创新方面发挥了基础性作用,提供了广泛的连接性,将各种“事物”相互连接、连接到互联网,以及连接到全球使用的 180 亿台 Wi-Fi 设备。物联网的经济潜力是无限的,Wi-Fi 为智能…

Spring aop之针对注解

前言 接触过Spring的都知道,aop是其中重要的特性之一。笔者在开发做项目中,aop更多地是要和注解搭配:在某些方法上加上自定义注解,然后要对这些方法进行增强(很少用execution指定,哪些包下的哪些方法要增强)。那这时就…

每日一题——L1-069 胎压监测(15)

L1-069 胎压监测 分数 15 小轿车中有一个系统随时监测四个车轮的胎压,如果四轮胎压不是很平衡,则可能对行车造成严重的影响。 让我们把四个车轮 —— 左前轮、右前轮、右后轮、左后轮 —— 顺次编号为 1、2、3、4。本题就请你编写一个监测程序&#…

Windows 10/11如何恢复已删除的照片?

如果你想在Windows 11或Windows 10上恢复已删除的照片,你可以参考这篇文章,使用2种方法轻松恢复Windows上永久删除的照片。 可以恢复电脑上已删除的照片吗? 随着科技的发展,越来越多的用户习惯于在电子设备上存储照片。如果这些…

实时渲染为什么快,能不能局域网部署点量云

提到渲染很多有相关从业经验的人员可能会想起,自己曾经在电脑上渲染一个模型半天或者更长的 时间才能完成的经历。尤其是在项目比较着急的时候,这种煎熬更是难受。但现在随着实时渲染和云渲染行业的发展,通过很多方式可以提升渲染的时间和效率…

管理数据就这样轻松:TablePlus 5.3.1Crack

数据库管理变得简单 适用于关系数据库的现代、原生且友好的 GUI 工具:MySQL、PostgreSQL、SQLite 等 支持一整套关系数据库(和一些 NoSQL) 数据库MySQL红移数据库服务器SQLite数据库雷迪斯卡桑德拉蟑螂数据库数据库垂直 我们的客户来自世界上…

数据结构(四):树、二叉树、二叉搜索树

数据结构(四)一、树1.树结构2.树的常用术语二、二叉树1.什么是二叉树2.二叉树的数据存储(1)使用数组存储(2)使用链表存储三、二叉搜索树1.这是什么东西2.封装二叉搜索树:结构搭建3. insert插入节…

分析| 2023年移动开发平台的发展空间

春节过后返工已经过月,许多移动开发领域的企业都在忙着做技术调研与选型。在此之前,不如先回顾一下2022年的市场趋势,再结合好的移动开发平台的标准,从中窥见2023年的发展前景。 Gartner十大战略技术趋势 全球权威咨询机构Gartne…