Lyapunov optimization 李雅普诺夫优化

news2024/11/24 15:29:32

文章目录

  • 正文
    • 引言
    • Lyapunov drift for queueing networks 排队网络的Lyapunov漂移
      • Quadratic Lyapunov functions 二次李雅普诺夫函数
      • Bounding the Lyapunov drift 李亚普诺夫漂移的边界
      • A basic Lyapunov drift theorem 一个基本的李雅普诺夫漂移定理
    • Lyapunov optimization for queueing networks 排队网络的Lyapunov优化
  • 参考资料

正文

本文描述了动力系统的李雅普诺夫优化。(动力系统:随时间变化的系统)
给出了在排队网络最优控制中的应用实例。

引言

李雅普诺夫优化是指利用李雅普诺夫函数对动力系统进行最优控制。
李雅普诺夫函数在控制理论中被广泛应用于保证不同形式的系统稳定性。
系统在特定时间的状态通常用多维向量来描述。
李雅普诺夫函数是这种多维状态的一个非负标量度量(a nonnegative scalar measure)。
通常,函数被定义为当系统走向不希望的状态时变大
系统稳定性是通过采取控制动作使李雅普诺夫函数在负方向上向零漂移来实现的。

在这里插入图片描述

李雅普诺夫漂移是研究排队网络最优控制的核心。
一个典型的目标是稳定所有网络队列,同时优化某些性能目标,例如最小化平均能量或最大化平均吞吐量。
最小化二次Lyapunov函数的漂移对应用于网络稳定性的backpressure routing算法,也称为最大权重算法。[1][2]
在Lyapunov漂移中加入加权惩罚项并使其和最小化,得到了用于联合网络稳定性和惩罚最小化的漂移+惩罚算法。[3][4][5]
漂移加惩罚过程也可用于计算凸规划和线性规划的解。[6]

Lyapunov drift for queueing networks 排队网络的Lyapunov漂移

考虑一个随着具有标准化时隙 t ∈ { 0 , 1 , 2 , . . . } t∈\{0,1,2,...\} t{0,1,2,...}的离散时间变化的排队网络。
假设网络中有 N N N 个队列,并定义在时间 t t t 时队列积压向量为
在这里插入图片描述

Quadratic Lyapunov functions 二次李雅普诺夫函数

对于每个时隙,定义
在这里插入图片描述

该函数是网络中总队列积压的标量度量。它被称为关于队列状态的二次Lyapunov函数。

将李雅普诺夫漂移定义为该函数从一个时隙到下一个时隙的变化
在这里插入图片描述

Bounding the Lyapunov drift 李亚普诺夫漂移的边界

假设队列积压根据以下等式随时间变化:
在这里插入图片描述

其中, a i ( t ) a_{i}(t) ai(t) b i ( t ) b_{i}(t) bi(t)分别为时隙 t t t 上队列 i i i 的到达和服务机会。该式可用于计算任意时隙 t t t 上的Lyapunov漂移的边界:

由上式推出:
Δ L ( t ) = L ( t + 1 ) − L ( t ) = 1 2 ∑ i = 1 N ( Q i ( t + 1 ) 2 − Q i ( t ) 2 ) ≤ 1 2 ∑ i = 1 N ( ( Q i ( t ) + a i ( t ) − b i ( t ) ) 2 − Q i ( t ) 2 ) ≤ 1 2 ∑ i = 1 N ( a i ( t ) + b i ( t ) ) 2 + ∑ i = 1 N Q i ( t ) ( a i ( t ) − b i ( t ) ) \Delta L(t)= L(t+1)-L(t)\\=\frac{1}{2}\sum_{i=1}^{N}(Q_i(t+1)^2-Q_i(t)^2)\\\le\frac{1}{2}\sum_{i=1}^{N}((Q_i(t)+a_i(t)-b_i(t))^2-Q_i(t)^2)\\\le\frac{1}{2}\sum_{i=1}^{N}(a_i(t)+b_i(t))^2+\sum_{i=1}^{N}Q_i(t)(a_i(t)-b_i(t)) ΔL(t)=L(t+1)L(t)=21i=1N(Qi(t+1)2Qi(t)2)21i=1N((Qi(t)+ai(t)bi(t))2Qi(t)2)21i=1N(ai(t)+bi(t))2+i=1NQi(t)(ai(t)bi(t))
B ( t ) = 1 2 ∑ i = 1 N ( a i ( t ) + b i ( t ) ) 2 B(t)=\frac{1}{2}\sum_{i=1}^{N}(a_i(t)+b_i(t))^2 B(t)=21i=1N(ai(t)+bi(t))2,则有

在这里插入图片描述
其中:在这里插入图片描述

假设每个队列的到达和服务这两项是有界的,因此存在一个有限常数 B > 0 B>0 B>0,使得对于所有 t t t 和所有可能的队列向量 Q ( t ) Q(t) Q(t) 都成立如下性质:
在这里插入图片描述

取(Eq. 1)的条件期望,得到Lyapunov漂移的条件期望的边界如下:
在这里插入图片描述

A basic Lyapunov drift theorem 一个基本的李雅普诺夫漂移定理

在许多情况下,网络可以被控制,因此每个队列的到达和服务之间的差异对某个实数 ε > 0 \varepsilon>0 ε>0 满足以下的性质:
在这里插入图片描述
如果上式对于所有队列 i i i、所有时隙 t t t 和所有可能的向量 Q ( t ) \displaystyle Q(t) Q(t) 对相同ε成立,则(等式2)简化为以下李亚普诺夫漂移定理中使用的漂移条件。
下面的定理可以看作是马尔可夫链的Foster定理的一个变体。然而,它不需要马尔可夫链结构。


定理(Lyapunov Drift)
假设存在常数 B ≥ 0 , ε > 0 B\ge0,\varepsilon>0 B0,ε>0 使得对于所有的 t t t 和可能的向量 Q ( t ) Q(t) Q(t) ,条件李雅普诺夫漂移满足:

在这里插入图片描述

注等式2.在这里插入图片描述

则对所有的时隙 t > 0 t>0 t>0,网络中的时间平均队列大小满足:
在这里插入图片描述


证明
取漂移不等式两边的期望,利用迭代期望定律,得到:
在这里插入图片描述
将上式对 τ ∈ { 0 , 1 , . . . , t − 1 } \tau∈\{0,1,...,t-1\} τ{0,1,...,t1} 求和,利用可伸缩和定律,得到:
在这里插入图片描述
利用 L ( t ) L(t) L(t) 非负的事实,重新排列上式中的各项,证明了结果。

Lyapunov optimization for queueing networks 排队网络的Lyapunov优化

考虑与上一节相同的排队网络。
现在定义 p ( t ) p(t) p(t) 作为在时隙 t t t 上产生的网络惩罚。
假设目标是稳定排队网络,同时最小化 p ( t ) p(t) p(t) 的时间平均值。

例如,为了稳定网络,同时最小化时间平均功率, p ( t ) p (t) p(t) 可定义为网络在时隙 t t t 上产生的总功率。处理某些理想报酬 r ( t ) r(t) r(t) 的时间平均值最大化的问题,可以定义惩罚 p ( t ) = − r ( t ) p(t)=-r(t) p(t)=r(t)。这对于在保证稳定性的前提下最大化整个网络的效用是很有用的。

在稳定网络的同时最小化惩罚 p ( t ) p(t) p(t) 的平均时间,网络算法可以设计成使控制动作贪婪地最小化下面每个时隙上的漂移加惩罚表达式的边界:
在这里插入图片描述
其中 V V V 是一个非负的权重,可以根据需要选择它来影响性能权衡。这种方法的一个关键特征是,它通常不需要了解随机网络事件(例如随机作业到达或通道实现)的概率。选择 V = 0 V=0 V=0 可简化为最小化每个槽漂移的边界,对于多跳队列网络中的路由,可简化为Tassiulas和Ephremides开发的背压路由算法。

使用 V = 0 V=0 V=0 并定义 p ( t ) p(t) p(t) 为插槽 t t t 上的网络功耗引出了Neely提出的在保证网络稳定性的前提下最小化平均功率的漂移加惩罚算法[8]。
使用 V = 0 V=0 V=0 并使用 p ( t ) p(t) p(t) 作为允许控制效用度量的负值,引出了Neely、Modiano和Li开发的用于联合流量控制和网络路由的漂移加惩罚算法。


在这种情况下,前一节的李雅普诺夫漂移定理的推广是重要的。为了说明简单,假设 p ( t ) p(t) p(t) 有界于下:
在这里插入图片描述
例如,上面满足 p m i n = 0 p_{min}=0 pmin=0 在这种情况下 p ( t ) p(t) p(t) 总是非负的。让 p ∗ p^{*} p 表示 p ( t ) p(t) p(t) 的时间平均值的期望目标。
V V V 是一个参数,用来衡量达到目标的重要性。以下定理表明,如果满足漂移+惩罚条件,则时间平均惩罚最多比期望目标高出O(1/V),而平均队列大小为O(V)。
V V V 参数可以调优,使平均时间惩罚尽可能接近(或低于)所需的目标,并进行相应的队列大小权衡。


定理(Lyapunov Optimization)

假设存在常数 ε > 0 , V , B ≥ 0 \varepsilon>0,V,B\ge0 ε>0,V,B0 以及 p ∗ p^* p 对于所有的 t t t 和所有可能的向量 Q ( t ) Q(t) Q(t) ,以下漂移加惩罚条件成立:
在这里插入图片描述

则对于所有 t > 0 t>0 t>0 ,时间平均惩罚和时间平均队列大小满足:
在这里插入图片描述
在这里插入图片描述


证明
取假定漂移加惩罚的两边的期望并使用迭代期望定律,我们得到:
在这里插入图片描述
在前 t t t 个时隙上求和,并且使用伸缩和定律给出:
在这里插入图片描述
除以 V t {\displaystyle Vt} Vt 并且重新排列项证明了时间平均惩罚边界。一个类似的论证证明了时间平均队列大小边界。

参考资料

https://en.wikipedia.org/wiki/Lyapunov_optimization

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1037981.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

甲方测试如何做好外包项目的测试验收?

春节匆匆而过,打工人陆续回到了工作岗位又开始卷了起来。小酋也一样,已经返岗几天,今天趁着节后综合症消去大半又该聊点什么了。最近在做一个视频AI分析项目的测试验收,今天就围绕“如何做好外包项目的测试验收”为题,…

详细学习Mybatis(1)

详细学习Mybatis(1) 一、MyBatis概述1.1 框架1.2 三层框架1.3 了解Mybatis 二、Mybatis入门开发2.1 入门2.2、MyBatis入门程序的一些小细节2.3、MyBatis事务管理机制深度解析2.4、在开发中junit是如何使用的2.5、Mybatis集成日志框架logback 一、MyBatis…

从网络方面解决Android Sutdio遇到的Unable to access Android SDK add-on list问题

依然说一下环境: 家庭宽带网络win11环境安装的Android Studio版本:android-studio-2022.3.1.19-windowsJava版本:OpenJDK11 (这个应该无所谓) 问题描述: Unable to access Android SDK add-on list 要我…

Pytorch之LeNet-5图像分类

💂 个人主页:风间琉璃🤟 版权: 本文由【风间琉璃】原创、在CSDN首发、需要转载请联系博主💬 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦 目录 前言 一、LeNet-5 二、LeNet-5网络实现 1.定义LeNet-5模型 2.加载数…

解决apk签名时 no conscrypt_openjdk_jni in java.library.path 方法

使用下面命令时若出现no conscrypt_openjdk_jni in java.library.path java -jar signapk.jar platform.x509.pem platform.pk8 app-debug.apk app-debug_sign.apk 缺少相关库,从以下位置下载,只在 android11下测试通过。 https://download.csdn.net…

2023 年前端 UI 组件库概述,百花齐放!

UI组件库提供了各种常见的 UI 元素,比如按钮、输入框、菜单等,只需要调用相应的组件并按照需求进行配置,就能够快速构建出一个功能完善的 UI。 虽然市面上有许多不同的UI组件库可供选择,但在2023年底也并没有出现一两个明确的解决…

java面试题-常见技术场景

常见技术场景 1.单点登录这块怎么实现的 1.1 概述 单点登录的英文名叫做:Single Sign On(简称SSO),只需要登录一次,就可以访问所有信任的应用系统 在以前的时候,一般我们就单系统,所有的功能都在同一个…

EtherCAT转Modbus网关做为 MODBUS 从站配置案例

兴达易控EtherCAT转Modbus网关可以用作MODBUS从站的配置。这种网关允许将Modbus协议与EtherCAT协议进行转换,从而实现不同通信系统之间的互操作性。通过将Modbus从站配置到网关中,可以实现对Modbus设备的访问和控制。同时,该网关还可以扩展Mo…

mysql基本语句学习(基本)

1.本地登录 mysql -u root -p 密码 mysql开启远程 1.查看数据库 show databases; 2.查看当前所示数据库 select database(); 3.创建数据库 create database 数据库名字; 4.查看创建数据库语句 show create database 数据库名字; 2.…

(十一)VBA常用基础知识:worksheet的各种操作之sheet删除

当前sheet确认 2.Sheets(1).Delete Sub Hello()8 Sheets(1).DeleteSheets(1).Delete End Sub实验得知, Sheets(1).Delete删除的是最左边的sheet 另外,因为有弹出提示信息的确认框,这个在代码执行时,会导致还需要手动点击一下&a…

仿制 Google Chrome 的恐龙小游戏

通过仿制 Google Chrome 的恐龙小游戏,我们可以掌握如下知识点: 灵活使用视口单位掌握绝对定位JavaScript 来操作 CSS 变量requestAnimationFrame 函数的使用无缝动画实现 页面结构 实现页面结构 通过上述的页面结构我们可以知道,此游戏中…

【多态】虚函数表存储在哪个区域?

A:栈 B:堆 C:代码段&#xff08;常量区&#xff09; D:数据段&#xff08;静态区&#xff09; 答案 &#xff1a; 代码段&#xff08;常量区&#xff09; 验证如下&#xff1a; class Person { public:virtual void BuyTicket() { cout << "Person::BuyTicket()&q…

【Hash表】判断有没有重复元素-力扣 217

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

认识HTTP和HTTPS协议

HTTPS 是什么 HTTPS 也是一个应用层协议. 是在 HTTP 协议的基础上引入了一个加密层. 为什么要引入加密层呢&#xff1f; HTTP 协议内容都是按照文本的方式明文传输的. 这就导致在传输过程中出现一些被篡改的情况. HTTPS就是在HTTP的基础上进行了加密&#xff0c;进一步的保…

群体遗传学-选择消除分析

一、选择消除分析 所谓选择性清除&#xff1a;当一个有利突变发生后&#xff0c;这个突变基因的适合度越高&#xff0c;就越容易被选择固定。当这个基因被快速固定之后&#xff0c;与此基因座连锁的染色体区域&#xff0c;由于搭车效应也被固定下来&#xff0c;大片紧密连锁的染…

【跟小嘉学习区块链】二、Hyperledger Fabric 架构详解

系列文章目录 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 【跟小嘉学习区块链】一、区块链基础知识与关键技术解析 文章目录 系列文章目录[TOC](文章目录) 前言一、Hyperledger 社区1.1、Hyperledger(面向企业的分布式账本)1.2、Hyperledger社区组织结构 二、Hype…

UDS 28服务

28服务主要是用来控制报文接收和发送。 具体的服务控制格式&#xff1a; controlType 通信控制类型 tips&#xff1a;Bit7 用于是否抑制积极响应。 communication 报文类型 例子

Mysql 数据类型、运算符

数据类型 数据类型的选择不是越大越好&#xff0c;因为我们业务层一般都是在内存上工作的&#xff0c;效率以及速度是比较快的&#xff0c;但是我们的数据库涉及磁盘的IO操作磁盘的IO操作相对来说是要慢很多的&#xff0c;所以我们在定义表结构的时候每一个字段的数据类型还是比…

API网关是如何提升API接口安全管控能力的

API安全的重要性 近几年&#xff0c;越来越多的企业开始数字化转型之路。数字化转型的核心是将企业的服务、资产和能力打包成服务&#xff08;服务的形式通常为API&#xff0c;API又称接口&#xff0c;下文中提到的API和接口意思相同&#xff09;&#xff0c;从而让资源之间形…

计算机组成原理课程设计

操作控制和顺序控制 操作控制就是由各种微命令来构成的顺序控制就是由P测试和后续微地址构成的 这就构成了整个微指令的三个部分 访存指令就是实现对主存中的数据进行访问或存储 一、 操作控制字段是由各种微命令来构成的&#xff0c;这些微命令怎么来设计&#xff1f; 一个萝卜…