智慧通信|IEEE Trans. Commun. 论文解读:延迟敏感的能量收集无线传感器的最佳调度、结构特性和近似分析

news2025/1/15 7:02:27

原文信息

Sharma, Nikhilesh, Nicholas Mastronarde, and Jacob Chakareski. “Delay-sensitive energy-harvesting wireless sensors: Optimal scheduling, structural properties, and approximation analysis.” IEEE Transactions on Communications 68.4 (2019): 2509-2524.

关键字:马尔可夫决策过程、能量收集、延迟敏感无线传感、近似动态规划、结构特性

1 问题背景

能量受限 (energy-constrained) 的无线传感器通常运行在动态信道 (dynamic channel) 和对数据传输延迟非常敏感的环境中。这种传感器具备能量收集能力,能利用环境中的能量(例如环境光或射频能量)维持自身能量所需。这种新兴应用的成功关键在于及时传输采集的数据,而成功部署此类系统的关键是理解此类系统在不同运行条件下的基本性能极限,以及有效计算达到该极限的最佳策略

文章考虑一个在衰落信道上传输延迟敏感数据的能量收集传感器 (energy-harvesting sensor, EHS),并将其构建为延迟敏感能量收集调度 (delay-sensitive energy harvesting scheduling, DSEHS) 问题。尽管EHSs可以在不更换电池的情况下自主运行,但能量收集源中的流量负载、能量收集和信道变化随机性对传感器功率管理、传输功率分配和传输调度提出了新的挑战。截止原文发表,许多研究确定了多种计算最优策略的方法,但它们并没有提供对其结构性质的一般性见解。本文作者在文章中将 DSEHS 问题构建为一个马尔可夫决策过程 (Markov Decision Process, MDP),并分析了其性质,在此基础上量化了在给定能量收集的情况下最小化队列延迟的最优调度策略的长期性能,并提出一种低复杂度的近似值迭代算法来计算近似最优策略,其在近似精度、计算复杂度和内存之间提供了一种可控的权衡。具体而言,文章探讨了以下问题:

  1. 如何建模时延敏感的能量收集调度问题 (DSEHS) ?
  2. 最优价值函数关于状态是否有良好的结构性质?(最优价值函数即最优策略下使得目标函数能取得的最小值)
  3. 如何设计近似值迭代算法?
  4. 近似值迭代算法的有效性如何?

2 无线传感器模型

考虑一种在衰落信道上传输延迟敏感数据的时隙单输入单输出能量收集传感器,系统模型如图1所示。该系统包括两个缓冲区:大小为 N b N_b Nb的数据包缓冲区和大小为 N e N_e Ne的能量缓冲区(电池)。


图1:能量收集无线传感器模型

假设时间被划分为长度为 Δ T ( s ) \Delta T(s) ΔT(s)的时隙,系统在第 n n n个时隙的状态表示为 s n = ( b n , e n , h n ) ∈ S s^n=(b^n,e^n,h^n)\in \mathcal{S} sn=(bn,en,hn)S, 其中 b n b^n bn为数据包缓冲状态(即积压的数据包数量), e n e^n en为电池状态(即可用能量包数), h n h^n hn为信道衰落状态。在第 n n n个时隙开始时,传输调度器观察系统状态 s n s^n sn,并采取调度动作 a n a^n an.

信道模型 P h ( h ′ ∣ h ) P^h(h'|h) Ph(hh):假设信道是一个块衰落信道,在每个时隙内信道是恒定的,但在不同时隙之间信道可能发生变化。假设发射机在每个时隙开始时就已知信道状态 h n h^n hn,因此信道状态变化可以建模为具有转移概率函数 P h ( h ′ ∣ h ) P^h(h'|h) Ph(hh)的马尔可夫链。

物理层模型 P TX n = P TX ( h n , a n ; B E P t a r g e t ) P_{\text{TX}}^n=P_{\text{TX}}(h^n,a^n;BEP_{target}) PTXn=PTX(hn,an;BEPtarget),其中为所有传输设置一个目标比特错误概率(bit error probability, BEP). 假设给定信道状态和目标BEP,发射功率是调度动作 a n a^n an的非减函数。

能量收集模型: e n + 1 = min ⁡ ( e n − e TX n + e H n , N e ) e^{n+1}=\min(e^n-e_{\text {TX}}^n+e^n_{H},N_e) en+1=min(eneTXn+eHn,Ne),其中 e h n e^n_h ehn表示第 n n n个时隙可收集的能量包数量,在第 n n n个时隙到达的能量包可以用于未来的时隙, e T X n = e T X ( h n , a n ; B E P t a r g e t ) e^n_{TX}= e_{TX}(h^n, a^n;BEP_{target}) eTXn=eTX(hn,an;BEPtarget)表示在时隙 n n n消耗的能量包数,并假设传输能量 e T X n e^n_{TX} eTXn是能量包的整数倍。

流量模型 b n + 1 = min ⁡ ( b n − f n + l n , N b ) b^{n+1}=\min(b^n-f^n+l^n,N_b) bn+1=min(bnfn+ln,Nb),其中 I n I^n In表示传感器在第 n n n个时隙中产生的数据包数量, f n = f ( a n ; B E P t a r g e t ) f^n = f(a^n;BEP_{target}) fn=f(an;BEPtarget) n n n个时隙中成功发送 (goodput) 的数据量。需要注意的是,新到的数据和未成功接收的数据必须在未来的一个时隙中重新发送。

3 延迟敏感能量收集调度问题

DSEHS 问题的目标是在给定可用能量的情况下,确定使平均分组排队延迟最小化的最优策略 π ∗ \pi^* π, 但这并不意味着只要有足够的能量,该策略就会无限地地发送分组——相反,避免在坏信道状态下发送分组,系统倾向于等待在好的信道状态下发送分组,以节省有限的能量收集。另一方面,如果电池 (几乎) 满了,通过传输数据包来消耗能量将为更多收集的能量腾出空间,否则这些能量将因电池大小有限而丢失。

问题表述

现定义一个缓冲区成本来量化大的队列积压。形式上,将缓冲区成本 (buffer cost) 定义为数据队列的积压长度和数据溢出成本之和
c ( [ b , h ] , a ) = b + E f , l [ η max ⁡ { b − f + l − N b , 0 } ] , c([b,h],a)=b+\mathbb{E}_{f,l}[\eta\max\{b-f+l-N_b,0\}], c([b,h],a)=b+Ef,l[ηmax{bf+lNb,0}],
值函数 V π ( s ) V^π (s) Vπ(s)
V π ( s ) = E [ ∑ n = 0 ∞ ( γ ) n c ( s n , π ( s n ) ) ∣ s = s 0 ] V^\pi(s)=\mathbb{E}\left[\sum_{n=0}^\infty(\gamma)^nc(s^n,\pi(s^n))|s=s^0\right] Vπ(s)=E[n=0(γ)nc(sn,π(sn))s=s0]
表示 EHS 在遵循策略 π π π时处于某个状态的好(或坏)程度,其中 γ \gamma γ是折扣化因子,且 c ( s , a ) c(s,a) c(s,a) c ( [ b , h ] , a ) c([b,h],a) c([b,h],a)指代相同的量。因此 DSEHS 问题的目标是确定解决以下优化问题的最优策略 π ∗ \pi^* π: min ⁡ π ∈ Π V π ( s ) \min_{\pi\in\Pi}V^\pi(s) minπΠVπ(s) ,其中
V ∗ ( s ) = min ⁡ a ∈ A ( b , e , h ) { c ( [ b , h ] , a ) + γ E l , f , e H , h ′ [ V ∗ ( min ⁡ ( b − f + l , N b ) , min ⁡ ( e − e T X ( h , a ) + e H , N e ) , h ′ ) ] } V^*(s)=\min_{a\in\mathcal{A}(b,e,h)}\{c([b,h],a)+\gamma\mathbb{E}_{l,f,e_H,h^{\prime}}[V^*(\min(b-f+l,N_b),\min(e-e_{\mathrm{TX}}(h,a)+e_H,N_e),h^{\prime})]\} V(s)=aA(b,e,h)min{c([b,h],a)+γEl,f,eH,h[V(min(bf+l,Nb),min(eeTX(h,a)+eH,Ne),h)]}

基于动态规划的决策后状态(post-decision states,PDSs)

文章使用决策后状态 [1-3] 而不是传统状态,因为使用PDSs来计算值函数比使用传统状态计算值函数要简单。
决策后状态PDS
s ~ n = ( b ~ n , e ~ n , h ~ n ) = ( [ b n − f n ] , [ e n − e T X ( h n , a n ) ] , h n ) \tilde{s}^{n} = (\tilde{b}^{n},\tilde{e}^{n},\tilde{h}^{n}) =([b^{n}-f^{n}],[e^{n}-e_{\mathrm{TX}}(h^{n},a^{n})],h^{n}) s~n=(b~n,e~n,h~n)=([bnfn],[eneTX(hn,an)],hn)
表示在受到可控/已知作用之后,但在受到不可控动态发生之前的系统状态 [1]. 重要的是,下一个状态可以用 PDS 表示如下:
s n + 1 = ( b n + 1 , e n + 1 , h n + 1 ) = ( min ⁡ ( b ~ n + l n , N b ) , min ⁡ ( e ~ n + e H n , N e ) , h n + 1 ) . s^{n+1}=(b^{n+1},e^{n+1},h^{n+1}) =(\min(\tilde{b}^{n}+l^{n},N_{b}),\min(\tilde{e}^{n}+e^{n}_{H},N_{e}),h^{n+1}). sn+1=(bn+1,en+1,hn+1)=(min(b~n+ln,Nb),min(e~n+eHn,Ne),hn+1).
类似传统状态,文章在 PDSs 上定义 PDS 值函数。令 V ~ ∗ ( s ~ ) \tilde{V}^{*}(\tilde{s}) V~(s~)表示最优 PDS 值函数,则 V ~ ∗ \tilde{V}^{*} V~ V ∗ {V}^{*} V可满足:
V ~ ∗ ( s ~ ) = η E l [ max ⁡ ( b ~ + l − N b , 0 ) ] + γ E l , e H , h ′ [ V ∗ ( min ⁡ ( b ~ + l , N b ) , min ⁡ ( e ~ + e H , N e ) , h ′ ) ] , \tilde{V}^{*}(\tilde{s})=\eta\mathbb{E}_{l}[\max(\tilde{b}+l-N_{b},0)]+\gamma\mathbb{E}_{l,e_{H},h^{\prime}}[V^{*}(\min(\tilde{b}+l,N_{b}),\min(\tilde{e}+e_{H},N_{e}),h^{\prime})], V~(s~)=ηEl[max(b~+lNb,0)]+γEl,eH,h[V(min(b~+l,Nb),min(e~+eH,Ne),h)],
V ∗ ( s ) = min ⁡ a ∈ A ( s ) { b + E f [ V ~ ∗ ( b − f , e − e T X ( h , a ) , h ) ] } . V^*(s)=\min\limits_{a\in\mathcal{A}(s)}\left\{b+\mathbb{E}_f[\tilde{V}^*(b-f,e-e_{TX}(h,a),h)]\right\}. V(s)=aA(s)min{b+Ef[V~(bf,eeTX(h,a),h)]}.
如果数据包到达、能量收集和信道动态是已知且固定的,则可以离线进行 PDS 值迭代。如果动态是非平稳的,那么该算法可以周期在线执行,以随着动态的变化更新PDS值函数。但是如果缓冲区和电池容量足够大,那么任何需要计算和存储每个单一状态的值函数的表格方法由于维度指数增大变得难以处理。此外,如果缓冲区和电池大小是无限的,这种表格式方法就不适用。

离线 (offline) 是指已知数据包到达、能量收集和信道动态下,可以直接计算最优的价值函数,并获得最优策略,从而可以部署执行。在线(online) 是指上述过程未知,在实际部署中需要不断更新和估计,从而不断接近最优策略。

决策后状态价值函数性质

虽然 PDS 值迭代过于复杂,无法在EHS上实现,但利用其迭代结构,利用数学归纳法推导出最优PDS值函数 V ~ ∗ ( s ~ ) \tilde{V}^{*}(\tilde{s}) V~(s~)的结构性质。

若一个函数 f ( x , y ) f(x,y) f(x,y) ( x , y ) (x,y) (x,y)上有增差 (decreasing differences), 如
f ( x + , y + ) − f ( x + , y − ) ≤ f ( x − , y + ) − f ( x − , y − ) , ∀ x + ≥ x − , y + ≥ y − f(x^+,y^+)-f(x^+,y^-)\leq f(x^-,y^+)-f(x^-,y^-),\forall x^+\ge x^-,y^+\ge y^- f(x+,y+)f(x+,y)f(x,y+)f(x,y),x+x,y+y
则定义函数 f ( x , y ) f(x,y) f(x,y)子模函数 (submodular function).

最优PDS值函数 V ~ ∗ ( s ~ ) \tilde{V}^{*}(\tilde{s}) V~(s~)的函数性质包括:

  1. 单调性:最优 PDS 价值函数关于 b ~ , e ~ \tilde b,\tilde e b~,e~分别是非增和非减的。
  2. 增差性:在 PDS 数据队列状态 b ~ < N b − M l \tilde b<N_b-M_l b~<NbMl下(其中 M l M_l Ml是一个时隙下最大数据包到达量),最优PDS价值函数关于 b ~ , e ~ \tilde b,\tilde e b~,e~是增差的。

性质1和2表明,在 PDS 数据队列状态 b ~ < N b − M l \tilde b<N_b-M_l b~<NbMl下,随着队列积压的增加,持有一个额外数据包的边际成本也会增加。此外,额外能量包的边际效益随着可用电池能量的增加而降低。

  1. 子模性:最优 PDS 价值函数关于 ( b ~ , e ~ ) (\tilde b,\tilde e) (b~,e~)是子模的。

性质3表明,数据包和能量数据包是互补的 (complementary); 也就是说,拥有更多的能量包降低了持有额外数据包的边际成本,即当可用能量更多时,额外一个数据包产生的边际成本更小。而持有更多的数据包会增加拥有额外能量数据包的边际效益;换句话说,缓冲区越满,额外能量包的边际效益就越大。

4 近似算法

上述最优策略可以通过如PDS价值迭代或策略迭代算法获得最优策略。尽管如此,由于维度影响,尤其是状态变量需要遍历电池队列、数据队列、信道三个维度,因此文章利用上一节提出最优策略的性质,文章设计了一个 AVI 近似算法,从而降低算法复杂度。

分段平面近似误差有界

为了在缓冲-电池平面上进行空间自适应近似,文章使用四叉树数据结构,其叶节点顶点定义网格,且四叉树的每个叶子被分成两个三角形。所有叶节点的平面共同组成了图2所示的分段平面近似如下。

四叉树构造:设 T \mathcal{T} T表示定义在缓冲电池状态对集合上的四叉树,边界框定义如下
BB ( T ) = { ( b − , e − ) , ( b + , e − ) , ( b − , e + ) , ( b + , e + ) } , \text{BB}(\mathcal{T})=\{(b_-,e_-),(b_+,e_-),(b_-,e_+),(b_+,e_+)\}, BB(T)={(b,e),(b+,e),(b,e+),(b+,e+)},
其中 0 ≤ b − < b + ≤ N b , 0 ≤ e − < e + ≤ N e 0\leq b_−< b_+ \leq N_b, 0\leq e_−< e_+\leq N_e 0b<b+Nb,0e<e+Ne.如果子树是叶节点,那么它可以进一步细分为四个子树。

T ( h ~ ) \mathcal{T}(\tilde{h}) T(h~)表示用于近似信道状态 h ~ \tilde{h} h~中的PDS值函数的四叉树,现构造 PDS 值函数 V ~ \tilde V V~的近似 V ^ \hat V V^,其中

近似函数首先使用从根开始的递归搜索将 ( b ~ , e ~ ) (\tilde{b},\tilde{e}) (b~,e~)与包含它的叶节点关联起来。随后,它将 ( b ~ , e ~ ) (\tilde{b},\tilde{e}) (b~,e~)与包含它的三角形关联起来。这个三角形构成了分段平面逼近平面。最后对近似平面的方程进行求解,可得到近似值 V ^ ( b ~ , e ~ , h ~ ) \hat{V}(\tilde{b},\tilde{e},\tilde{h}) V^(b~,e~,h~).

另一方面,在边界框之外的 PDS对不属于任何叶节点,必须与其最近的叶节点相关联。将它们关联到叶节点的三角形,并将其值近似于该近似三角形定义的平面,类似于边界框内的PDS对。

引入一个算子 A T \mathcal{A}_{\mathcal{T}} AT作用于PDS值函数 V ~ \tilde{V} V~,以使用四叉树 T \mathcal{T} T给出一个分段平面近似 V ^ \hat{V} V^, 进而 V ^ = A T V ~ \hat V= \mathcal{A}_{\mathcal{T}} \tilde V V^=ATV~表示其分段平面逼近。设 ( b ~ , e ~ ) (\tilde{b},\tilde{e}) (b~,e~)位于三角形内,顶点 x i = ( b i , e i , V ~ ( b i , e i , h ~ ) ) \mathbf{x}_i = (b_i,e_i,\widetilde{V}(b_i,e_i,\widetilde{h})) xi=(bi,ei,V (bi,ei,h )),对于 i = 1 , 2 , 3 i = 1,2,3 i=1,2,3的四叉树 T \mathcal{T} T, A T V ~ − V ~ \mathcal{A}_{\mathcal{T}} \tilde V-\tilde V ATV~V~误差有界如下:
( A T V ~ ) ( b ~ , e ~ , h ~ ) − V ~ ( b ~ , e ~ , h ~ ) ≤ δ , (\mathcal{A}_{\mathcal{T}}\tilde{V})(\tilde{b},\tilde{e},\tilde{h})-\tilde{V}(\tilde{b},\tilde{e},\tilde{h})\leq\delta, (ATV~)(b~,e~,h~)V~(b~,e~,h~)δ,
其中
δ = max ⁡ i ∈ { 1 , 2 , 3 } V ~ ( b i , e i , h ~ ) − min ⁡ i ∈ { 1 , 2 , 3 } V ~ ( b i , e i , h ~ ) δ = \max_{i∈\{1,2,3\}}\tilde V(b_i, e_i, \tilde h)−\min_{i∈\{1,2,3\}}\tilde V(b_i, e_i, \tilde h) δ=i{1,2,3}maxV~(bi,ei,h~)i{1,2,3}minV~(bi,ei,h~)
依赖于PDS状态 s ~ \tilde s s~,且对于位于同一近似三角形内的所有 PDS 均相等。

近似 PDS 值迭代 (AVI) 算法

算法2给出了AVI (approximate value iteration)算法。

T m ( h ~ ) \mathcal T^m(\tilde h) Tm(h~)表示 AVI 算法迭代 m m m期间用于近似信道状态 h ~ \tilde h h~中的PDS值函数的四叉树。在AVI算法 (m = 0) 开始时,利用 B B ( T 0 ( h ~ ) ) BB(\mathcal T^0(\tilde h)) BB(T0(h~))初始化 T 0 ( h ~ ) \mathcal T^0(\tilde h) T0(h~)或使用任意四叉树。因此, T 0 ( h ~ ) \mathcal T^0(\tilde h) T0(h~)作为初始网格点集,使用提出的分段平面逼近方法估计所有 ( b ~ , e ~ ) (\tilde{b},\tilde{e}) (b~,e~)的值。AVI 算法与 PDS 值迭代有两个关键的区别。

首先,它不是作用于完整的值函数 V m ( b , e , h ) V_m(b, e, h) Vm(b,e,h) V ~ m ( b , e , h ) \tilde V_m(b, e, h) V~m(b,e,h),而是作用于相应的近似值函数 J m ( b , e , h ) J_m(b, e, h) Jm(b,e,h) V ^ m ( b , e , h ) \hat V_m(b, e, h) V^m(b,e,h).

其次,我们可以在每次迭代后(可选)改进四叉树以满足目标容错。这可以通过细化四叉树 T m \mathcal T^m Tm的每个叶节点到 δ ≤ δ t a r g e t δ\leq δ_{target} δδtarget的最粗层次。

作者证明的命题表明AVI算法收敛于 ε − optimal \varepsilon-\text{optimal} εoptimal PDS值函数而不是最优的PDS值函数。

计算和内存复杂性分析

文章比较了传统值迭代 [4]、可分解值迭代、PDS值迭代和近似PDS值迭代的计算和内存复杂度。

表格中 ∣ S ∣ |\mathcal S| S ∣ A ∣ |\mathcal A| A分别表示状态和动作的数量,

∣ S b ∣ |\mathcal S_b| Sb ∣ S e ∣ |\mathcal S_e| Se ∣ S h ∣ |\mathcal S_h| Sh分别表示数据缓冲状态数、电池状态数、通道状态数,

∣ L ∣ |\mathcal L | L ∣ E ∣ |\mathcal E | E分别表示数据包和能量包到达分布 P L P^L PL P e H P^{eH} PeH的尺寸大小 (a support of size),

吞吐量分布 P f P^f Pf的尺寸大小为 ∣ A ∣ |\mathcal A | A,其中 ∣ Σ ∣ = ∣ A ∣ 2 + ∣ L ∣ + ∣ E ∣ + ∣ S h ∣ 2 |\Sigma|=|\mathcal{A}|^2+|\mathcal{L}|+|\mathcal{E}|+|\mathcal{S}_h|^2 ∣Σ∣=A2+L+E+Sh2 Π 1 = L × A × E × S h \Pi_1=\mathcal{L}\times\mathcal{A}\times\mathcal{E}\times\mathcal{S}_h Π1=L×A×E×Sh ∣ Π 2 ∣ = ∣ L × E × S h ∣ |\Pi_2|= |\mathcal{L} \times \mathcal{E} \times \mathcal{S}_h| Π2=L×E×Sh.

本文提出的近似PDS值迭代算法与PDS值迭代算法具有相似的复杂度,但是有两个关键的差异。首先,评估的状态跨越四叉树 T \mathcal T T而不是 S \mathcal S S的整个状态空间。其次,在最大四叉树深度 k \mathcal k k处近似与叶子(子树)相关联的状态 ( b ~ , e ~ ) ∉ T (\tilde b,\tilde e)\notin \mathcal T (b~,e~)/T的值具有复杂度 O ( k ) O(k) O(k)。因此,更稀疏的近似将在计算和内存效率方面更高。

5 数值结果

最优PDS值函数的结构性质

图4a、图4g和图4b、图4h分别给出了最优PDS值函数和策略。最优PDS值函数(i)在队列积压(命题1和3)中不减小且差异越来越大,(ii)在电池状态(命题2和4)中不增大且差异越来越大。在较好的信道状态下(-4.68 dB),最优值函数的幅度较小,因为该状态的长期预期成本较低。

图4c和图4d分别为贪心值函数和策略。我们观察到最优策略比贪婪策略更保守,因为它在低电池状态下不传输数据包。这是因为在给定数据到达、能量到达和通道动态的情况下,最优策略权衡其当前调度操作对其未来性能的影响。

图4e、4i、图4f和图4j分别显示了使用动态改进的四叉树生成的近似PDS值函数和策略(在更高的缓冲状态下得到20个更精细的平面)。近似PDS值函数保留了最优PDS值函数的结构。此外,由近似PDS值函数派生的策略(即AVI策略)具有与最优策略相似的结构,并且比最优策略更冒险,但比贪婪策略更谨慎。

近似解与最优调度策略和贪婪策略的性能

贪婪策略在给定可用能量的情况下传输尽可能多的积压数据包,即 a n = min ⁡ { b n , max ⁡ { a : e n ≥ e T X ( h n , a ) } } ) a^n=\min\{b^n,\max\{a:e^n\geq e_{TX}(h^n,a)\}\}) an=min{bn,max{a:eneTX(hn,a)}}).

而文章比较了在考虑伯努利和泊松分布数据包到达的两种情况下AVI、最优和贪婪策略的性能:

  • 能量充足:能量包到达分布 P e H ( e H ) = B e r n ( 0.7 ) P^{e_H} (e_H) = Bern(0.7) PeH(eH)=Bern(0.7)和数据包到达分布 P l ( l ) = B e r n ( x ) P^l (l) = Bern(x) Pl(l)=Bern(x).
  • 能量不足:与能量充足的情况相比,能量和数据包到达率减少了一半,同时保持相同的能量-数据转率。

在原文图6中,文章展示了在能源充足和不足的情况下,平均排队延迟、电池占用率、缓冲区溢出和电池中断是如何随数据包到达率变化的。每次测量都是通过对相应策略的1250,000个时隙模拟进行平均来进行的。使用所提出的近似PDS值迭代算法计算了标记为AVI- l \mathscr l l的近似策略(AVI- l \mathscr l l表示利用提出的有 l \mathscr l l四叉树分支近似PDS值迭代算法计算的近似策略)。

图6a为能量充足情景下的平均排队延迟(左轴)和平均电池占用(右轴),图6b为相应的平均溢出(左轴)和平均中断(右轴)。文章观察到,随着四叉树经历更多的细分(即,随着 l \mathscr l l的增加),AVI- l \mathscr l l的性能在所有四个性能指标方面逐渐提高,并且其性能介于贪婪策略和最优策略之间。这可以归因于这样一个事实,即更粗糙的分段平面近似会导致近似和最优PDS值函数之间的误差更大,但根据这种近似策略比贪婪策略要好。

综上所述,这些结果表明,所提出的解决方案不仅比贪婪策略提供更多的传感器数据(因为当有更少的溢出时,更少的传感器数据丢失),而且在使用更少的能量的同时具有更低的延迟。文章认为同时改进这些指标是问题的内在特征,当优化延迟指标(排队延迟和溢出)时,改进电池指标对于有效地服务传入流量是必要的。

参考文献

[1] N. Mastronarde and M. van der Schaar, “Fast reinforcement learning for energy-efficient wireless communication,” IEEE Trans. Signal Process., vol. 59, no. 12, pp. 6262–6266, 2011.
[2] N. Mastronarde and M. van der Schaar, “Joint physical-layer and system- level power management for delay-sensitive wireless communications,” IEEE Trans. Mobile Comput., vol. 12, no. 4, pp. 694–709, 2013
[3] N. Salodkar, A. Bhorkar, A. Karandikar, and V. Borkar, “An on-line learning algorithm for energy efficient delay constrained scheduling over a fading channel,” IEEE J. Sel. Areas Commun., 2008.
[4] L. Kaelbling, M. Littman, and A. Moore, “Reinforcement learning: A survey,” J. Artif. Intell. Res., pp. 237–285, 1996.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963823.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OZON如何查询销量,OZON查销量哪里可以看

在竞争激烈的电商市场中&#xff0c;了解商品销量是每位卖家优化销售策略、提升竞争力的关键。作为俄罗斯领先的跨境电商平台&#xff0c;Ozon为卖家提供了丰富的数据支持&#xff0c;帮助卖家更好地掌握市场动态。然而&#xff0c;对于新手卖家来说&#xff0c;如何在Ozon上查…

1、爬⾍概述

1. 什么是爬虫&#xff1f; 爬虫&#xff08;Web Crawler&#xff09;是一种通过编写程序自动访问并提取互联网上数据的技术。爬虫可以帮助我们在浏览网页时自动收集和保存一些有用的数据&#xff0c;例如图片、视频和文本信息。简单来说&#xff0c;爬虫就是自动化的浏览器。…

InsightFace 人脸识别算法实现过程解析

最近研究了一下人脸识别算法&#xff0c;初步实现了基础的人脸识别。 源码github下载地址&#xff1a;insightface 第一步 解压源码配置环境 1、使用conda虚拟环境创建insightface环境 conda create -n insightface python3.8创建环境完成后&#xff0c;激活环境 conda ac…

手把手教你如何在宝塔上添加可道云登录页面的ICP备案信息,别跟权威开玩笑。

如何在宝塔上添加可道云登录页面的ICP备案信息 事情的原由来我们开始吧首先登录你的宝塔页面双击打开index.php文件保存退出即可 感谢大佬&#xff0c;希望对被查到的朋友有所帮助&#xff01; 事情的原由 今天突然收到腾讯云发来的一封Email&#xff0c;说我需要整改我的网站…

如何在职场上生存,送你3条秘技

洞悉本质才能方向明确&#xff0c;掌握方法才能事半功倍。 下面这3条职场生存的秘技&#xff0c;都是“过来人”的经验之谈&#xff0c;不管在哪里工作&#xff0c;都能管中窥豹、可见一斑&#xff0c;实在是值得深刻领悟。 01 你和领导的本质关系是工作关系 你有价值&#xff…

嵌入式开发服务器与客户端交互 日志2024/7/31

嵌入式开发服务器与客户端交互 客户端 网页 操作 请求相关代码: 这里为了适配 低版本浏览器 用的不是fetch 当然用fetch更好 var curUlr window.location.href; //获取当前网页地址var newURL curUlr.lastIndexOf("/");//截取到最后一个斜杠索引var pathUrl…

Python:如何实现对表格的自动化

前情提要&#xff1a;需要有openpyxl哦 如果没有请参考上一篇文章 http://t.csdnimg.cn/fjbLJ 先介绍一下对表格的基本操作 首先创立一个 transactions.xlsx 基本操作&#xff1a;获取表格&#xff0c;获取值 import openpyxl as xl # 这个as 单纯简化 相当于别名 wbxl.load_…

02 I/O多路复用---进程的聊天

服务器同时和很多客户端连在一起 管道的read&#xff0c;总是能读出来

mysql逻辑架构与sql执行过程

目录 1.背景 2.mysql逻辑架构图 3.逻辑架构解读 第一层:连接层 第二层:服务层 1.Management Serveices & Utilities 2.SQL Interface:SQL接口 3.Parser:解析器 4.Optimizer:查询优化器 5.Caches 和 Buffers:查询缓存组件 第三层:存储引擎层 第四层:数据存储层 …

【数据结构初阶】千字文章带你征服 “ 双向链表 ”(附源码)

hi&#xff0c;bro&#xff01;又见面啦 目录 前言&#xff1a; 一、链表的分类 二、双向链表 1、 概念与结构 2、 双向链表的实现 2.1 定义双向链表的结构 2.2 初始化 2.3 尾插 2.4 头插 2.5 打印 2.6 尾删 2.7 头删 2.8 查找 2.9 在pos结点之后插入…

实验室责任人员管理保障实训系统安全

在智慧校园的实训管理生态中&#xff0c;实验室责任人员的角色犹如精密机器中的关键齿轮&#xff0c;他们不仅是实验室安全与高效运转的守护者&#xff0c;更是实训教学质量的直接塑造者。这一角色的重要性&#xff0c;在智慧校园的数字化转型中得到了前所未有的凸显&#xff0…

过期知识:thinkphp5 使用migrate给现有的数据表新增表字段

个人开发网站记录, 这个文章主要是个以后健忘的我看的. 我在搞我的画笔审核 , 发现数据表的画笔数据在审核驳回的时候还是软删除好一些, 免得用户找不到之前上传的画笔数据, 后期也可以考虑重新显示给用户,让用户可以修改画笔信息重新提交审核. 这个时候想起了…

ViewModel相关

郭霖公众号 原作者原文 前言 ViewModel不仅是Activity和Fragment的数据集中管理和通讯&#xff0c;也是促进了MVVM和MVI架构规范&#xff0c;此文为深入理解ViewModel 概念 ViewModel是复制准备和管理Activity和Fragment数据的类&#xff0c;他还处理Activity或Fragment与应…

探索天穹数仓自治能力的新实践

探索天穹数仓自治能力的新实践 随着业务和技术的发展&#xff0c;传统数仓模式向数智数仓模式演进&#xff0c;数据治理面临诸多挑战。自治平台采用双引擎策略&#xff0c;注重感知能力、观测能力、诊断能力和优化能力的建设&#xff0c;实现了对数据的精细化管理。例如&#x…

鸿蒙应用框架开发【基于原生能力的无障碍模式】

基于原生能力的无障碍模式 介绍 本示例基于系统提供的无障碍阅读能力&#xff0c;实现了无障碍扩展服务集成、原生组件屏幕朗读以及多个控件组合标注。 效果图预览 原生组件屏幕朗读&#xff1a; 创建说明&#xff1a; 在已创建工程的ets文件夹下创建accessibility文件夹&…

SCIEI双检CCF期刊,硕博毕业生的福音,投稿欲从速!

SCI&EI双检CCF期刊&#xff0c;目前已稳定检索46年&#xff0c;CCF-C类&#xff0c;且发文量稳定&#xff0c;国人友好&#xff0c;发过的人都说审稿极速。 期刊详情 【期刊简介】IF&#xff1a;4.0-5.0 JCR1区中科院3区 【出版社】Elsevier出版社 【检索情况】SCI&a…

【文件fd】深入理解和实现Linux底下一切皆文件 | 系统和语言文件操作二者关系_封装 | 系统调用为什么怎样封装成库函数

目录 1.系统调用的打开/读/写文件操作 2.如何理解Linux底下一切皆文件 2.1设备属性 2.2设备的操作方法 3.如何实现Linus底下一切皆文件 4.源码查看 5.系统和语言文件操作二者关系 5.1 flags选项和C语言的"w""a"方式 二者的关系 5.2 系统的文件描…

llama-3.1下载部署

llama-3.1 下载 下载 huggingface 详情页填写申请后等待审核 点击 头像->setting->access token 创建token 配置环境变量 下载模型 pip install -U huggingface_hubhuggingface-cli download --resume-download meta-llama/Meta-Llama-3.1-8B-Instruct --local-di…

Linux ——互斥量

1.进程线程间的互斥相关背景概念 临界资源&#xff1a;多线程执行流共享的资源就叫做临界资源临界区&#xff1a;每个线程内部&#xff0c;访问临界资源的代码&#xff0c;就叫做临界区互斥&#xff1a;任何时刻&#xff0c;互斥保证有且只有一个执行流进入临界区&#xff0c;…

使用 cPanel WHM 重置 MySQL 根密码

MySQL 是托管在 cPanel 管理服务器上的网站的主要数据库软件&#xff0c;广泛用于 WordPress 和电子商务应用程序&#xff0c;例如 Magento。由于 MySQL 需要管理多个不同网站和数据库的读写权限&#xff0c;因此它是一个多用户系统。 每个用户账户都有一组权限限制其访问。而M…