GNN+RA 文献阅读-- GNN对RA的建模

news2024/9/21 8:03:42

简述:主要是几篇 如何利用GNN 对 资源分配进行建模的paper,【1】【2】都是对无线链路建模,【3】比较有参考性,【4】偏于RL,对GNN表述模糊。

用GNN建模网络的思路:

1.Graph 是有向图还是无向图?

2. Node 表示什么? feature 有哪些?

3.Edge表示什么? feature 有哪些?

4.GNN 如何更新? 目前一般的更新是 先 聚合邻居节点的消息,然后对所有information组合。

对聚合 AGGREGATE 和 组合 COMBINE 会有不同的function选择。

 

[1]

Z. He, L. Wang, H. Ye, G. Y. Li, and B.-H. F. Juang, ‘Resource Allocation based on Graph Neural Networks in Vehicular Communications’, in 2020 IEEE GLOBAL COMMUNICATIONS CONFERENCE (GLOBECOM), in IEEE Global Communications Conference. New York: IEEE, 2020. doi: 10.1109/GLOBECOM42002.2020.9322537.

摘要: 本文为V2X网络开发了一种分布式GNN增强的RL频谱共享方案。在我们提出的方法中,V2V网络被表示为一个图。V2V对的本地观测值和干扰链路的信道增益分别被视为节点和边的信息。我们使用GNN根据图信息学习V2V对对应的每个节点的低维特征。

Model:

 Graph 建模为一个有向图

Node:each of the V2V pairs is regarded as a node 

Edge:interference links between V2V pairs as edges.

Node features:node observation contains the VUEs channel gain and its corresponding transmit power  

Edge features: edge weights are represented by the interference channel gain.

使用GNN 抽取 node features

本文使用的 Node feature传递消息的方式 

 || 表示矩阵的拼接,相当于 node v 处的observation ,上一轮次的 mu值,现在所有邻居边的加和, 上一轮次所有mu的加和,组成一个矩阵乘以一个 权重。

 \mu的维度为什么是可以设置的??

simulation部分数据很少,只和random 比较了,random大约是RL-GNN的83%的性能,说明这个GNN并不是非常好。

 [2]

T. Chen, X. Zhang, M. You, G. Zheng, and S. Lambotharan, ‘A GNN-Based Supervised Learning Framework for Resource Allocation in Wireless IoT Networks’, IEEE Internet of Things Journal, vol. 9, no. 3, pp. 1712–1724, Feb. 2022, doi: 10.1109/JIOT.2021.3091551.

 摘要: 提出了一种基于图神经网络( Graph Neural Network,GNN )的框架,以有监督的方式解决这一挑战。具体地,将无线网络建模为有向图,其中期望的通信链路建模为节点,有害的干扰链路建模为边。

GAP:之前有一些GNN的工作[23][24] 限于同构的无线系统,可能无法兼容异构的物联网系统。此外,这些工作只研究了连续优化问题,所提出的方法可能无法处理离散优化问题

GNN 建模: 整个被建模为有向图。

Node: the communication link between a transceiver pair can be treated as a node, and the Edge: interference link between two nodes can be treated as an edge.

Node features: The properties, such as the distance, channel information weight and priority that are related to communication links can be taken as node features.

Edge features: The properties, such as the distance and channel information that are related to interference links can be treated as edge features. 

 Update GNN的方式:

[3]

Z. Sun, Y. Mo, and C. Yu, ‘Graph-Reinforcement-Learning-Based Task Offloading for Multiaccess Edge Computing’, IEEE Internet of Things Journal, vol. 10, no. 4, pp. 3138–3150, Feb. 2023, doi: 10.1109/JIOT.2021.3123822.

摘要:启发式算法严重依赖于MEC系统的精确数学模型,DRL没有合理利用MEC图中设备之间的关系。针对这一问题,本文提出了一种基于图神经网络( Graph Neural Network,GNN )的任务卸载机制,该机制可以直接在具有消息传递和聚集性的图数据上进行学习。

GAP:启发式算法需要专家知识,难以胜任动态MEC场景下的实时决策,且环境变化往往需要解决。深度强化学习( DRL )将强化学习与深度神经网络( DNNs )相结合,为上述挑战提供了一种有前景的解决方案。研究人员研究了DRL在各种MEC任务卸载问题中的应用。由无线接入设备、无线信道和MEC服务器组成的MEC系统被认为是一个RL环境。利用DNN强大的建模能力进行综合表示,通过与环境的交互来学习卸载策略。然而,DNN并不能很好地表示图数据,以无线通信为边的MEC中组件之间的拓扑关系被忽略。因此,传统的DRL方法在MEC拓扑变得复杂时适应性较弱,且不适用 。

实际上这篇paper 主要优化了offloadding变量

Model:

N个 wireless devices  A个server  每一个devices 可以连接到1个或多个MEC server 

the system time \mathcal{T} is divided into consecutive time frames of equal length t.

动态: 任务可以在  \mathcal{T}的任一个slot产生。 task可offload,可在local computing。

GNN 建模:将系统建模为一个无向图

Node: network entities  in the  MEC system (有WD 和server 两种类型)

Edge:WD and MEC communication connections

Node features:WD 节点 update according to \mathbb{T}_t,即每个slot产生的task 信息

Time varying :Applications on the WD randomly generate tasks,  the wireless channel gain and background noise of the MEC system are also time varying.

The topology of devices may change over time, such as nodes addition or reduction, edges establishment, and disconnection.

Other parameters (e.g., the maximum computational performance of a particular server node and the total communication bandwidth of a wireless AP) are fixed.

Goal: Our goal is to minimize the total task-weighted response time of the MEC system over time by designing a reasonable computation offloading policy and resource scheduling policy.

对于RL来说,其任务是 在给定graph \mathcal{G}和task \mathbb{T}_t的条件下,找到最优的卸载策略 \pi.

算法的主要框架:

 1. 将MEC 和 WD 建模为 Graph,通过GNN 来抽取 Graph的特点,预测 x, 其中x 表示offloading变量,注意 这里预测出的 x 是 每个元素是连续变量。

2.得到预测向量\hat{x} 之后,再使用 量化方法(a modified orderpreserving algorithm)将其 量化为 0或1。量化方法取决于 探索空间 K, 量化结果选取 可以 根据Q值。

Suppose that GNN has prediction ˆ xt at the time slot t, then we quantize ˆ xt and extend K binarized offloading actions. In general, K is related to the size of the search space of the extended algorithm. When the search space is constant, the larger K is, the better the extended algorithm is, but accordingly, the computational complexity increases.

Graph Node Embedding

 The neighborhood information aggregation process as follows:

 Edges embedding:

[4]

K. Li, W. Ni, X. Yuan, A. Noor, and A. Jamalipour, ‘Deep-Graph-Based Reinforcement Learning for Joint Cruise Control and Task Offloading for Aerial Edge Internet of Things (EdgeIoT)’, IEEE Internet of Things Journal, vol. 9, no. 21, pp. 21676–21686, Nov. 2022, doi: 10.1109/JIOT.2022.3182119.

摘要:本文研究了一种新的无人机巡航控制和任务卸载分配的联合优化,在物联网设备的计算能力和电池预算以及无人机的速度限制的情况下,最大化卸载到无人机的任务。由于优化包含较大的解空间,而无人机的瞬时网络状态是未知的,因此我们提出了一种新的基于深度图的强化学习框架。开发了一种优势行为者-评论家( A2C )结构,用于训练无人机在飞行速度、航向和卸载调度等方面的实时连续动作 。

实际就是根据网络的现有状态,去决策无人机飞到哪个位置,以及选择哪个WD的任务进行处理。

Model:

N ground devices

1 UAV

GNN 建模:

这部分给的很模糊,说明了使用GNN 根据 网络状态 state 来 推理 action,即 轨迹和资源分配。

给出了state 的定义 和 action的定义,但是 并没有具体给出在 GNN中,每个vertex 和edge怎么定义,包含哪些 feature,以及 message passing仅给出了定义,并没有说明本文是如何做的,以及用的究竟是哪一类的激活函数等。

State:

 Action:

 算法框架:


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/821688.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HarmonyOS 开发基础(二)组件拼凑简单登录页面

一、简单登录页面 Entry Component /* 组件可以基于struct实现,组件不能有继承关系,struct可以比class更加快速的创建和销毁。*/ struct Index {State message: string Hello Worldbuild() {// https://developer.harmonyos.com/cn/docs/documentation/…

万应低代码 7 月重点更新内容速递

速览版 详情版 低代码开发能力提升 业务逻辑 业务逻辑是什么? 在万应低代码中,「业务逻辑」指的是应用程序中的核心规则和功能,它决定了数据如何被处理和操作。就像搭积木一样,业务逻辑告诉计算机在特定情况下如何运行和响应。比…

【C语言】操作符----详解

🍁 博客主页:江池俊的博客 💫收录专栏:C语言——探索高效编程的基石 💻 其他专栏:数据结构探索 💡代码仓库:江池俊的代码仓库 🎪 社区:C/C之家社区 🍁 如果觉…

【投资笔记】美股要变天了?

美股上涨,但是风险溢价创新低 7月,标普和纳指创两年依赖首次5个月连涨,但是风险溢价创二十年新低;https://asset.wsj.net/dynamic-insets/charts/cdc_5387e4742a1ca607d6defc38_embed.html 如果这个指标为正,说明投资…

视频媒体有哪些?视频媒体采访服务怎么做?

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 一,在国内,主流的视频媒体包括: 1. 电视台:包括国家级、地方性和专业性电视频道,涵盖各类新闻、综艺、娱乐、体育等节目。 2…

链表OJ:环形链表

Lei宝啊:个人主页 愿所有美好与我们不期而遇 题目描述 : 给你一个链表的头节点 head ,判断链表中是否有环。 接口: bool hasCycle(struct ListNode *head) 示例1: 示例2: 返回值: true或…

电力系统基础知识(东方电子)持续更新

文章目录 三相电、相电压、线电压断路器和继电器电压互感器、电流互感器GOOSE、SV 三相电、相电压、线电压 因为交流电可以通过变压器升降,很容易实现远距离输电,而直流电无法升降,远距离输电会造成巨大浪费。 三相电:三相交流电…

go程序使用tcp短连接报:only one usage of each socket address

环境及现象 Win10上位机(C#,WPF)后台使用go作为服务。 连接情况 C#连接大概60个TCP长连接(设备)。 后台go服务连接60个UDP短连接(设备附属硬件), 10个TCP短连接(PLC,modbus通讯&a…

【python】使用Selenium和Chrome WebDriver来获取 【腾讯云 Cloud Studio 实战训练营】中的文章信息

文章目录 前言导入依赖库设置ChromeDriver的路径创建Chrome WebDriver对象打开网页找到结果元素创建一个空列表用于存储数据遍历结果元素并提取数据提取标题、作者、发布时间等信息判断是否为目标文章提取目标文章的描述、阅读数量、点赞数量、评论数量等信息将提取的数据存储为…

坚鹏:中国邮储银行金融科技前沿技术发展与应用场景第2期培训

中国邮政储蓄银行金融科技前沿技术发展与应用场景第2期培训圆满结束 中国邮政储蓄银行拥有优良的资产质量和显著的成长潜力,是中国领先的大型零售银行。2016年9月在香港联交所挂牌上市,2019年12月在上交所挂牌上市。中国邮政储蓄银行拥有近4万个营业网点…

ByteBuffer

ByteBuffer 1.创建方式创建方式1:ByteBuffer buf ByteBuffer.allocate(int size);2.创建方式2:ByteBuffer buf ByteBuffer.allocateDirect(int size); 2.字符串转成ByteBuffer的3三种方式方式1: 采用put()方法,读数据时需要调用flip()切换为读模式方式2:以特定编码…

ChatGPT能否撰写科研论文?

ChatGPT,这款被许多人誉为语言处理领域的“黑马”,究竟能否应用于撰写科研论文?近期,以色列理工学院生物学家兼数据科学家Roy Kishony带领的团队,针对这一问题进行了系列研究,其结果已在《Nature》杂志上发…

MySQL表的内外连接

MySQL表的内外连接 一.内连接二.外连接1. 左外连接2. 右外连接 三.案例 表的连接分为内连和外连。 一.内连接 内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,我们前面学习的查询都是内连接,也是在开发过程中使用的最多的连接查询。而使…

使用 Go 语言实现二叉搜索树

原文链接: 使用 Go 语言实现二叉搜索树 二叉树是一种常见并且非常重要的数据结构,在很多项目中都能看到二叉树的身影。 它有很多变种,比如红黑树,常被用作 std::map 和 std::set 的底层实现;B 树和 B 树,…

刷题笔记 day4

力扣 611 有效三角形的个数 首先需要知道如何判断 三个数是否能构成三角形。 假如 存在三个数 a < b < c&#xff0c;如果要构成三角形&#xff0c;需要满足&#xff1a; ab > c ; a c > b ; b c > a ; 任意两个数大于第三个数就可构成三角形。 其实不难…

F5 LTM 知识点和实验 8-配置和管理高可用性部署

第八章:配置和管理高可用性部署 设备集群(device service clustering) 与许多关键网络和IT基础设施组件一样,BIGIP系统可以部署在高可用性(HA)配置中,以支持持续的应用程序交付,而不会在很长一段时间内中断服务。当前BIG-IP系统的HA功能主要由DSC (Device Service Clust…

实验-路由器配置静态路由

软件&#xff1a;cicso packet tracer 8.0 拓扑图&#xff1a;路由器&#xff1a;Router-PT、连接线&#xff1a;Serial DTE、连接口&#xff1a;Serial口&#xff08;serial是串行口,一般用于连接设备,不能连接电脑&#xff09; 实验步骤&#xff1a; 1、构建拓扑图&#xf…

安全基础 --- 编码(02)+ form表单实现交互

浏览器解析机制和XSS向量编码 <!-- javascript伪协议不能被urlcode编码&#xff0c;但可以被html实体编码:也是js协议的一部分&#xff0c;不能被编码js协议被解码后&#xff0c;URL解析器继续解析链接剩下的部分unicode编码可识别实现解码但符号不能被编码&#xff0c;编码…

技术应用:我有一个存放着在线SQL语句测试的收藏夹想要与你分享

&#x1f525; 技术相关&#xff1a;《技术应用》 ⛺️ I Love you, like a fire! 文章目录 &#x1f4cb; 前言&#x1f9e9; SQL Fiddle&#x1f9e9; DB-Fiddle&#x1f9e9; dbfiddle&#x1f9e9; Live SQL -&#xff08;Oracle&#xff09;&#x1f9e9; Free MySQL Host…

JVM面试题--JVM组成

JVM是什么 Java Virtual Machine Java程序的运行环境&#xff08;java二进制字节码的运行环境&#xff09; 运行流程 什么是程序计数器&#xff1f; 程序计数器&#xff1a;线程私有的&#xff0c;内部保存的字节码的行号。用于记录正在执行的字节码指令的地址。 我们知道ja…