无消息传递的图变换器中的图归纳偏差

news2024/11/15 15:40:04

人工智能咨询培训老师叶梓 转载标明出处

在处理小规模数据集时,图变换器的性能通常不尽如人意,特别是在需要明显的归纳偏好时。为了引入这些偏好,早期的图变换器一般会利用消息传递组件或位置编码。然而,依赖消息传递的图变换器在将研究成果应用到其他领域时遇到了难题,因为它们与其它领域的变换器有较大差异。针对这一挑战,来自麦吉尔大学、牛津大学工程科学系、麻省理工学院的CSAIL、MetaAI以及魁北克人工智能研究所(Mila)的研究人员们提出了一种新型的图变换器——图归纳偏差变换器(Graph Inductive bias Transformer,简称GRIT)。GRIT不依赖于显式的消息传递机制,而是通过三种关键设计决策来内嵌图归纳偏好,以此优化模型对图数据的处理能力。

方法

GRIT架构引入了一种新颖的灵活注意力机制和通用的相对位置编码方案,它不依赖任何显式的局部消息传递模块。这一设计包含三个核心决策:

  1. 学习随机游走相对位置编码:通过随机游走概率初始化的相对位置编码,相较于传统的最短路径距离编码,它具有更强的表达能力,能够捕捉更丰富的图传播矩阵信息。

  2. 灵活的注意力机制:该机制不仅能更新节点表示,还能更新节点对表示,从而更全面地捕获节点间的相对位置信息,并通过注意力层更新位置编码,进一步提升模型的表达能力。

  3. 整合节点度信息:为了保留节点的度信息,引入了自适应的度量缩放器,确保模型在每一层都能考虑到节点的连接丰富度。

通过结合随机游走相对位置编码(RRWP)和多层感知器(MLP),该方法能够近似最短路径距离或一般类别的图传播矩阵,从而证明了其强大的表达能力。这种编码方式能够捕获节点间多跳的相对位置信息,对深入理解图结构至关重要。

Figure 1和Figure 2的可视化显示,随着随机游走步数的增加,RRWP能够揭示更高阶的结构信息,如图中的团簇和星形模式。这表明RRWP能有效捕获图中的关键信息,并随着游走步数的增加,更好地突出社区结构,减少瓶颈。

在当前的自注意力机制设计中,通常基于节点级的位置编码和表示,但这并不足以完全捕获节点对之间的相对位置信息。因此,提出了一种新的方法来计算注意力分数,通过考虑节点对的相对表示,结合了一般条件层和GATv2的优点。

在每个变换器层中,模型更新节点表示 和节点对表示 ,这些表示最初使用初始节点特征和RRWP位置编码进行初始化。注意力计算过程如下:

其中,σ 是非线性激活函数,默认为ReLU;是可学习的权重矩阵;⊙ 表示逐元素乘法;是带符号的平方根,通过减少大输入的幅度来稳定训练。

使用最近提出的Weisfeiler-Lehman类图同构测试(GD-WL)来证明,在变换器架构中,RRWP比传统的最短路径距离(SPD)具有更强的表达能力。

为了解决注意力机制在处理图结构数据时对节点度的不变性问题,引入了自适应的度量缩放器来维持度信息。在计算节点表示后,模型将度信息注入到节点表示中:

其中是节点i 的度, 是可学习的权重。这样做是为了在使用标准前馈网络(FFN)更新节点表示之前,先注入度量信息。

为了正确包含度信息,选择使用批量归一化而不是标准的层归一化,因为层归一化可能会抵消度量缩放器或总和聚合器的效果。

通过引入灵活的注意力机制和度信息注入,GRIT模型能够在不依赖显式消息传递的情况下,有效地处理图数据。这些机制的引入显著提高了模型对图结构的理解和表达能力,使得GRIT在多个图学习任务中取得了优异的性能。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。实战专家1小时讲解让您轻松上手,学习如何使用 Llama Factory 微调模型。

评论留言“参加”或扫描微信备注“参加”,即可参加线上直播分享,叶老师亲自指导,互动沟通,全面掌握Llama Factory。关注享粉丝福利,限时免费录播讲解。

LLaMA Factory 支持多种预训练模型和微调算法。它提供灵活的运算精度和优化算法选择,以及丰富的实验监控工具。开源特性和社区支持使其易于使用,适合各类用户快速提升模型性能。

实验

GRIT在五个来自Benchmarking GNNs的基准测试和两个Long-Range Graph Benchmark的测试中接受了评估。这些测试覆盖了节点分类、图分类和图回归等多种任务,特别注重图结构编码、节点聚类和长距离依赖性学习。测试的数据集包括ZINC-full图数据集(约25万个图)和PCQM4Mv2数据集(约370万个图)。

在基准测试中,GRIT与目前最先进的混合图变换器GraphGPS以及其他多种流行的图学习模型进行了比较,包括MPNNs、图变换器以及其它一些性能领先的图神经网络。

实验结果如Table 1和Table 2所示。表格展示了在不同数据集上使用不同模型的性能指标,包括平均绝对误差(MAE)和准确率(Accuracy)。在多数情况下,GRIT都获得了最优的平均性能,并在统计上显著优于其他模型。

在ZINC-full数据集的测试中,如Table 3所示,GRIT同样展现了其卓越的性能,与其他各种方法相比,GRIT取得了最佳的平均性能。

在PCQM4Mv2的大规模图回归基准测试中,如Table 4所示,GRIT与多种MPNNs和图变换器进行了比较。尽管GRIT使用的可学习参数更少,但其性能与GraphGPS和Graphormer相当。

消融实验如Table 5所示。实验结果表明,移除度量缩放器、更新机制的RRWP、将全局注意力替换为稀疏注意力、替换度量编码和注意力机制,以及将RRWP替换为RWSE或SPDPE等操作,都会导致性能下降。

对RRWP的参数K进行的敏感性分析结果显示,如Table 6所示,对于许多K值的选择,GRIT方法都是最先进或接近最先进,除了像K=2这样不合理的选择。

合成实验研究了GRIT模型的注意力模块是否能够模仿一般类别的图传播矩阵,如Table 7所示。实验结果表明,与其他图变换器相比,GRIT显著优于其他基线,能够更好地近似一般类别的图传播。

实验证明了GRIT模型能够在不依赖消息传递的情况下,通过整合图归纳偏差,在多个图数据集上实现最前沿的性能。

https://arxiv.org/pdf/2305.17589v1

GitHub - LiamMa/GRIT: This is an official implementation for "GRIT: Graph Inductive Biases in Transformers without Message Passing".

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2149550.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# AutoResetEvent ManualResetEvent Mutex 对比

三个函数功能类似,都是线程同步的主要函数。但在使用上有一些差别。 关于代码的使用,帖子很多。形象的用图来描述一下。

【Meta分析】IF=12.1!人工智能预测模型Meta分析怎么做?

预测模型的Meta分析 人工智能(AI)是计算机科学的一个重要分支,其主要目标是让算法执行通常由人类完成的任务。机器学习是指一组允许算法从数据中学习并自我优化的技术,而无需明确编程。深度学习这一术语常与机器学习互换使用&…

怿星设计分享丨设计师与AI的情感化HMI

在当今科技迅速发展的时代背景下,人机交互(HMI)的设计正从传统的功能性层面转向更加注重用户体验与情感交流的方向。设计师们不再仅仅关注界面的功能性,而是更加重视如何通过设计传递情感,使用户在使用产品时能够感受到…

EsDA,一站式嵌入式软件

EsDA是一套面向工业智能物联领域的嵌入式系统设计自动化工具集,包含实时操作系统AWorksLP、低代码开发平台AWStudio、资源管理平台AXPI、跨平台GUI引擎AWTK和云服务平台ZWS,旨在提高嵌入式软件开发的效率、性能和可扩展性。 EsDA全称是嵌入式系统设计自动…

回归预测|基于饥饿游戏搜索优化随机森林的数据回归预测Matlab程序HGS-RF 多特征输入单输出 高引用先用先创新

回归预测|基于饥饿游戏搜索优化随机森林的数据回归预测Matlab程序HGS-RF 多特征输入单输出 高引用先用先创新 文章目录 一、基本原理1. 饥饿游戏搜索优化算法(HGS)简介2. 随机森林(RF)简介3. HGS-RF回归预测流程1. 初始化2. 随机森…

三维手势 handpose 3D RGB 手势3D建模 三维建模-手势舞 >> DataBall

请关注即将发布 handpose x plus 项目 三维手势 handpose 3D RGB 单目相机手势识别 手语 歌曲 Friends 手势检测 手势3D建模 三维建模 咨询合作 DataBall 项目,欢迎加以下微信。 助力快速掌握数据集的信息和使用方式。

sourceTree保姆级教程7:(合并某次提交)

在日常开发过程中,大家有时候并非都是在同一个分支进行开发,可能存在多人的情况下开发。根据上线的需求依次提交代码。当然也可能存在交叉提交的情况。此时应如何在master分支去合并具体某一次的提交呢?下面就开始了: 1.打开本地…

巧用联合与枚举:解锁自定义类型的无限潜力

嘿嘿,家人们,今天咱们来详细剖析C语言中的联合与枚举,好啦,废话不多讲,开干! 目录 1.:联合体 1.1:联合体类型的声明 1.1.1:代码1 1.1.2:代码2(计算机联合体的大小) 1.1.3:代码3 1.2:联合体的特点 1.2.1:代码1 1.2.2:代码2 1.3:相同成员的结构体与联合体进行对比 1.3…

前端界面搜索部分,第一个选择框的值,影响第二个选择框的值

1.字段声明 {title: 单位名称,dataIndex: departmentId,align: center,width: 100,hideInTable: true,renderFormItem: (item, { defaultRender, ...rest }) > (<ProFormSelectname"departmentId"// label"单位名称"options{hospitaltData}onChange…

旋转矩阵乘法,自动驾驶中的点及坐标系变换推导

目录 1. 矩阵乘法的内项相消 2. 左右乘&#xff0c;内外旋与动静坐标系 3. 点变换 3.1 点旋转后的点坐标表示 3.2 坐标系旋转后的点坐标表示 4. 坐标变换的实质 1. 矩阵乘法的内项相消 关于旋转变换&#xff0c;离不开矩阵的乘法&#xff0c;而矩阵乘法的物理意义和本身数…

电脑usb控制软件有哪些?6款软件帮你轻松解决USB端口泄密烦恼!

在数字化时代&#xff0c;企业的信息安全成为重中之重。 然而&#xff0c;USB端口泄密事件频发&#xff0c;给企业的数据安全和业务连续性带来了巨大威胁。 此前&#xff0c;某大型制造企业&#xff0c;由于员工在日常工作中频繁使用U盘等USB存储设备&#xff0c;导致公司核心…

[Linux]自定义shell详解

自定义shell 前言1.命令行提示符&#xff0c;字符串的打印1.1命令行提示符2.命令行字符串 2.0对命令行字符串进行切割2.执行命令3.有趣的小问题完整代码 前言 写之前我们先看看一个完整的shell都包括了什么 $符号前面&#xff08;包括这个符号&#xff09;就是命令行提示符&a…

电线电缆制造5G智能工厂物联数字孪生平台,推进制造业数字化转型

电线电缆制造行业作为关键的基础设施建设领域&#xff0c;正积极拥抱新技术&#xff0c;推动生产方式的深刻变革。电线电缆制造5G智能工厂物联数字孪生平台的兴起&#xff0c;不仅为行业注入了新的活力&#xff0c;更为制造业的数字化转型树立了新的标杆。 电线电缆制造5G智能…

【项目案例】物联网比较好的10+练手项目推荐,附项目文档/源码/视频

练手项目推荐 1 智能小车 项目功能介绍&#xff1a; 本项目由三部分组成&#xff1a;应用端&#xff08;微信小程序&#xff09;、设备端&#xff08;Hi3861&#xff09;、驱动端&#xff08;UPS&#xff09;。 1. 应用端&#xff0c;采用微信小程序作为应用端控制界面。在开…

8个4K图片壁纸网站分享

整理了8个精选的图片壁纸网站&#xff0c;它们提供了丰富多样的壁纸选择&#xff0c;从自然风光到艺术创作&#xff0c;应有尽有。准备好让你的设备焕然一新了吗&#xff1f;让我们一起来看看这些壁纸宝藏吧&#xff01; 1、菜鸟图库 美女图片|手机壁纸|风景图片大全|高清图片…

工业交换机如何保证数据的访问安全

在现代工业自动化环境中&#xff0c;工业交换机作为关键的网络设备&#xff0c;扮演着数据传输和信息交互的重要角色。为了确保数据的访问安全&#xff0c;工业交换机不仅具备高效的转发性能&#xff0c;还集成了多层次的安全防护机制&#xff0c;以抵御各种潜在的网络威胁。 首…

Unity之FPS

目录 &#x1f3ae;MouseLook摄像机旋转脚本 &#x1f3ae;PickUpItem武器拾取脚本 &#x1f3ae;PlayerController玩家控制器 &#x1f3ae;Inventory武器库 &#x1f3ae;Weapon武器抽象类 &#x1f3ae;Weapon_AutomaticGun武器脚本 其实这个教程很早就收藏了就是被20…

MySQL之表内容的增删改查(含oracel 9i经典测试雇佣表下载)

目录 一:Create 二:Retrieve 1.select列 2.where条件 3.结果排序 4. 筛选分页结果 三:Update 四:Delete 1.删除数据 2. 截断表 五&#xff1a;插入查询结果 六&#xff1a;聚合函数 七:group by子句的使用 表内容的CRUD操作 : Create(创建), Retrieve(读取)…

助力企业降低成本,ByteHouse打造新一代“弹性”云数仓

更多技术交流、求职机会&#xff0c;欢迎关注字节跳动数据平台微信公众号&#xff0c;回复【1】进入官方交流群 在当今的互联网应用中&#xff0c;业务流量往往具有很大的不确定性。 例如&#xff0c;电商平台在 “618”“双 11” 等促销活动期间&#xff0c;访问量会呈爆发式增…

计算机毕业论文题目之基于Web技术B/S结构的新生管理系统包含报道,寝室宿舍,缴费学费,数据统计分析汇总等功能的源代码下载

为了满足功能需求&#xff0c;我们将设计并实现一个基于Web技术的B/S架构下的新生管理系统。本系统旨在通过前端与后端分离的设计模式&#xff0c;为用户提供简洁、高效的交互体验&#xff0c;并确保数据的安全性和系统的可扩展性。下面将从系统架构、功能模块以及技术选型三个…