《Pure Transformers are Powerful Graph Learners》NIPS2022

news2024/9/19 23:57:22

摘要

论文展示了标准Transformer模型,无需针对图数据的特定修改,就可以在图学习领域取得有希望的结果,无论是在理论还是实践上。作者提出,通过将图中的所有节点和边视为独立的token,并通过适当的token嵌入增强它们,然后将这些token输入到Transformer中,就可以有效地处理图数据。这种方法在大规模图数据集 PCQM4Mv2 上取得了显著优于图神经网络(GNN)基线的结果,并且与具有复杂图特定归纳偏置的Transformer变体相比具有竞争力。

概述

拟解决的问题: 在图学习领域,以往的研究主要集中在图神经网络(GNN)上,这些网络通常依赖于消息传递机制。然而,这些方法可能会受到过平滑(oversmoothing)等问题的影响,并且可能不适用于多任务和多模态的通用注意力架构。论文旨在探索将标准Transformer直接应用于图数据的可能性,并证明其有效性。

创新之处

  1. 提出了一种新颖的方法,即Tokenized Graph Transformer(TokenGT),它直接将图的节点和边作为token输入到标准Transformer中,而不依赖于图特定的架构修改。
  2. 证明了这种方法在理论上至少与二阶不变图网络(2-IGN)一样表达能力强,这意味着它比所有消息传递的GNN都更具表达性。
  3. 在PCQM4Mv2数据集上的实验结果表明,TokenGT在没有复杂图特定归纳偏置的情况下,仍然能够取得与GNN基线相比更好的性能。

方法

  • 将图中的每个节点和边视为独立的token,并为它们分配token嵌入。
  • 使用正交节点标识符和可训练的类型标识符来增强token,以保留图的结构信息。
  • 将增强后的token输入到标准的Transformer模型中,进行图级别的预测。

处理图的最直接的方法是直接将令牌X作为Transformer的输入,但它是不合适的,因为图的连通性被丢弃。为了彻底表示图结构,我们使用令牌嵌入来增强令牌 X,更具体地说,用于表示令牌的连通性的正交节点标识符和编码令牌是否为节点或边的可训练类型标识符的连接。

定义图为n个节点,m条边

3.1 Node Identifiers

Node Identifiers 的主要目的是在不直接修改 Transformer 架构的情况下,使模型能够识别和利用图中的节点连接性。这些标识符作为输入图的节点和边的额外信息,被用来增强每个节点和边的表示,从而让 Transformer 能够通过注意力机制识别节点间的连接关系。

3.2 Type Identifiers

Type Identifiers 的主要目的是在模型中明确区分不同类型的图元素,即节点和边。这对于模型正确理解和处理图结构至关重要,尤其是在执行注意力机制时,模型需要知道它正在处理的是节点信息还是边信息。

在 TokenGT 模型中,每个节点 v 的 token 被增强为:

对于每条边 (u,v),其 token 被增强为:

E^{v}是节点标识符,E^{\varepsilon }属于边标识符。

3.3 Main Transformer

Main Transformer 的目的是将增强后的图数据(节点和边作为独立的 tokens)进行有效的处理,以学习图的全局和局部特征。它通过标准的 Transformer 架构,利用自注意力机制(Self-Attention)来捕捉图中节点间的复杂关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2147338.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++初阶学习第六弹------标准库中的string类

目录 一.标准库中的string类 二.string的常用接口函数 2.1string类对象的构造 2.2 string的容量操作 2.3 string类的访问与遍历 2.4 string类对象的修改 2.5 string类常用的非成员函数 三、总结 一.标准库中的string类 可以简单理解成把string类理解为变长的字符数组&#x…

Linux运维篇-tigervnc工具的使用

目录 简介下载使用clientserver配置文件服务管理 设定密码(先切换成对应的用户):配置多用户的VNC tigervnc连接排错一、vnc密码错误二、vncserver端口忘记了三、连接很卡,或者画面没有反应四、服务报错 简介 TigerVNC是VNC的一种…

Java语言程序设计基础篇_编程练习题*18.29(某个目录下的文件数目)

题目:*18.29(某个目录下的文件数目) 编写一个程序,提示用户输入一个目录,然后显示该目录下的文件数。 和上一题(18.28)的思路差不多,把找到文件后累加大小到变量变成计数1即可。 Java语言程序设计基础篇_编程练习题*18.28 (非递…

光莆亮相第25届中国国际光博会(CIOE2024)

“光引未来,驱动创新” 2024年9月11-13日,第25届中国国际光电博览会(CIOE2024)在深圳国际会展中心(宝安新馆)隆重开幕。作为国家商务部首批重点展览会,CIOE2024聚焦科研成果转化,推动产学研用深度融合,光电行业全产业…

【海康威视面经】

海康威视面经 Java基础java常用集合 及其优缺点ArrayListVectorLinkedList Jvm调优监控发现问题工具分析问题 :性能调优GC频繁 出现内存泄漏 内存溢出CPU飙升 Synchronized和Volatile的比较反射线程池和new thread利弊高并发 集群 分布式 负载均衡 MySQL调优基础优化…

探索Python中文拼音转换的奥秘:xpinyin库

文章目录 **探索Python中文拼音转换的奥秘:xpinyin库**背景介绍库简介安装指南函数使用示例应用场景常见问题与解决方案总结 探索Python中文拼音转换的奥秘:xpinyin库 背景介绍 在处理中文文本数据时,我们经常需要将中文字符转换为拼音。无…

TS Vue项目中使用TypeScript

模块系统与命名空间 概念 模块化开发是目前最流行的组织代码方式,可以有效的解决代码之间的冲突与代码之间的依赖关系,模块系统一般视为“外部模块”,而命名空间一般视为“内部模块” 模块系统 TS中的模块化开发跟ES6中的模块化开发并没有…

22 C 语言字符处理:分类判断与转换(ASCII 码、字母大小写)函数详解

目录 1 isdigit() 1.1 函数原型 1.2 功能说明 1.3 代码示例 2 isxdigit() 2.1 函数原型 2.2 功能说明 2.3 代码示例 3 islower() 3.1 函数原型 3.2 功能说明 3.3 代码示例 4 isupper() 4.1 函数原型 4.2 功能说明 4.3 代码示例 5 isalnum() 5.1 函数原型 5.…

MySQL索引知识个人笔记总结

本篇笔记是个人整理的索引知识总结,刚开始有点乱,后续会一直边学边整理边总结 索引(index)是帮助MySQL高效获取数据的数据结构(有序)。就好比索引就是数据的目录 索引结构 Btree索引,Hash索引,Full-text索引,R-tree(空…

L67 【哈工大_操作系统】操作系统历史 学习任务

L6 操作系统历史 线条一 1、上古神机 IBM7094 专注于计算批处理操作系统(Batch system) 2、OS/360 一台计算机干多种事,多道程序作业之间的 切换和调度 成为核心 (多进程结构和进程管理概念萌芽!) 3…

关于Java数据结构中集合的一个小知识

在我们以后刷题的过程,我们会遇到一些奇怪的集合数据类型。 如下图 这里,我们以顺序表的集合类为例,我们看到上图函数的返回值类型有点奇怪,其实并不奇怪,也就是穿过去的参数类型是一个顺序表的集合类型,也…

Mysql高级篇(中)—— SQL优化

SQL优化 一、SQL优化的计划或思路二、关联查询优化三、子查询优化四、exists 和 not exists1、exists 介绍2、exists 和 not exists 五、单路排序和多路排序(了解)六、排序分组优化1、order by(1)避免临时排序,使用索引排序&#…

【LabVIEW】条件结构的使用

本篇文章记录LabVIEW条件结构的使用方法,希望我的分享能对你有所帮助! 一、实践项目 二、工程详解 1、考虑到输入的数值需要判断一下是否是在0-100之间,故使用“判定范围并强制转换”模块 2、设置数值表示法和上下限 3、验证判断 4、最终程…

(黑马点评)二、短信登录功能实现

2.1 基于传统Session实现的短信登录及其校验 2.1.1 基于Session登录校验的流程设计 2.1.2 实现短信验证码发送功能 请求接口/user/code请求类型post请求参数phone返回值无 /*** 发送手机验证码*/PostMapping("/code")public Result sendCode(RequestParam("ph…

前端框架对比和选择

​ 大家好,我是程序员小羊! 前言: 前端框架选择是前端开发中的关键决策,因为它影响项目的开发效率、维护成本和可扩展性。当前,最流行的前端框架主要包括 React、Vue 和 Angular。它们各有优劣,适用于不同…

wallpaper engine壁纸提取

下载提取软件RavioliGameTools_v2.10.zip https://pan.baidu.com/s/14ZCVw3ucRERsB-GGGoCOqQ 2.运行RExtractor.exe 3.Input file(s)、Output directory填好 4.勾选Allow scanning of unkown files 5.点击Start

智能办公新纪元:AI优秘圈引领未来工作方式

随着人工智能技术的不断进步,它已经开始渗透到我们工作与生活的每一个角落。在这一背景下,AI优秘圈以其创新的智能办公解决方案,正在重新定义企业的工作方式。本文将探讨AI优秘圈如何利用AI技术提升工作效率,降低成本,…

AI换脸等违法行为的最关键原因是个人隐私信息的泄露,避免在网络上发布包含个人敏感信息的照片。

文章目录 引言I 避免在网络上发布包含个人敏感信息的照片不要晒家门钥匙、车牌等照片。不要发布各种票据类的照片不要公布手持身份证或手持白纸照II 相关反制技术的开发和应用III 犯罪案例: 通过“换脸”伪造不雅照当事人犯罪团伙引言 当前AI换脸技术比较成熟,能支持视频通话…

25届和24届一样,涝的涝死旱的旱死

还是秋招 今天无意间翻到一篇帖子: 帖子提到自己的求职经历:想找个产品实习岗,但连实习岗都会要求有相关工作经历... 经典的"蛋生鸡,鸡生蛋"问题。 在经历了完整的秋招后,总的感觉是"涝的涝死&#xff…

基于MATLAB/Simulink的模型降阶方法介绍

降阶建模ROM(Reduced order modeling) 和模型降阶MOR(Model order reduction) 是降低全阶高保真模型的计算复杂性,同时在令人满意的误差范围内保持预期保真度的技术。 模型降阶技术可以解决科学计算邻域在建模仿真与工程应用中的几大痛点: 高保真模型计…