【文献阅读】GraphAny: A Foundation Model for Node Classification on Any Graph

news2025/1/11 11:17:22

Abstract

可以执行任何新任务而无需特定训练的基础模型已经在视觉和语言应用中引发了机器学习的革命。然而,涉及图结构数据的应用仍然是基础模型面临的一个难题,因为每个图都有独特的特征和标签空间。传统的图机器学习模型,如图神经网络(GNNs),在训练时只能处理特定的图,不能对特征和标签空间不同的新图进行推断。此外,现有模型学习的是针对训练图的特定函数,无法泛化到新图中。

在这项工作中,我们通过一种新的基础架构——GraphAny,解决了这两个挑战。

GraphAny 将对新图的推断建模为线性图神经网络(LinearGNN)的分析解决方案,从而解决了第一个挑战。

为了应对第二个挑战,我们为每个节点学习注意力分数,以融合多个 LinearGNN 的预测结果。具体而言,注意力模块被精心参数化为多个 LinearGNN 预测之间的熵归一化距离特征的函数,以确保对新图的泛化。

实证研究表明,GraphAny 在仅使用 120 个标记节点的威斯康星数据集上训练,能够以 67.26% 的平均准确率有效地对 30 个新图进行归纳泛化,超越了在监督模式下训练的 GCN 和 GAT 以及其他归纳基线。

Introduction

基础模型 [1, 39, 40] 在海量数据上预训练,凭借仅需少量示例即可解决任何新任务的能力,已经彻底改变了人工智能的格局 [8, 3]。到目前为止,这种能力主要限于文本或图像等模态。这些模态的一个固有特性是存在一个跨所有任务的共享输入空间(例如,令牌的词汇表或像素块),为学习一个基础模型覆盖广泛任务类别并泛化到新任务提供了自然基础。然而,图数据不具备这种特性。以节点分类任务为例,每个图可能具有其特征和标签空间的独特维度和语义(例如,连续或离散),这阻碍了我们以与上述模态相同的方式开发图基础模型 [26]。

挑战:(1)现有模型学习特定于训练中使用的特征和标签的维度、类型和结构的变换,不能对与训练不同的特征和标签空间进行推断。这需要我们为任意特征和标签空间开发一种新的模型架构。(2)现有模型学习的是针对训练图的特定函数,无法泛化到新图中;这要求一个能够在训练后对任何图进行泛化的归纳函数。

GraphAny,一种新颖的预训练基础模型架构,能够在任何新图上解决节点分类问题。GraphAny 由两个组件组成:一个 LinearGNN 在没有训练步骤的情况下对新特征和标签空间进行推断,以及一个基于熵归一化距离特征的每个节点的注意力向量,确保对新图的泛化。

具体而言, LinearGNN 将节点特征和标签之间的映射建模为非参数化的图卷积,随后是线性层,其参数在封闭形式中确定,无需明确的训练步骤。虽然单个 LinearGNN 模型可能远未达到许多图的最佳效果,但使用多个具有不同图卷积算子的 LinearGNN 模型,并学习一个注意力向量来融合它们的预测结果。

注意力向量被参数化为 LinearGNN 预测之间距离特征的函数,这保证了模型对特征和标签维度的排列不变。为了进一步提高模型的泛化能力,我们提出了熵归一化,将距离特征分布调整为固定熵,从而减少不同标签维度对距离特征的影响。

直观地说,注意力向量学习根据其预测分布选择每个节点的最有效的 LinearGNN 组合,反映其局部结构的统计特性(例如,同质性度量 [25]),并对新图进行泛化。

Contribution:

  • 提出了 LinearGNN,这是一种高效的架构,适用于在任何具有任意特征和标签空间的图上进行归纳节点分类。
  • 设计了一个归纳注意力模块,用于使用距离特征和熵归一化融合 LinearGNN,这对特征和标签排列不变,对维度变化具有鲁棒性。
  • 结合LinearGNN 和归纳注意力模块,GraphAny 在单一数据集上训练后可以对任何图进行泛化,实现了第一个图基础模型用于节点分类。

GraphAny: A Foundation Model for Node Classification

在这里插入图片描述GraphAny包括一个LinearGNN和一个注意力模块。LinearGNN提供了在具有任意特征和标签空间的新图上进行归纳推理的基本解决方案,而注意力模块则学习基于归纳特征组合多个LinearGNN,以实现对新图的泛化。

LinearGNNs for Inductive Inference on Any Graph

在这里插入图片描述

Learning Inductive Attention over LinearGNNs

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1982466.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在Fragment中显示高德地图

一、首先在高德官网上申请key 第一步:按照规定填写Key名称第二步:选择服务平台,运用在android上就勾选anroid就好了第三步:输入发布版安全码SHA1 首先打开命令行按住windows+r两个按键在命令行中输入cd .android,定位到.android文件下调试版本使用 debug.keystore,命令为…

交通预测数据文件梳理:METR-LA

文章目录 前言一、adj_METR-LA.pkl文件读取子文件1读取子文件2读取子文件3 二、METR-LA.h5文件 前言 最近做的实验比较多,对于交通预测数据的各种文件和文件中的数据格式理解愈加混乱,因此打算重新做一遍梳理来加深实验数据集的理解,本文章作…

数位dp学习

参考借鉴: 数位DP学习整理(数位DP看完这篇你就会了)-CSDN博客 AcWing1081.度的数量(数位DP)题解_求给定区间$ [x,y]$ 中满足下列条件的整数个数:这个数恰好等于 k k k 个互不相等-CSDN博客 就是类似前缀和的思想,进行数字在位数…

最新资讯 | 开源大模型Llama会失去技术优势吗?

昨夜,Meta宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,支持上下文长度为128K Tokens,在基于15万亿个Tokens、超1.6万个H100 GPU上进行训练,这也是Meta有史以来第一次以这种规模训练Llama模型。Meta同时还发布了全新升级的…

2024年,pdf文献热门翻译软件总结推荐

对于如今的时代,市面上存在各式各样的学术资料,对于没有语言天赋的我,看得眼花缭乱。看个学术资料都不知道要用哪个工具,试来试去和睦浪费时间。今天就我使用过的翻译软件中,整理了四款能帮助我们解决文献翻译难题的四…

未授权访问漏洞系列详解⑧!

Druid未授权访问漏洞 漏洞特征:http://www.xxxx.com/druid/index.html 当开发者配置不当时就可能造成未授权访问下面给出常见Druid未授权访问路径 ------------- /druid/websession.html /system/druid/websession.html /webpage/system/druid/websession.html(jeecg) ----…

GitHub惊天安全漏洞:删除的仓库竟能永远访问

引言 近日,GitHub 被曝出一个严重的安全漏洞,引发了广泛关注。开源安全软件公司 Truffle Security 的安全研究员 Joe Leon 发现,在 GitHub 上删除的代码仓库实际上仍然可以被访问。这一发现震惊了整个开源社区。本文将详细探讨这一安全漏洞的…

PXE服务器自助部署

kickstart部分 一、实验环境 两台主机:一台用于环境搭建(ngnix.yee.org),一台用于测试(check_ks)。测试机 二、开启主机图形工具,并进行基本配置 查看 /root/anaconda-ks.cfg 文件,这个文件是系统安装以…

学习记录——day26 进程间的通信(IPC)无名管道 无名管道 信号通信 特殊的信号处理

目录 一、进程间通信引入 二、无名管道 1、无名管道相关概念 2、无名管道的API接口函数 pipe(int pipefd[2]); 3、管道通信的特点 4、管道的读写特点 三、无名管道 1、有名管道:有名字的管道文件,其他进程可以调用 2、可以用于亲缘进程间的通信&…

windows下,使用vs code远程连接云服务器【以CentOS7为例】

windows下,使用vs code远程连接云服务器 1. 下载VS code并准备相关插件2. 使用Remote - SSH远程控制Linux 1. 下载VS code并准备相关插件 1. VS code官网: 下载地址:https://code.visualstudio.com/Download下载合适版本的vs code。 2. 推荐…

20款奔驰S450升级原厂红外夜视系统,提升您夜晚行车安全

夜视辅助系统增强版不仅可以对处于潜在危险位置的行人进行探测,还可发现动物。当车辆进入没有路灯的区域,第三代夜视系统可自动将仪表盘的显示内容从车速表转变为锐度极高的夜视图像,并将探测到前方出现的行人或动物在系统中以鲜明的色彩突出…

CSS前端:元素的布局技巧

【备注】在线测试网站&#xff0c;点此进入。 一、内边距和外边距 【总结】padding增加本元素和子元素的距离&#xff0c;margin增加本元素和父元素的距离。 二、居中和对齐 【需求】 【HTML】 <div id"container"><p id"top">我在div容器…

打卡第33天------动态规划

周末的时候刷题了,在代码随想录系统的学习了一遍算法,看到leetcode上的题不再那么懵了,有点思路了,心里面对题的恐惧感也在逐渐消失,滴水石穿,小坚持带来大改变。 一、不同路径 leetcode题目链接:62.不同路径 题目描述: 一个机器人位于一个 m x n 网格的左上角 (起始…

【更新2022】省级经济高质量发展指标体系测度 含代码 2000-2022

重磅更新&#xff01;【章汕】制作“省级经济高质量发展指标体系测度 含代码”&#xff0c;市面上有这个版本的数据&#xff0c;但其内容非常不全面&#xff0c;个别指标有误&#xff0c;没有stata和代码&#xff0c;即使有代码小白也很容易报错&#xff1b;没有权重、宽面板等…

大数据SQL面试题002-合并日期重叠的活动

在大数据SQL面试中&#xff0c;我们经常会遇到一些棘手的问题&#xff0c;比如合并日期重叠的活动。本文将为大家详细解析这个问题&#xff0c;并提供相应的解决方案。 一、题目分析 题目要求我们处理一个表&#xff0c;表中记录了每个品牌的活动开始日期和结束日期。如果两个…

鸿蒙(API 12 Beta2版)NDK开发【LLDB高性能调试器】调试和性能分析

概述 LLDB&#xff08;Low Level Debugger&#xff09;是新一代高性能调试器。 当前HarmonyOS中的LLDB工具是在[llvm15.0.4]基础上适配演进出来的工具&#xff0c;是HUAWEI DevEco Studio工具中默认的调试器&#xff0c;支持调试C和C应用。 工具获取 可通过HUAWEI DevEco S…

c语言-EasyX库编写的第一个项目-哪都通快递平台

目录 概要设计与详细设计文档 项目测试 相关文件下载 作为《程序设计微项目设计》进行为期一周的开发 概要设计与详细设计文档 1&#xff0e; 项目名称 “哪都通”快递平台 2.项目概述 2.1项目简介 本项目采用c语言全程编写&#xff0c;运用Easyx库创建窗口进行图形显…

shell函数的基本知识

文章目录 shell函数定义函数调用函数函数参数返回值 Shell 输入/输出重定向输入重定向输出重定向 Shell 函数是 Shell 脚本编程中的一个非常有用的特性&#xff0c;它允许你将一段代码封装起来&#xff0c;给它一个名字&#xff08;函数名&#xff09;&#xff0c;然后在脚本的…

力扣面试经典算法150题:合并两个有序数组

算法 本篇开始&#xff0c;正式进入算法刷题篇。 题目来源于力扣面试经典150题。 题目链接&#xff1a;https://leetcode.cn/studyplan/top-interview-150/ 合并两个有序数组 题目选自150题中的数组/字符串一类&#xff0c;题目难度&#xff1a;简单。 题目描述 给定两个按…

R 语言学习教程,从入门到精通,R 基础运算(5)

1、R 基础运算 本章介绍 R 语言的简单运算。 1.1、赋值 一般语言的赋值是 号&#xff0c;但是 R 语言是数学语言&#xff0c;所以赋值符号与我们数学书上的伪代码很相似&#xff0c;是一个左箭头 <- &#xff1a; a <- 123 b <- 456 print(a b)以上代码执行结果…