调研图基础模型(Graph Foundation Models)

news2024/10/7 3:20:52

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


图基础模型(Graph Foundation Models,简称 GFMs) 是一种经过预训练的图大模型,旨在处理不同领域的图数据和任务。让我们详细探讨一下这个概念。

Github BUPT GAMMA Lab:GFMPapers: Must-read papers on graph foundation models (GFMs)

有关的这篇综述论文:https://arxiv.org/abs/2310.11829

什么是基础模型?

基础模型是指在广泛数据上进行预训练的模型,可以适应各种下游任务。这些模型在自然语言处理(NLP)和计算机视觉(CV)等领域取得了显著成功。

基础模型的架构和训练策略的进步赋予了它们独特的特性,如涌现(Emergence)和同质化(Homogenization),使它们成为众多下游人工智能应用的主要构建模块。涌现表示随着数据和模型规模的扩大,它可能会自发地展现新颖的能力。同时,同质化暗指模型的多功能性,使其能够在各种应用中部署。

图学习的挑战

图机器学习经历了从浅层方法到深度学习方法的转变。深度图学习方法,如图神经网络(GNNs),通过引入消息传递机制改变了图机器学习的格局。然而,GNNs 模型仍然存在表达能力和泛化性方面的问题,尤其是考虑到不断扩大的数据集和不断增加的任务范围。

许多图神经网络方法的一个显著局限性是它们过于依赖有监督学习,这可能导致在面对稀疏和噪声数据时鲁棒性和泛化能力不足。为了增强图神经网络的泛化能力,自监督学习(Self-Supervised Learning)已经成为图表示学习中的一种有前景的方法。这些方法的目标是生成可泛化到不同下游任务的图表示,但它们仍然需要使用下游图学习场景的标签进行微调。然而,这种对下游任务的标签数据的依赖可能会限制它们在实际情况中的泛化能力,特别是在难以获取高质量标签的情况下

基础模型在自然语言处理中取得显著成功

大语言模型(LLMs)作为基础模型在 NLP 中取得显著成功。它们不仅可以处理文本,还可以处理图像、视频、音频和多模态输入。这种多功能性使它们在计算机视觉、音频信号处理、推荐系统等各种任务中表现出色。

图基础模型的概念

图基础模型(GFMs) 是一个在广泛的图数据上预先训练的大模型,用于在不同的下游图学习任务中进行微调。GFMs 具备两个主要特征:涌现和同质化。涌现指的是仅在大规模图模型中显现的新能力,而同质化表示模型可以适应不同类型的图学习任务。

目前还没有明确的解决方案来设计和实现 GFMs,但研究人员已经探索了基于 GNN、基于 LLM 以及 GNN+LLM 的不同方法。GFMs 的发展将使其具备更强的图表征学习能力、可迁移性,并适用于更复杂的图数据和任务。

GraphGPT

论文地址:https://arxiv.org/abs/2310.13023

Github 地址:https://github.com/HKUDS/GraphGPT

在这里插入图片描述

总得来说,将大语言模型与图学习结合是一项重大的挑战。首先,在图的结构信息和语言空间之间实现适当的对齐需要深入的研究。同时,如何引导大语言模型有效地理解图的结构信息,以及如何赋予大语言模型对于图学习下游任务逐步推理的能力,都是当前面临的关键问题。

GraphGPT 框架将图结构模型和大语言模型进行参数对齐,利用双阶段图指令微调范式提高模型对图结构的理解能力和适应性,再整合 ChatGPT 提高逐步推理能力,实现了更快的推理速度和更高的图任务预测准确率。

用 “文本-图” 对齐编码结构信息:通过任意的图编码器(例如 Graph Transformer)和文本编码器(例如普通 Transformer)获得编码后的图表示和文本表示。接着,通过对比学习进行不同维度的 “文本-图” 对齐。

两阶段图指令微调

  • 在图指令微调范式的第一阶段,采用了自监督的指令微调策略,该策略将图结构的专有知识融入到语言模型之中,增强了其推理能力,并使其能够准确地捕获图结构中的关联信息。具体而言,这项研究构建了一个结构感知的图匹配任务,指导语言模型利用自然语言标签来识别图中的各个节点。这种指令任务在确切地将图节点与其相关的文本描述关联起来时发挥了核心作用,进而深化了模型对图结构数据的理解。

  • 在第二阶段,提出了特定任务指令微调,旨在定制模型的推理行为,以满足不同图学习任务的特定约束和要求,如节点分类或链接预测。通过使用任务特定的图指令对大语言模型进行微调,引导模型生成更适合当前图学习任务的响应,进一步提高了模型在处理各种图学习任务时的适应性和性能。

  • 最后,通过思维链(Chain-of-Thought)将闭源大语言模型(如,ChatGPT)蒸馏整合到 GraphGPT 中,增强了其逐步推理能力,极大地改善了分布偏移带来的性能下降。

经过上述两个训练阶段,GraphGPT 现在可以理解给定的图结构,并在提供的图中执行各种下游任务。在生成的输出中,大语言模型不仅对节点类型进行预测,还为每个预测提供了详细的解释,以确保模型的决策过程是清晰和可追踪的。

GraphGPT 的贡献

  • 将图领域特定的结构知识与大语言模型的推理能力对齐,以提高图学习的泛化。

  • 提出的方法旨在通过图指令微调范式将大语言模型与图结构数据对齐。此范式结合了自监督指令微调,增强了大语言模型对图结构知识的理解和推理能力。此外,引入了具体任务的指令微调,以提高模型在不同图学习任务中的适应性。

  • 实验评估了 GraphGPT 在有监督和零样本图学习任务上的表现。通过与最先进的基线进行比较,GraphGPT 展现出在各种设置中优越的泛化能力。

总结要点

  1. 图神经网络(GNN)在处理和学习图数据方面强大,但对稀疏和有噪声的数据鲁棒性和泛化性能不佳。

  2. 自监督学习提高图神经网络泛化性能的潜力,但仍需使用下游任务标签进行微调,限制了泛化性能。

  3. 香港大学数据智能实验室的 GraphGPT 结合图结构知识和大型语言模型,提升图学习任务性能。

  4. GraphGPT 采用双阶段的图指令微调方法,增强大型语言模型对图结构的理解和推理能力。

  5. GraphGPT 在有监督和零样本图学习任务上展现出优越的泛化能力,超过基线模型。

  6. GraphGPT 通过思维链蒸馏方法提升逐步推断能力,显著提高复杂图学习任务性能。

  7. GraphGPT 训练和推理效率高,处理大规模图数据,减少参数和计算资源消耗。

2023 NeurIPS New Frontiers in Graph Learning Workshop - Graph Meets LLMs: Towards Large Graph Models

论文地址:https://arxiv.org/abs/2308.14522

图大模型是一种在图领域应用的大模型,具有扩展定律特征,能够理解图的结构和属性,具备处理新颖图数据集和图推理能力,广泛应用于多个领域。

文章概览要点

  1. 清华大学首次提出图大模型的概念,旨在推广大模型在图领域的应用。

  2. 图大模型具有扩展定律特征,随着模型大小、数据集大小和训练计算量的增加,性能持续优化,提升对图数据的理解能力。

  3. 图大模型需要理解图的结构和属性,图预训练是有前途的方法,减少对标签的依赖,赋予模型生成图的能力。

  4. 有效的图大模型应具备理解图上下文和处理新颖图数据集的能力,与少样本/零样本图学习、多任务图学习和图分布外泛化能力相关。

  5. 图推理是处理图任务的常见方法,包括分析拓扑属性、多跳邻域推理和处理全局属性和模式等,图神经网络和 Graph Transformer 是主流的图深度学习架构。

  6. 图大模型的开发依赖于高质量的图数据集,需要收集更多多样性的图数据,以确保模型的有效性。

  7. 图大模型在推荐系统、知识图谱、分子构建、金融、代码和程序、城市计算与交通运输等领域有广泛应用。

这篇文章讨论了图与大型语言模型(LLM)的结合,以及这种结合在处理复杂关系和生物数据等实际应用中的重要性。文章提出了一个新的分类法,将现有方法分为三类,根据LLM在图相关任务中的角色(增强器、预测器和对齐组件)进行组织。此外,文章还讨论了现有研究的局限性,并指出了未来研究的可能方向。

  • 图与 LLMs 的结合:研究者们将图和 LLMs 结合起来,以处理包含文本属性的节点的图,这在多个领域都取得了成功。

  • LLMs 的角色分类:LLMs 在图相关任务中的角色可以分为增强器、预测器和对齐组件三类。

这篇论文提出了一种新颖的概念原型,用于设计具有大语言模型(LLMs)的多功能图学习方法,重点关注 “在哪里” 和 “如何” 方面。从 “在哪里” 角度出发,总结了包括任务定义、图数据特征工程、模型选择和优化、部署和提供服务等四个关键图学习程序,在更广泛的范围内探索了 LLMs 在这些程序中的应用场景。在 “如何” 方面,将 LLMs 的能力与每个程序的要求进行了对齐。

这项研究指出图表示学习是图中心任务中的一个关键步骤,已经取得了显著进展。早期技术通常在端到端的设置中操作,性能在很大程度上依赖于大量标记数据的可用性。这一约束促使图上的小样本学习的出现,其中每个任务只有少量特定于任务的标签可用。鉴于该领域的丰富文献,本调查努力综合最近的发展,提供比较洞察,并识别未来的方向。研究者将现有研究系统地分类为三大类:元学习方法、预训练方法和混合方法,每个类别中都有更细致的分类,以帮助读者在方法选择过程中。在每个类别中,分析这些方法之间的关系,并比较它们的优势和局限。最后,概述了图上小样本学习未来的潜在方向,以促进该领域持续的创新。

小结

大模型在自然语言处理(NLP)和计算机视觉(CV)领域均取得了显著进展,催生了一系列令人瞩目的应用,如 ChatGPT 和 Segment Anything Model。但在图学习领域,如何建立这样的基础模型,以及是否真的可以有一个统一的图学习基础模型,这些问题仍然是个未解之谜。因为不同的图结构在 “语义” 上有很大的差异,难以通过一个单一的模型实现跨数据集和多任务的图结构建模。GraphGPT 的研究借助大语言模型出色的语义建模能力,并通过图指令微调技术赋予其结构化理解,为图基础模型提供了一个可能的发展路径。

对 Data-Centric 图学习的思考:基础模型的崛起凸显了以数据为核心的人工智能(Data-Centric AI)的潜力和优势。但由于不同图结构间的“结构关联” 不能像 NLP 中那样转化为统一的 token 表示,或像 CV 中转化为像素表示,因此如何确立和推进 Data-Centric 图学习的概念仍是个开放性问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1494559.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

掌握Nodejs高级图片压缩技巧提升web优化

掌握Nodejs高级图片压缩技巧提升web优化 在当今的数字时代,图像在网络开发中发挥着至关重要的作用。它们增强视觉吸引力、传达信息并吸引用户。然而,高质量的图像通常有一个显着的缺点——较大的文件大小会减慢网页加载时间。为了应对这一挑战并确保快速加载网站,掌握 Node…

SQL注入漏洞,常用注入函数及其pakachu漏洞靶场演示

目录 SQL注入漏洞概述 SQL注入的常用函数 漏洞分类与利用 1.基于联合查询的SQL注入 2.盲注 时间盲注(base on bool)​编辑 3.宽字节注入 4.inset/update/delete注入 5.header注入 &…

【工作向】protobuf编译生成pb.cc和pb.py文件

序言 首先通过protoc --version查看protoc版本,避免pb文件生成方和使用方版本不一致 1. 生成pb.cc 生成命令 protoc -I${proto_file_dir} --cpp_out${pb_file_dir} *.proto参数: -I表示 proto 文件的路径; --cpp_out 表示输出路径&#xff…

关于Mybatis-Plus报错 Not Found TableInfoCache 解决办法

0. 接口结构&#xff1a;1. 方法报错&#xff1a;2. 解决方法&#xff1a;3. 原因分析&#xff1a; 0. 接口结构&#xff1a; 【接口】&#xff1a; public interface PurchaseOrderService extends IService<PurchaseOrder> {}【接口实现类】&#xff1a; public cla…

Java项目:39 springboot007大学生租房平台的设计与实现

作者主页&#xff1a;舒克日记 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 系统有管理员、房东和用户 【主要功能】 1、后台&#xff1a;房源管理、信息审批管理、订单信息管理、房东管理、用户管理 2、前台&#xff1a;注册登…

PackagesNotFoundError:学习利用报错信息找到解决方法

反思&#xff1a;之前看到报错经常是直接复制报错信息去网上搜&#xff0c;但很多情况下报错信息里其实就给出了解决方案 报错信息&#xff1a; Collecting package metadata (current_repodata.json): done Solving environment: unsuccessful initial attempt using frozen …

[LeetBook]【学习日记】有效数字——状态机

题目 有效数字 有效数字&#xff08;按顺序&#xff09;可以分成以下几个部分&#xff1a; 若干空格一个小数或者整数&#xff08;可选&#xff09;一个’e’或’E’&#xff0c;后面跟着一个整数若干空格 小数&#xff08;按顺序&#xff09;可以分成以下几个部分&#xff1a…

React Vite 构建工具如何查看代码占用体积

首先安装 Vite 中的 rollup-plugin-visualizer 插件 cnpm install rollup-plugin-visualizer 接着在你的 vite.config.ts 中引入并且使用到 plugins 中 import { visualizer } from "rollup-plugin-visualizer";export default defineConfig({plugins: [react(),vi…

JWT令牌实现登陆校验

一、JWT出现的背景 jwt令牌出现的背景&#xff0c;比如我们通过一个路由访问网站的时候&#xff0c;有些游客在知道url的情况下会跳过用户登录直接访问其他网页&#xff0c;这样不仅在逻辑上说不通&#xff08;我没登陆咋就能使用其他功能&#xff1f;&#xff09;还会造成信息…

第三天 Kubernetes进阶实践

第三天 Kubernetes进阶实践 本章介绍Kubernetes的进阶内容&#xff0c;包含Kubernetes集群调度、CNI插件、认证授权安全体系、分布式存储的对接、Helm的使用等&#xff0c;让学员可以更加深入的学习Kubernetes的核心内容。 ETCD数据的访问 kube-scheduler调度策略实践 预选与…

SSD LDPC纠错算法的重要性

固态硬盘&#xff08;Solid State Drives, SSD&#xff09;作为计算机行业中最具革命性的技术之一&#xff0c;凭借其更快的读写速度、增强的耐用性和能效&#xff0c;已经成为大多数用户的首选存储方案。然而&#xff0c;如同任何其他技术一样&#xff0c;SSD也面临自身的挑战…

SpringBoot约定大于配置

什么是约定大于配置 "约定大于配置"&#xff08;Convention Over Configuration&#xff09;是一种理念&#xff0c;旨在通过默认约定和规则来减少开发人员需要做的配置工作。在Spring Boot框架中&#xff0c;这一原则得到了充分应用&#xff0c;帮助开发者更快地构…

C++之获取Windows系统信息

目录 1. 操作系统版本 2. 获取CPU信息 3. 获取内存信息 4. 获取硬盘信息 5.获取网络接口信息 6.获取计算机名称、用户名 在C中&#xff0c;你可以使用Windows API函数来获取Windows系统的各种信息。以下是一些常见的API函数和示例代码&#xff0c;用于获取Windows系统信息…

⭐每天一道leetcode:35.搜索插入位置(简单;二分速查)

⭐今日份题目 给定一个排序数组和一个目标值&#xff0c;在数组中找到目标值&#xff0c;并返回其索引。如果目标值不存在于数组中&#xff0c;返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 示例1 输入: nums [1,3,5,6], target 5 输出: 2 …

计算机体系结构:VLIW

原文来自知乎 计算机体系结构&#xff1a;VLIW 本文主要介绍计算机体系结构中的VLIW&#xff0c;以供读者能够理解该技术的定义、原理、应用。 &#x1f3ac;个人简介&#xff1a;一个全栈工程师的升级之路&#xff01; &#x1f4cb;个人专栏&#xff1a;计算机杂记 &#x1f…

8套成熟在用的三级医院信息化系统源码,HIS、LIS、PACS、智慧导诊、线上预约挂号支付系统源码

8套成熟在用的二级医院、三级医院医院管理系统源码&#xff0c;均有自主知识产权&#xff0c;应用案例&#xff0c;系统稳定运行中。可直接上手项目&#xff0c;支持二次开发 ▶ 一、SaaS模式Java语言开发的云HIS系统源码 在公立二甲医院应用三年&#xff0c;融合B/S版电子病历…

[项目设计] 从零实现的高并发内存池(四)

&#x1f308; 博客个人主页&#xff1a;Chris在Coding &#x1f3a5; 本文所属专栏&#xff1a;[高并发内存池] ❤️ 前置学习专栏&#xff1a;[Linux学习] ⏰ 我们仍在旅途 ​ 目录 6.内存回收 6.1 ThreadCache回收内存 6.2 CentralCache回收内存 Rele…

Docker安装+基础命令

一、检测、配置安装环境 &#xff08;1&#xff09;查看linux版本&#xff0c;是否符合>centos 7 &#xff08;2&#xff09;查看网络是否通畅 &#xff08;3&#xff09;安装gcc&#xff0c;gcc-c编译器 &#xff08;4&#xff09;安装device-mapper-persistent-data和lvm2…

【LabVIEW FPGA】CIC滤波器

一、CIC滤波器应用概述 在通信数字信号上下变频时&#xff0c;经常会用到对数字信号的升采样和降采样&#xff0c;即通过CIC数字速率器实现变采样率。 二、滤波器IP 首先设置滤波器基本参数&#xff08;filter specification&#xff09; 滤波器类型&#xff08;Filter Type…

2024年阿里云域名优惠口令更新,亲测有效口令大全

2024年阿里云域名优惠口令&#xff0c;com域名续费优惠口令“com批量注册更享优惠”&#xff0c;cn域名续费优惠口令“cn注册多个价格更优”&#xff0c;cn域名注册优惠口令“互联网上的中国标识”&#xff0c;阿里云优惠口令是域名专属的优惠码&#xff0c;可用于域名注册、续…