【GAT】 代码详解 (1) 运行方法【pytorch】可运行版本

news2024/11/19 11:43:37

请添加图片描述

GRAPH ATTENTION NETWORKS 代码详解

  • 前言
  • 0.引言
  • 1. 环境配置
  • 2. 代码的运行
    • 2.1 报错处理
    • 2.2 运行结果展示
  • 3.总结

前言

在前文中,我们已经深入探讨了图卷积神经网络和图注意力网络的理论基础。还没看的同学点这里补习下。接下来,将开启一个新的阶段,我们将借助强大的深度学习框架PyTorch,通过实战讲解来展示如何构建和训练一个GAT模型。这一过程不仅帮助读者巩固理论知识,更重要的是,它将引导读者从理论迈向实践,实现在处理具有图结构数据的问题上的质的飞跃。

在本章节中,我将主要介绍如何运行代码以获取计算结果。考虑到我的读者中有很多是初学者,我认为在深入探讨代码的各种细节之前,首先了解如何简单地运行模型并查看其结果是非常必要的。这不仅可以帮助读者迅速掌握操作,还能使他们对模型的工作流程有一个直观的认识。

这个原文的代码地址感兴趣的读者自行下载即可 https://github.com/2578562306/pyGAT

在这里插入图片描述

😃当然要是觉得还不错的话,烦请点赞,收藏➕关注👍

0.引言

这是 Veličković 等人在 2017 年提出的图注意力网络(GAT)模型的 PyTorch 实现(https://arxiv.org/abs/1710.10903)。该代码库最初从 https://github.com/tkipf/pygcn 分叉而来。GAT 的官方仓库(采用 TensorFlow 实现)可以在 https://github.com/PetarV-/GAT 找到。目前网络上的主流讲解基本都是以这些版本的代码为基础,因此,我们将依据这些代码深入探索 GAT,了解图神经网络中如何实现注意力机制的能力。

重要说明==此外,本 PyTorch 实现与原始的 TensorFlow 版本(见此链接)存在一些细微差异。当前的 PyTorch 版本主要旨在进行概念验证,并非旨在完全复现原论文中报告的结果。因此,复现出来的结果与原始论文中的结果存在一定的差距。在对当前代码进行讲解之后,作者将分析这些差异,并指导大家如何复原文中的实验结果。==该实现使用的是 Cora 数据集,其主要被分成了两个文件。具体细节将在下一章节的代码分析部分进行详细说明。

1. 环境配置

如果您已经配置好相关环境,可以跳过本部分。

对于计划在特定环境下运行图注意力网络(GAT)的开发者而言,了解并设置正确的系统要求是至关重要的初步步骤。以下详述了系统和软件环境的要求,以确保GAT可以被正确安装并顺利运行。

必需的软件和库:

  • PyTorch: 需要安装的版本为0.4.1。PyTorch是执行深度学习模型的核心库,尤其是在本实现中的图注意力网络(GAT)。
  • Python: 支持的版本为3.5。Python是运行这一图注意力网络代码的基本环境。由于使用了torch.sparse_coo_tensor,我们依赖特定版本的PyTorch和Python。

Python包依赖:
正确安装以下Python包是确保模型正常运行的前提条件。您可以通过运行下列命令来安装或检验这些依赖是否正确安装:

这里你可以插入具体安装依赖的命令,其中模型还是用到numpy和scipy的库,可以通过使用pip安装:

pip install numpy
pip install scipy

请确保所有的环境配置都符合要求,以便无障碍地运行和应用图注意力网络。

使用 Python 开发环境中需要使用外部库,如 numpy, torch, 和 scipy 等时,可以通过 pip 命令来安装这些库。pip 是 Python 的官方包管理系统,用于安装和管理软件包,这些包通常来自于 Python 包索引(PyPI),它是一个集中存放 Python 程序包的仓库。

如何使用 pip 在命令行中安装软件包???????:

  1. 打开命令行工具

    • 在 Windows 上,可以打开命令提示符或 PowerShell。
    • 在 macOS 或 Linux 上,可以打开终端。
  2. 输入安装命令

    • 在命令行中输入 pip install 包名 命令。例如,要安装 Numpy,就输入 pip install numpy
  3. 执行命令

    • 按回车键,pip 将自动从 PyPI 下载并安装该软件包及其依赖。

安装多个包

  • 如果要一次安装多个包,可以在同一命令行中列出所有包,用空格隔开。例如:pip install numpy torch scipy

此过程将在您的系统上安装指定的 Python 库,允许您在任何 Python 脚本或项目中导入并使用这些库。

注意事项:

  • 确保您的网络连接畅通,因为 pip 需要从互联网下载包。
  • 在某些情况下,如果默认的 pip 安装的不是针对您当前使用的 Python 版本,可能需要使用 pip3 替代 pip
  • 根据您的系统设置,可能需要管理员权限来安装包。在这种情况下,您可能需要在命令前加上 sudo(适用于 Linux 和 macOS),例如 sudo pip install numpy

通过以上步骤,您可以轻松地通过 pip 在任何支持的开发环境中安装和管理 Python 包,从而为开发工作提供必要的库支持。

大家很多同学都用 Jupyter Notebook 或 Visual Studio Code(VSCode)进行 Python 开发时,使用 pip 安装库同样是一个简单且有效的方式。以下是在这两种开发环境中安装 Python 库的详细步骤:

在 Jupyter Notebook 中安装库:

  1. 打开 Jupyter Notebook

    • 通常通过在终端中输入命令 jupyter notebook 来启动 Jupyter Notebook。
  2. 创建或打开一个笔记本

    • 在 Jupyter 的主界面,可以选择“New”(新建)然后选择“Python X”(X代表版本号)来创建一个新的笔记本。
  3. 安装库

    • 在笔记本的一个新单元中输入安装命令,例如:
      !pip install numpy
      
    • 执行单元格(按 Shift + Enter),这条命令将会在你的 Python 环境中安装 NumPy 库。

在 Visual Studio Code(VSCode)中安装库:

  1. 打开或创建一个 Python 文件

    • 在 VSCode 中打开你正在工作的项目或者新建一个 Python 文件。
  2. 打开终端

    • 在 VSCode 中,你可以通过点击顶部菜单的 “View”(视图) > “Terminal”(终端)来打开一个新的终端。或者使用快捷键 Ctrl+` (反引号)打开或切换终端。
  3. 执行安装命令

    • 在打开的终端中,输入如下的命令来安装所需的库,例如:
      pip install numpy
      
    • 按 Enter 执行,该命令将会为你的 Python 环境安装库。

在两种情况下,你都可以通过类似的方式安装任何需要的库。只需将 numpy 替换为你需要安装的库的名称即可。确保你已经配置好了 Python 和 pip。 在 VSCode 或 Jupyter Notebook 中,你可以通过这种方式方便地管理 Python 包,以满足开发需求。这使得使用这些工具进行科学计算和开发成为一件高效且愉快的事情。

2. 代码的运行

在这里我仅仅展示如何修改代码保证模型的正确运行,下面是代码的文件划分:

请添加图片描述

文件名称还是很直接的,模型使用的数据和上一节中GCN使用的一致,在这里不讨论。output输出文件仅仅是用来存放可视化结果的这里要执行代码仅仅需要修改utils.py文件。

请添加图片描述

细心的同学一定会发现这个内容和GCN中的代码一样,的确这个代码被作者重复用了。造轮子大家用,确实很很爽的一件事。

在这里插入图片描述

这个地址修改成你自己存储数据的目录地址即可。如果你不知道地址在哪里???怎么办???

在这里插入图片描述

都是些很基础的操作,同样在jupyter中打开数据的位置右键也会有复制地址的选项我在这里就不过的赘述了。然后点击train.py文件执行 文件即可。如果是说咱们的有些同学使用的是jupyter那么你还要将代码复制到一个ipynb文件中再执行文件。

请添加图片描述

2.1 报错处理

如果jupyter环境下运行的同学出现报错,那么就多半是这里出现了问题:
在这里插入图片描述
需要对代码修改如下:
在这里插入图片描述
代码我放在这里便于大家直接复制:

args = parser.parse_args(args=[]) 

2.2 运行结果展示

其输出结果与GCN相似,但值得注意的是,每次运行的epoch数量都有所不同。这是因为模型采用了早停机制,在训练过程中一旦满足特定条件即提前终止,以防止过拟合。在下一节的代码详解中,我将详细讲解早停机制的使用方法和它的工作原理。
请添加图片描述

这些数据展示了在训练图注意力网络(GAT)时的各个epoch(训练周期)的性能指标。下面是对这些数据的简单解释:

  • Epoch: 这表示当前的训练周期编号,从0001开始,每个周期均包括向前和向后传播过程。
  • loss_train: 这是训练集上的损失值,反映了模型在训练数据上的表现。损失值越低,表示模型在这组数据上的拟合越好。
  • acc_train: 这是训练集上的准确率,以百分比表示,显示了模型正确分类训练数据的能力。
  • loss_val: 这是验证集上的损失值,用于评估模型在未见过的数据上的泛化能力。在实际应用中,我们希望验证损失与训练损失相近,这表明模型没有过拟合。
  • acc_val: 这是验证集上的准确率,反映了模型在验证数据上的分类准确性。较高的验证准确率表明模型具有较好的泛化性能。
  • time: 这是完成该周期训练所需的时间,以秒为单位。这个时间包括了数据处理、模型计算和反向传播等所有步骤的时间。

从这些数据中可以观察到,随着训练周期的增加,训练和验证的损失通常会逐渐减小,而准确率则逐渐提高。这是模型学习过程的典型表现,表示模型在逐渐适应和理解训练数据。然而,重要的是要监控训练和验证损失之间的差异,以及相应的准确率,以便及时调整训练参数或提前停止训练,防止过拟合。

下面的最终运行结果是我在CPU中实验得到的给各位一个运行的参考:
请添加图片描述

至于这个准确率为和如何之高,[可以参考我这个博文的理解。]。(https://blog.csdn.net/weixin_47332746/article/details/143515332)

3.总结

现阶段,我们已经全面介绍了图注意力网络(GAT)的理论基础及模型的运行方式。在接下来的篇章中,我们将深入探讨该模型及相关论文中的核心架构和代码实现。
这一部分将为对这一主题感兴趣的读者提供一个详细的技术视角,帮助您从基本理论开始,逐步了解模型是如何通过精确的数学建模和编程实现来完成预期的机器学习任务。深入解析模型的主体架构对于理解其工作原理至关重要,对于那些希望在此基础上进行改进或希望自定义该模型以适应特定应用的研究者和开发者而言,尤其具有价值。

如果您对这些内容感兴趣,请不要忘记点赞、收藏并关注。这是对我的工作最大的支持和鼓励。非常感谢您!如果有任何疑问,欢迎随时与我联系。我期待与您的互动!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2243363.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

远程控制步骤

当远在千里之外的朋友想求助你帮他找到他电脑上的文件、或者是给他安装软件时。但是你给他说了他又找不到,那么这时你就可以通过控制对方的电脑去做一系列的操作。 如何远程控制对方的电脑非常关键。 方法一(Windows自带远程桌面功能)&#…

C指针之舞——指针探秘之旅

❤博客主页:折枝寄北-CSDN博客 ❤专栏内容:C语言学习专栏https://blog.csdn.net/2303_80170533/category_12794764.html?spm1001.2014.3001.5482 指针基础学习 在之前的博客文章中,简单总结了指针的基础概念 我们知道了指针的概念&#xf…

前端 JS 浅拷贝与深拷贝

目录 一、问题引出 二、浅拷贝 1、通过解构重构实现浅拷贝 三、深拷贝 1、自定义实现深拷贝 2、JSON实现深拷贝 四、总结 一、问题引出 基础类型的数据存放: let a 100let b aconsole.log("a:" a, "b:" b)a 50console.log("a…

72项!湖北省2024年度第二批省级科技计划项目拟立项项目公示!

本期精选 SCI&EI ●IEEE 1区TOP 计算机类(含CCF); ●EI快刊:最快1周录用! 知网(CNKI)、谷歌学术期刊 ●7天录用-检索(100%录用),1周上线; 免费稿件评估 免费匹配…

uniapp微信小程序转发跳转指定页面

onShareAppMessage 是微信小程序中的一个重要函数,用于自定义转发内容。当用户点击右上角的菜单按钮,并选择“转发”时,会触发这个函数。开发者可以在这个函数中返回一个对象,用于定义分享卡片的标题、图片、路径等信息。 使用场…

[N1CTF 2018]eating_cms

打开题目 只有个登录框,其他什么都没有,尝试了一下弱口令,没能成功 尝试访问一下register.php,看看能不能注册个账号 注册页面,随便注册个账号登陆一下 url中感觉是个注入点,尝试使用file伪协议读取一下us…

PMP–一、二、三模、冲刺–分类–5.范围管理–技巧–引导

文章目录 技巧一模5.范围管理--3.定义范围--工具与技术--引导--在研讨会和座谈会中使用引导技能来协调具有不同期望或不同专业知识的关键干系人,使他们就项目可交付成果以及项目和产品边界达成跨职能的共识。引导:题干关键词 “需求不同、需求差异、需求…

C语言-字符串指针及多变的访问方式

1、字符串指针 示例;输出字符串数组 1. #include <stdio.h> 2. #include <string.h> 3. 4. int main(){ 5. char str[] "<http://baidu.com>"; 6. int len strlen(str), i; 7. //直接输出字符串 8. printf("%s\\n", str); 9. //每次…

Linux之vim模式下全选命令

在Linux系统中&#xff0c;使用Vim编辑器进行全选操作可以通过以下几种方式实现&#xff1a; 1.使用键盘快捷键 按下 ”ggVG”&#xff08;先按下”g”&#xff0c;再按下”g”&#xff0c;再按下”V”&#xff0c;最后按下”G”&#xff09;可以全选当前文件内容。其中 ”g…

解决虚拟机未被自动分配ip

文章目录 1. 背景2. 解决步骤 1. 背景 从vulnhub下载的靶场文件&#xff0c;网络适配器模式设置为nat模式之后&#xff0c;启动虚拟机之后发现没有成功分配动态ip。推测是虚拟机分配的网卡名称和原先靶机作者设置网络配置文件 网络接口名称不一致导致。 2. 解决步骤 解决办法就…

【数据结构与算法】排序

文章目录 排序1.基本概念2.分类2.存储结构 一.插入排序1.1直接插入排序1.2折半插入排序1.3希尔排序 二.选择排序2.1简单选择排序2.2堆排序 三.交换排序3.1冒泡排序3.2快速排序 四.归并排序五.基数排序**总结** 排序 1.基本概念 排序&#xff08;sorting&#xff09;又称分类&…

5. ARM_指令集

概述 分类 汇编中的符号&#xff1a; 指令&#xff1a;能够编译生成一条32位机器码&#xff0c;并且能被处理器识别和执行伪指令&#xff1a;本身不是指令&#xff0c;编译器可以将其替换成若干条指令伪操作&#xff1a;不会生成指令&#xff0c;只是在编译阶段告诉编译器怎…

WPF MVVM框架

一、MVVM简介 MVC Model View Control MVP MVVM即Model-View-ViewModel&#xff0c;MVVM模式与MVP&#xff08;Model-View-Presenter&#xff09;模式相似&#xff0c;主要目的是分离视图&#xff08;View&#xff09;和模型&#xff08;Model&#xff09;&#xff0c;具有低…

Java-03 深入浅出 MyBatis - 快速入门(无 Spring) 增删改查 核心配置讲解 XML 与 注解映射

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 大数据篇正在更新&#xff01;https://blog.csdn.net/w776341482/category_12713819.html 目前已经更新到了&#xff1a; MyBatis&#xff…

Spring Cloud Alibaba [Gateway]网关。

1 简介 网关作为流量的入口&#xff0c;常用功能包括路由转发、权限校验、限流控制等。而springcloudgateway 作为SpringCloud 官方推出的第二代网关框架&#xff0c;取代了Zuul网关。 1.1 SpringCloudGateway特点: &#xff08;1&#xff09;基于Spring5&#xff0c;支持响应…

Debezium-EmbeddedEngine

提示&#xff1a;一个嵌入式的Kafka Connect源连接器的工作机制 文章目录 前言一、控制流图二、代码分析 1.构造函数2.完成回调3.连接器回调4.RUN总结 前言 工作机制&#xff1a; * 独立运行&#xff1a;嵌入式连接器在应用程序进程中独立运行&#xff0c;不需要Kafka、Kafka C…

阿里斑马智行 2025届秋招 NLP算法工程师

文章目录 个人情况一面/技术面 1h二面/技术面 1h三面/HR面 20min 个人情况 先说一下个人情况&#xff1a; 学校情况&#xff1a;211本中9硕&#xff0c;本硕学校都一般&#xff0c;本硕都是计算机科班&#xff0c;但研究方向并不是NLP&#xff0c;而是图表示学习论文情况&…

社交电商的优势及其与 AI 智能名片小程序、S2B2C 商城系统的融合发展

摘要&#xff1a;本文深入分析了社交电商相较于传统电商的优势&#xff0c;包括门槛低、易操作、更生活化和可团队化运作等特点。同时&#xff0c;探讨了 AI 智能名片小程序和 S2B2C 商城系统在社交电商发展中的作用&#xff0c;以及它们与社交电商融合所带来的新机遇和发展前景…

自动化运维-检测Linux服务器CPU、内存、负载、IO读写、机房带宽和服务器类型等信息脚本

前言&#xff1a;以上脚本为今年8月1号发布的&#xff0c;当时是没有任何问题&#xff0c;但现在脚本里网络速度测试py文件获取不了了&#xff0c;测速这块功能目前无法实现&#xff0c;后面我会抽时间来研究&#xff0c;大家如果有建议也可以分享下。 脚本内容&#xff1a; #…

3D Streaming 在线互动展示系统:NVIDIA RTX 4090 加速实时渲染行业数字化转型

随着科技的飞速发展&#xff0c;实时渲染正逐步成为游戏与实时交互领域的重要驱动力。与离线渲染不同&#xff0c;实时渲染需要极高的计算性能&#xff0c;对硬件设备尤其是GPU的性能要求极高。随着 RTX 4090 显卡的问世&#xff0c;其强大的算力和创新技术&#xff0c;为实时渲…