一、图机器学习导论【CS224W】(Datawhale组队学习)

news2024/9/20 17:00:04

请添加图片描述

开源内容:https://github.com/TommyZihao/zihao_course/tree/main/CS224W

子豪兄B 站视频:https://space.bilibili.com/1900783/channel/collectiondetail?sid=915098

斯坦福官方课程主页:https://web.stanford.edu/class/cs224w

文章目录

  • 前言
  • 图的应用场景
  • 如何对图数据进行挖掘
    • 图深度学习
    • 图深度学习难点
  • 图机器学习必备工具
  • 图机器学习应用
    • 图的计算任务
    • 图的商业价值
  • 图数据挖掘项目
  • 扩展阅读
    • AlphaFold
    • 思考题
    • 其它阅读材料
  • 总结

前言

图是描述关联数据的通用语言,很多数据都是以图的形式进行存储的。很多问题也可以转换成图的问题,例如七桥问题。图广泛的存在于自然界中,例如黏菌在培养皿里面可以形成铁路网的形状。
因此研究图机器学习十分必要,没有相关基础的小伙伴可以参考这篇博客图论期末复习(《图论机器应用》——朴月华),了解一下图论的基本知识。

图的应用场景

图的应用场景:事件关系、计算机网络、疾病传播路径、食物链、粒子网络、地铁站、社交网络、经济网络、通讯网络、论文引用网络、互联网、神经网络、医疗知识图谱、基因和蛋白质的调控网络、场景网络、代码图、化学分子、3D建模
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

如何对图数据进行挖掘

  • 传统的机器学习
    数据都是独立同分布的,彼此孤立无关
    在这里插入图片描述

  • 现代深度学习方法
    主要用于处理表格、像素矩阵或者序列数据,包括全连接神经网络、卷积神经网络(CS231N)、循环神经网络(CS224N)、Transformer、图神经网络(CS244W)

  • 图深度学习
    前面介绍的那些方法都无法处理由节点和连接构成的图数据,而这却恰恰是图机器学习所要解决的问题。图深度学习近几年在深度学习领域的顶级会议ICLR中崭露头角,图机器学习是人工智能和深度学习的新蓝海。
    在这里插入图片描述

图深度学习

图神经网络的大致架构如下,可以简单的理解为输入图,通过黑箱获得想要的结果
在这里插入图片描述
图神经网络可以进行端到端的表示学习,并自动学习特征,无需人工特征工程
在这里插入图片描述
图嵌入将 N N N个复杂节点数据变为一个 N × d N×d N×d维向量,这个向量包含原始数据的语义信息
在这里插入图片描述

图深度学习难点

图深度学习的网络十分复杂,可以归结为以下三点:

  1. 任意尺寸的输入和复杂的拓扑结构
  2. 没有固定的节点顺序和参考锚点
  3. 经常是动态变化同时具有多模态特征
    在这里插入图片描述

图机器学习必备工具

图深度学习工具包:
PyG(PyTorch Geometric):官方自己的库,和PyTorch类似
GraphGym:用于设计和评估图神经网络(GNN)的平台
NetworkX:用于构建和操作复杂的图结构,提供分析图的算法
DGL:复现了近几年的顶会论文,适合进行学术研究

图数据可视化工具:AntV、Echarts、GraphXR

图数据库:Neo4j,更多见DB-Engines Ranking of Graph DBMS

图机器学习应用

图机器学习的任务类型有很多种,包括:节点、边、子图、图
在这里插入图片描述

图的计算任务

图上有各种各样的计算任务,这些任务主要分为以下几种

  • 基于节点的任务

    • 节点分类:预测节点的一个属性
      示例:对在线用户/项目进行分类
      在这里插入图片描述
  • 基于边的任务

    • 链接预测:预测两个节点之间是否存在缺失链接
      示例:推荐系统、药物联合副作用、交通预测
      在这里插入图片描述
      在这里插入图片描述
  • 基于子图的任务

    • 交通预测
      在这里插入图片描述
  • 基于图的任务

    • 图分类:对不同的图进行分类
      示例:分子特性预测

    • 图生成:药物发现(从头设计药物;现有数据库的虚拟筛选;药物再利用)、AlphaFold
      在这里插入图片描述
      在这里插入图片描述

    • 图演化:物理模拟
      在这里插入图片描述

图的商业价值

  • 图是最优质的长期资产
  • 网络效应是一个企业最深的护城河
    在这里插入图片描述

图数据挖掘项目

ReadPaper:专业的学术讨论社区,实现文献引用网络
CONNECTED PAPERS:可以展示文献引用网络
BIOS:生物医学知识图谱
刘焕勇主页
Hypercrx:展示项目关系网络图、项目活跃开发者协作网络图
OpenRank:一种基于异质网络的价值评价算法
开源项目和开源企业排行榜
Open_galaxy
红楼梦人物知识图谱

扩展阅读

AlphaFold

AlphaFold官网

AlphaFold蛋白质数据库

AlphaFold博客1

AlphaFold博客2

AlphaFold自然杂志论文

AlphaFold代码

百度文心·生物计算大模型

人工智能在药物发现和生物技术中的应用:2022年回顾与关键趋势

思考题

  • 打开你的手机,里面那些APP用到了图机器学习和图神经网络的技术?(内容个性化推荐、社交网络、银行金融)

  • A股、港股、美股市值最高的上市公司,哪些公司的核心资产是图?

  • 观看电影《社交网络》,图和图数据挖掘的商业价值体现在哪些方面?

  • 马化腾在2022年12月内部讲话提到,微信视频号是整个腾讯的希望,请从图的角度解释这句话。

  • 在你自己的研究领域,哪些数据可以用图或者网络来表示,如何进行图数据挖掘?

  • 近年来,图数据挖掘在哪些领域带来了革命性进展?

  • 图数据挖掘解决哪些基本任务?

  • 分别从图、连接、节点三个层面,举例解释图数据挖掘在生物医学方面的应用。

  • 图神经网络为什么是端到端的?为什么不需要人工做特征工程?

  • 图神经网络和其它神经网络有什么区别?

  • 简述AlphaFold的基本原理,它解决了哪些以前解决不了的问题?

  • 图机器学习和传统机器学习有什么区别和难点?

  • 图机器学习的编程工具有哪些?看看它们的官网吧(Graphgym、pyG、networkx、dgl、Pytorch、AntV、Echarts)

其它阅读材料

李笑来-惊喜与创造惊喜的方法论:https://zhuanlan.zhihu.com/p/475615463

乔布斯在斯坦福大学毕业典礼的演讲:https://www.bilibili.com/video/BV1oW411h7Ea

子豪兄1024脱口秀-乔布斯传奇:https://www.bilibili.com/video/BV1Zf4y1g78Q

哥尼斯堡七桥问题:https://zhuanlan.zhihu.com/p/519123688

2022 IDEA大会|BIOS V2正式发布,数据驱动构建超级医学知识图谱:https://mp.weixin.qq.com/s/vuHGUtWbiIH-pJ6MZaxl5Q

总结

本篇博客首先介绍了图的广泛应用场景,引出了图是描述大自然的通用语言。然而现有的机器学习和深度学习方法不能有效利用图信息进行学习,从而引出了图深度学习的基本概念和难点。图深度学习广泛的应用在我们的学习生活中,蕴含了巨大的商业价值和科研价值,同时图深度学习可以和人工智能各方向结合(大模型、多模态、可信计算、NLP、情感计算),促进其它方向的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/343797.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++中的标准输入和输出

一、 C 输入输出的含义 在C语言中我们的输入和输出都是以printf和scanf进行操作的。他们都是函数。在C中的我们的输入输出都是以终端为对象的,即从键盘输入数据,运行结果输出到显示器屏幕上。从操作系统(Linux)的角度看,每一个与主机相连的输…

RKE2部署高可用Rancher v2.7.1

先决条件 注意修改主机名,不要有冲突 第一个server节点安装 官方文档的描述感觉对于新手来说太不友好了,建议以下链接都看一下。Rancher新老文档都建议看一下,不然刚刚入门很蒙。 RKE2快速开始:https://docs.rke2.io/zh/install…

html+css综合练习一

文章目录一、小米注册页面1、要求2、案例图3、实现效果3.1、index.html3.2、style.css二、下午茶页面1、要求2、案例图3、index.html4、style.css三、法国巴黎页面1、要求2、案例图3、index.html4、style.css一、小米注册页面 1、要求 阅读下列说明、效果图,进行静…

由浅入深,聊聊OkHttp的那些事(很长,很细节)

引言 在 Android 开发的世界中,有一些组件,无论应用层技术再怎么迭代,作为基础支持,它们依然在那里。 比如当我们提到网络库时,总会下意识想到一个名字,即 OkHttp 。 尽管对于大多数开发者而言&#xff0…

spark02-内存数据分区分配原理

代码:val conf: SparkConf new SparkConf().setMaster("local[*]").setAppName("wordcount") val scnew SparkContext(conf) //[1] [2,3] [4,5] val rdd: RDD[Int] sc.makeRDD(List(1,2,3,4,5),3) //将处理的数据保存分区文件 rdd.saveAsText…

【Apifox Helper】自动生成接口文档,IDEA+Apifox懒人必备

文章目录前言🍊缘由接口文档对接爽,整理起来真费脑⏲️本文阅读时长约10分钟🥮前置条件1. IDEA开发工具2. Apifox(不必要)🎯主要目标一秒生成接口文档🍩水图IDEA中项目接结构图生成到Apifox接口文档图👨‍&…

Django框架之模板系列

模板 思考 : 网站如何向客户端返回一个漂亮的页面呢? 提示 : 漂亮的页面需要html、css、js.可以把这一堆字段串全都写到视图中, 作为HttpResponse()的参数,响应给客户端. 问题 : 视图部分代码臃肿, 耦合度高.这样定义的字符串是不会出任何效果和错误的.效果无法及时…

论文投稿指南——中文核心期刊推荐(矿业工程)

【前言】 🚀 想发论文怎么办?手把手教你论文如何投稿!那么,首先要搞懂投稿目标——论文期刊 🎄 在期刊论文的分布中,存在一种普遍现象:即对于某一特定的学科或专业来说,少数期刊所含…

springMVC概念(第一个入门案例)

目录 一、概念 1.什么是mvc? 2.mvc的工作流程? 3.什么是springMVC? 4.springMVC的特点 二、入门案例 准备工作: 正式代码例子 : 一、概念 1.什么是mvc? 答:MVC是一种软件架构的思想&a…

leaflet 上传包含shp的zip文件,在map上解析显示图形(059)

第059个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中本地上传包含shp的zip文件,利用shapefile读取shp数据,并在地图上显示图形。 直接复制下面的 vue+openlayers源代码,操作2分钟即可运行实现效果 文章目录 示例效果加载shapefile.js方式安装引用jszip(…

大数据框架之Hadoop:HDFS(四)HDFS的数据流(面试重点)

4.1HDFS写数据流程 4.1.1 剖析文件写入 HDFS写数据流程,如下图所示。 1)客户端通过 Distributed FileSystem 模块向 NameNode 请求上传文件,NameNode检查目标文件是否已存在,父目录是否存在。 2)NameNode 返回是否可…

c++函数指针进阶

c中有两种函数指针 普通函数指针成员函数指针 而对于成员函数指针,又分为两种 静态成员函数指针非静态成员函数指针 定义普通函数指针与静态函数指针的语法类似 void (*pa)(); 定义非静态成员函数指针 void (A::* pa)(); 在调用非静态成员函数时,实…

Spring循环依赖问题,Spring是如何解决循环依赖的?

文章目录一、什么是循环依赖1、代码实例2、重要信息二、源码分析1、初始化Student对Student中的ClassRoom进行Autowire操作2、Student的自动注入ClassRoom时,又对ClassRoom的初始化3、ClassRoom的初始化,又执行自动注入Student的逻辑4、Student注入Class…

8. QT_OpenGL--1. 在QtWidget中搭建OpenGL加载框架

1. 说明: 在 Qt 中使用 OpenGL,实际上时严格遵循一种代码开发框架的,在 QtWidget 中,需要使用 openGlWidget 控件,并自定义类,类中还需继承 QOpenGLWidget,QOpenGLFunctions_3_3_Core 两个类,并…

Word控件Spire.Doc 【Table】教程(14): 如何在C#中为word表格设置AutoFit选项

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转…

【沁恒WCH CH32V307V-R1的单线半双工模式串口通讯】

【沁恒WCH CH32V307V-R1的单线半双工模式串口通讯】1. 前言2. 软件配置2.1 安装MounRiver Studio3. UASRT项目测试3.1 打开UASRT工程3.2 编译项目4. 下载验证4.1 接线4.2 演示效果5. 小结1. 前言 该模块包含 3 个通用同步异步收发器(USART1/2/3)和 5 个通…

vivo 自研Jenkins资源调度系统设计与实践

作者:vivo 互联网服务器团队- Wu Qinghua 本文从目前业界实现Jenkins的高可用的实现方案,分析各方案的优缺点,引入vivo目前使用的Jenkins高可用方案,以及目前Jenkins资源的调度方案的设计实践和目前的落地运行效果。 一、前言 现…

微服务实战--高级篇:分布式事务seata

分布式事务 1.分布式事务问题 1.1.本地事务 本地事务,也就是传统的单机事务。在传统数据库事务中,必须要满足四个原则: 1.2.分布式事务 分布式事务,就是指不是在单个服务或单个数据库架构下,产生的事务&#xff0c…

PPP协议

PPP协议PPP协议概述PPP链路建立过程PPP链路接口状态机LCP报文格式LCP协商过程—正常协商(链路层协商过程)LCP协商过程—参数不匹配(链路层协商过程)LCP协商过程—参数不识别(链路层协商过程)PPP认证模式PAP…

vTESTstudio - VT System CAPL Functions - General/Trigger Function

前面文章中我们已经介绍了常用的几种板卡的基本信息,那这些板卡该如何去通过软件调用呢?带着这个问题我们开始新的一块内容 - VT系统相关的自动化控制函数介绍,我会按照不同的板卡来分类,对其可控制的函数进行介绍,方便…