【CS224图机器学习】task1 图机器学习导论

news2025/3/9 10:07:12

前言:本期学习是由datawhale(公众号)组织,由子豪兄讲解的202302期CS224图机器学习的学习笔记。本次学习主要针对图机器学习导论做学习总结。

1.什么是图机器学习?

通过图这种数据结构,对跨模态数据进行整理。可以实现预测结点、预测结点间关系、将图关系提出去成D维向量或生成子图的一种算法。

2.为什么要用图机器学习

图机器学习是解决跨模态数据间利用数据间关系进行挖掘的算法,而不是像cv、传统机器学习这样算法是针对个体进行学习的算法。有了图机器学习的研究可以掌握数据之间的关系,可以对关系进行预测及提炼。图机器学习的方法在很多领域已经有不错的应用,例如理疗知识图谱、物理建模粒子效果模拟、蛋白质结构预测。因此图网络的论文也是近年来的热点。

3.图神经网络的特点是什么?

对于图来说:

网络是复杂的。有任意尺寸的输入,同时有着复杂的拓扑结构。没有固定的结点顺序及参考锚点。图在动态变化,而且拥有多模态的特点。

对于网络来说:

输入:图(网络)

输出:结点标签、新链接、D维向量、生成图与子图

特点:端到端的表示学习

注意:这里的D维向量生成后可以理解为是二维数据,可以在此之上进行机器学习方法进行分类或预测。例如将银行客户数据采集到,进行预测客户是否会逾期。

4.本次学习的整体课程大纲

本次学习的课程是斯坦福大学的CS224W,主讲老师是Jure Leskovec (我觉得他好帅啊……而且感觉好年轻)

学习大纲如下:

①畅通机器学习方法

②node embedding方法(图嵌入方法)

GNN相关方法

④知识图谱推理

⑤子图

⑥图生成

学习中会用的库:

pyG、GraphG(都是jl老师做的)、NetworkX(比较简洁的图相关库,瑞士军刀)、DGL(沐神推荐的~亚马逊在做,里面有很多复现好的论文算法)

图数据存储数据库:Neo4j

5.图神经网络有哪些应用?

①节点层次:信用卡欺诈

②链接层面:推荐可能认识的人

③社群层:将用户聚类,挖掘相似群体

④图层次:生成新的子图,导航、铁路建设规划

⑤图生成:深化输入图的发展,完善输入数据

在节点层中一般有已知推未知包括短视频的推荐算法,这里子豪兄举例可以做药物融合后副作用预测,效果还不错。

子图层上的应用也很多,有导航、药物设计、物理粒子效果模拟,这里面最伟大的一个项目是预测蛋白质空间结构。这个研究推动了治疗癌症药物的发展,只需要输入蛋白质序列就可以输出预测的图结构,效果斐然。真厉害!

子豪兄还介绍了一些日常用得到的图相关应用:ReadPaper-论文阅读平台-专业学术讨论社区、Connected Papers | Find and explore academic papers 可以生成自己跌论文引用网络。 还有深圳政府做的bios医疗图谱Biomedical Informatics Ontology System | BIOS@IDEA。最后推荐了一名大牛老师:刘焕勇-个人主页 (liuhuanyong.github.io)。大佬对图的研究颇有建树。

图是最优质的长期资产,
网络效应是一个企业最深的护城河。

6.图的基本表示:

6.1 图基本结构

6.2 本体图

针对解决的问题设计图的结点类型。

如果结点类型等于2图叫二分图。二分图中分为u v 两类结点,可以单独列出一类做单类分析。

如果结点类型大于2的图叫异质图

6.3 图的各种知识点

图的边没有方向叫无向图

图的边带方向叫有向图

下图为连接数的计算方法。

自连接图多边图

有权图无权图

6.4 图的计算机表示

邻接矩阵

针对数据量比较丰富的图,可以用邻接矩阵的方法表示。

一般无向图是对称矩阵,有向图是非对称矩阵。当存在自连接情况对角线数据为1

下图为连接总数的计算。

对于大数据表示的图时会发现表现为稀疏矩阵,很多都为0.

采用连接列表只表示边的列表去表示图。

邻接列表 以节点的方式表示整个图。

6.5 图的连通性

所有点都连通叫连通图。连通子图叫连通域

任意两点可以相互触达是强连接图

强连通子图叫强连通域SCC

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/345510.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

增减序列(差分)

分析:要想把整个数组变为同一个数,我们可以根据差分的思想来做。 差分定义:b[1]a[1] b[2]a[2]-a[1] ...... b[i]a[i]-a[i-1] 由定义可知,可以把b[2]~b[n]全部变为0,那么整个数组就一样了。现在问题转换为如何用最少的…

Seata-Server分布式事务原理加源码 (八) - Seata-XA模式

Seata-XA模式 Seata 1.2.0 版本重磅发布新的事务模式:XA 模式,实现对 XA 协议的支持。 我们从三个方面来深入分析: XA模式是什么?为什么支持XA?XA模式如何实现的,以及如何使用? XA模式 首先…

shell学习1

目录 一、echo 1.1 echo 1.2 打印彩色文本 1.3 打印彩色背景 二、printf 三、变量和环境变量 3.1 查看某个进程的环境变量 3.2给变量赋值。varvalue 3.3 给环境变量赋值 3.4 获取变量的长度 3.5 识别当前所使用的shell 3.6 检查是否为超级用户 四、数学运算 4.1 …

PHP新特性集合

php8新特性命名参数function foo(string $a, string $b, ?string $c null, ?string $d null) { /* … */ }你可以通过下面的方式传入参数进行调用foo(b: value b, a: value a, d: value d, );联合类型php7class Number {/** var int|float */private $number;/*** param f…

Vue|事件处理

事件处理1. 事件使用1.1 事件绑定1.2 事件参数2. 事件修饰符2.1 阻止默认事件2.2 阻止事件冒泡2.3 事件只允许触发一次2.4 事件捕获2.5 操作当前元素2.6 行为立即执行无需等待回调3. 键盘事件4. 本章小结4.1 事件使用小结4.2 事件修饰符小结4.3 键盘事件小结1. 事件使用 1.1 事…

C++STL剖析(八)—— unordered_set和unordered_multiset的概念和使用

文章目录前言1. unordered_set的介绍和使用🍑 unordered_set的构造🍑 unordered_set的使用🍅 insert🍅 find🍅 erase🍅 size🍅 empty🍅 clear🍅 swap🍅 count…

安全多方计算系列笔记1——前世今生

这一系列笔记参考了绿盟科技研究通讯的安全多方计算文章,及其他。 首先看定义:在不泄露参与方原始输入数据的前提下,允许分布式参与方合作计算任意函数,输出准确的计算结果。 起源 安全多方计算问题及解首先由姚期智&#xff08…

用大白话给你科普,到底什么是 API(应用程序编程接口)?

何为API?如果你在百度百科上搜索,你会得到如下结果:API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组…

Linux 安装Python3

python3 下载地址 python3 下载地址 https://www.python.org/downloads/ 选择自己需要的版本、 此文中选择3.10.9 下载源码压缩包 可下载到本地后上传至Linux服务器也可以复制下载地址 wget https://www.python.org/ftp/python/3.10.9/Python-3.10.9.tgzpython3 安装 yum…

python练习——简化路径

项目场景: 给你一个字符串 path ,表示指向某一文件或目录的 Unix 风格 绝对路径 (以 /开头),请你将其转化为更加简洁的规范路径。在 Unix 风格的文件系统中,一个点(.)表示当前目录本…

新库上线 | CnOpenData中国地方政府债券信息数据

中国地方政府债券信息数据 一、数据简介 地方政府债券 指某一国家中有财政收入的地方政府地方公共机构发行的债券。地方政府债券一般用于交通、通讯、住宅、教育、医院和污水处理系统等地方性公共设施的建设。地方政府债券一般也是以当地政府的税收能力作为还本付息的担保。地…

【电源专题】案例:用电子负载模拟电池测试充电芯片

最近在做有关充电芯片的选型,所以需要测试充电芯片中的很多参数。如涓流充电电流、快速充电电流、截止电流等等。 如下所示为某充电IC充电过程中的电流电压变化曲线。可以看出其中存在多个电流如Ishort/Iterm/Iprechg/Ichgerg等等。电压点也有Vshortz/Vbatlow/Vbatreg等。这些…

VTK- vtkStripper

前言:本博文主要研究接口vtkStripper的实现原理及主要的应用场景,希望对各位小伙伴有所帮助。 描述:vtkStripper是一个过滤器,用于从输入多边形、三角形带和线中生成三角形带和/或折线。输入多边形仅当它们是三角形时才被组装成三…

【Linux】-- 进程信号(处理、内核)

上篇:【Linux】-- 进程信号(认识、应用)_川入的博客-CSDN博客 目录 信号其他相关常见概念 pending handler block 信号处理的过程 sigset_t sigset_t使用 系统接口 sigpending sigprocmask 捕捉方法 sigaction struct sigactio …

小白入门模拟IC设计,如何快速学习?

众所周知,模拟电路很难学。以最普遍的晶体管来说,我们分析它的时候必须首先分析直流偏置,其次在分析交流输出电压。可以说,确定工作点就是一项相当麻烦的工作(实际中来说),晶体管的参数多、参数…

JavaScript 计时事件

JavaScript 计时事件 通过使用 JavaScript,我们有能力做到在一个设定的时间间隔之后来执行代码,而不是在函数被调用后立即执行。我们称之为计时事件。 在 JavaScript 中使用计时事件是很容易的,两个关键方法是: setInterval() - 间隔指定的…

【CNN记录】tensorflow中depth_to_space

功能把depth维的数据移到space上,与spacetodepth刚好是相反的操作,depth对应channel,space对应height和width,而该操作是把depth上的数据分给height和width上,所以对应有一个参数block_size,要求原tensor的…

CSDN竞赛28期参赛体验

1、小Q的鲜榨柠檬汁 1、题目名称:小Q的鲜榨柠檬汁 团建活动是大家所想要的。 小Q给大家准备了鲜橙汁。 现在有n个朋友买回了k瓶饮料,每瓶有l毫升的饮料,同时还买回 了c个柠檬, 每个柠檬可以切成d片,p克盐。 已知每个朋…

Python基础学习笔记 —— 数据结构与算法

数据结构与算法1 数据结构基础1.1 数组1.2 链表1.3 队列1.4 栈1.5 二叉树2 排序算法2.1 冒泡排序2.2 快速排序2.3 (简单)选择排序2.4 堆排序2.5 (直接)插入排序3 查找3.1 二分查找1 数据结构基础 本章所需相关基础知识&#xff1a…

第七届蓝桥杯省赛——1有奖猜谜

题目: 小明很喜欢猜谜语。 最近,他被邀请参加了X星球的猜谜活动。 每位选手开始的时候都被发给777个电子币。 规则是:猜对了,手里的电子币数目翻倍, 猜错了,扣除555个电子币, 扣完为止。 小明一共猜了15…