【图神经网络】在节点分类任务中无特征节点的特征表示

news2024/11/15 13:36:20

无特征节点的特征表示

节点度数degree

pagerank

以pagerank起源的应用场景为例,不是所有的网站都是同等重要的,所以需要根据结构信息对节点进行排序。

直觉上,如果一个网站它有很多链接,它就很重要,举例来说,一个网站有很多射入链接,那么,它比一个只有一个射入链接的网站重要,但是对于射入网站的网站的重要性也是不同的。

一个重要网址的给到的vote分值是很高的,链接的vote值正比于它的来源网站的重要性,如果一个网址i有重要性 r i r_i ri d i d_i di个out-links,每一个链接有 r i d i \frac{r_i}{d_i} dirivote值。网址j的重要性 r j r_j rj是所有in-links的vote值的加和。
r j = ∑ i → j r i d i r_j = \sum_{i \rightarrow j} \frac{r_i}{d_i} rj=ijdiri

矩阵化

下面将这个过程矩阵化,首先是概率邻接矩阵M
M i j = 1 d j M_{ij} = \frac{1}{d_j} Mij=dj1
每个值就代表节点j传递给节点i的vote值,也就是M的每一列的加和为1
rank向量
r i r_i ri是网址i的重要性,满足 ∑ i r i = 1 \sum_i r_i = 1 iri=1
流程就可以表达为:
r = M ⋅ r r=M\cdot r r=Mr
可以看到,r是矩阵M特征值1的特征向量,怎么解决呢?
用方法power iteration
Power Iteration:
Set r j ← 1 / N r_j \leftarrow 1/N rj1/N
1: r j ′ = ∑ i → j r i d i r'_j = \sum_{i \rightarrow j} \frac{r_i}{d_i} rj=ijdiri
2: If ∣ r − r ′ ∣ > ϵ |r-r'|>\epsilon rr>ϵ
r ← r ′ r \leftarrow r' rr
3: goto 1
但是存在两个问题
在这里插入图片描述
在这里插入图片描述
所以需要修改
β \beta β概率,按照链接传递vote值,有 1 − β 1-\beta 1β的概率随机跳转到一个节点,这样就解决了上面两个问题。
r j = ∑ i → j β r i d i + ( 1 − β ) 1 N r_j = \sum_{i \rightarrow j}\beta \frac{r_i}{d_i} + (1-\beta)\frac{1}{N} rj=ijβdiri+(1β)N1
用矩阵表示为
P = β M + ( 1 − β ) [ 1 N ] N × N P=\beta M + (1-\beta)\left[\frac{1}{N}\right]_{N\times N} P=βM+(1β)[N1]N×N

motifs

子图
有两种1.由节点得到的子图.(node induced subgraph)2.由边得到的子图(edge induced subgraph)
图同构
在这里插入图片描述
子图同构
当G1的子图和G2同构,也可以说G1对G2子图同构。
无论是判断图同构还是子图同构都是一个np难问题。
motif定义
是满足三类性质的子图
1:pattern:是(node induced)小型子图
2:Recurring:有一个高的频率
3:Significant:比期望的频率高,也就是说比随机生成的图中motif频率高
子图频率
图级别的频率
在这里插入图片描述
节点级别的频率(通过anchor点)
在这里插入图片描述
motif significance
子图在图中比随机图中出现频率更高,那么就说这个子图是功能重要性。
生成随机图的方法
1 ER随机图
生成n个节点,每两个节点有p的概率相连
2 Confifuration model
在这里插入图片描述
spokes的替换方法switching
在这里插入图片描述
算法步骤
1 数出图中的motifs的数量
2 生成随机图,并数随即图中的motif数量
3 用统计方法评估每个motif的重要性(用Z-score)
在这里插入图片描述
在这里插入图片描述
来自相同领域的网络有相似的SP
在这里插入图片描述
神经子图表示
用GNN解决子图匹配
在这里插入图片描述
将子图投射到有序空间中,判断是否有子图关系
在这里插入图片描述
在这里插入图片描述
损失函数
在这里插入图片描述
用广度优先搜索得到正样本,对正样本进行corrupt(增加节点、删除节点或边)得到负样本
SPMiner
用于求motif频率
在这里插入图片描述
在这里插入图片描述
搜索过程
1 随机选择一个点初始化
在这里插入图片描述
2 每次生成节点都选择能让motif数量最多的节点(greedy)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1325125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023 年 5 大网络攻击

您是否知道 2023 年全球数据泄露的平均损失为 445 万美元?数量不只是数字;它反映了网络威胁对全球经济的深层次影响。他们强调了一个严峻的事实:没有任何实体能够幸免,甚至政府也不能幸免。 在前所未有的技术飞跃中,2023 年网络威…

听GPT 讲Rust源代码--src/tools(16)

File: rust/src/tools/rust-analyzer/crates/ide-completion/src/completions/use_.rs rust-analyzer是一个基于Rust语言的IntelliSense引擎,用于提供IDE自动补全、代码导航和其他代码编辑功能。在rust-analyzer的源代码中,rust/src/tools/rust-analyzer…

用户管理第2节课-idea 2023.2 后端--删除表,从零开始

一、鱼皮清空model文件夹下 二、鱼皮清空mapper文件夹下 三、删除 test 测试类下的部分代码 3.1删除SampleTest 3.2删除部分代码 UserCenterApplicationTests

加密后的数据该如何支持模糊查询

加密后的数据该如何支持模糊查询 在日常工作中,我们经常会有一些模糊查询的条件,比如说按照手机号模糊查询,或者是身份证号码。正常情况下我们可以使用 select * from user where mobile like %123% 来模糊查询,但是这种方式是…

〖大前端 - 基础入门三大核心之JS篇(58)〗- 面向对象案例

说明:该文属于 大前端全栈架构白宝书专栏,目前阶段免费,如需要项目实战或者是体系化资源,文末名片加V!作者:哈哥撩编程,十余年工作经验, 从事过全栈研发、产品经理等工作,目前在公司…

【深度学习】序列生成模型(五):评价方法计算实例:计算BLEU-N得分【理论到程序】

文章目录 一、BLEU-N得分(Bilingual Evaluation Understudy)1. 定义2. 计算N1N2BLEU-N 得分 3. 程序 给定一个生成序列“The cat sat on the mat”和两个参考序列“The cat is on the mat”“The bird sat on the bush”分别计算BLEU-N和ROUGE-N得分(N1或…

uniapp运行到手机模拟器

第一步,下载MUMU模拟器 下载地址:MuMu模拟器官网_安卓12模拟器_网易手游模拟器 (163.com) 第二步,运行mumu模拟器 第三步,运行mumu多开器 第三步,查看abs 端口 第四步,打开HBuilder,如下图,将…

探索 Vuex 的世界:状态管理的新视角(下)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

大模型赋能“AI+电商”,景联文科技提供高质量电商场景数据

据新闻报道,阿里巴巴旗下淘天集团和国际数字商业集团都已建立完整的AI团队。 淘天集团已经推出模特图智能生成、官方客服机器人、万相台无界版等AI工具,训练出了自己的大模型产品 “星辰”; 阿里国际商业集团已成立AI Business,…

亚马逊云科技-如何缩容/减小您的AWS EC2根卷大小-简明教程

一、背景 Amazon EBS提供了块级存储卷以用于 EC2 实例,EBS具备弹性的特点,可以动态的增加容量、更改卷类型以及修改预配置的IOPS值。但是EBS不能动态的减少容量,在实际使用中,用户也许会存在此类场景: 在创建AWS EC2…

mac电脑安装虚拟机教程

1、准备一台虚拟机,安装CentOS7 常用的虚拟化软件有两种: VirtualBoxVMware 这里我们使用VirtualBox来安装虚拟机,下载地址:Downloads – Oracle VM VirtualBox 001 点击安装 002 报错:he installer has detected an…

Linux shell编程学习笔记37:readarray命令和mapfile命令

目录 0 前言1 readarray命令的格式和功能 1.1 命令格式1.2 命令功能1.3 注意事项2 命令应用实例 2.1 从标准输入读取数据时不指定数组名,则数据会保存到MAPFILE数组中2.2 从标准输入读取数据并存储到指定的数组2.3 使用 -O 选项指定起始下标2.4 用-n指定有效行数…

【Filament】绘制圆形

1 前言 Filament环境搭建中介绍了 Filament 的 Windows 和 Android 环境搭,绘制三角形中介绍了绘制纯色和彩色三角形,绘制矩形中介绍了绘制纯色和彩色矩形,本文将使用 Filament 绘制圆形。 2 绘制圆形 本文项目结构如下,完整代码…

Apache Flink(十七):Flink On Standalone任务提交-Standalone Application模式

🏡 个人主页:IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客 🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。 🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频 目录

从零开始的神经网络

先决条件 在本文中,我将解释如何通过实现前向和后向传递(反向传播)来构建基本的深度神经网络。这需要一些关于神经网络功能的具体知识。 了解线性代数的基础知识也很重要,这样才能理解我为什么要在本文中执行某些运算。我最好的…

【FLV】文件解析源码分析:视频解析为可解码的nalu单元

https flv 拉到的数据是flv宏观看 : 每一部分都是 A+ Prev 的模式 A 可以是header :9个字节可以是TAG :大小可变而每个TAG 都有个固定的部分: TAG HEADER ,大小9个字节 ,里面是类型、大小、时间戳、扩展时间戳、流ID 因此,可以直接去掉9+4 个字节的第一部分:FLV HEADER…

凯斯西储大学轴承数据解读

文章目录 一、凯斯西储大学轴承数据基础知识?1.1 故障种类1.2 故障点尺寸(单点故障)1.3 载荷和转速 二、数据解读2.1 文件2.2 以12k Drive End Bearing Fault Data为例2.3 以(0.007,inner race)为例。 3 Normal Baseli…

vivado 关于时钟

关于时钟 在数字设计中,时钟代表了从寄存器可靠传输数据的时间基准注册。AMD Vivado™集成设计环境(IDE)计时引擎使用时钟计算时序路径要求并通过以下方式报告设计时序裕度的特性松弛计算的方法有关更多信息,请参阅Vivado Design…

杰发科技AC7840——在Eclipse环境下使用Jlink调试

序 杰发给的代码里面已经做代码相关配置,搭建好eclipse环境即可运行,搭建步骤还是比较简单的。 参考文章 如何使用Eclipse搭配JLink来调试HelloWold应用程序?-电子发烧友网 软件链接 杰发科技Eclipse的sample代码里面的doc文章&#xff…

C# .Net学习笔记—— Expression 表达式目录树

一、什么是表达式目录树 (1)Expression我们称为是表达式树,是一种数据结构体,用于存储需要计算,运算的一种结构,这种结构可以只是存储,而不进行运算。通常表达式目录树是配合Lambda一起来使用的…