SimGCL graph contrastive learning by finding homophily in heterophily

news2024/9/22 4:39:09

发表于: Knowledge and Information Systems, ccfb
推荐指数: #paper/ ⭐
总结: 重新定义了相似度矩阵, 重新定义了特征, 重新设计了节点删除概率等, 但是, 换汤不换药, 引入了大量的超参 (快 10 个了吧). 创新点不够, 所以 ccf B 期刊理所应该. (甚至我觉得更低)

文章配图

相关知识:

本地组合性:
r ( v ) = 1 Q max ⁡ ∑ g ( e g g ( v ) − a g 2 ) (1) r(v)=\frac1{Q_{\max}}\sum_g(e_{gg}(v)-a_g^2)\tag{1} r(v)=Qmax1g(egg(v)ag2)(1)
∑ h e g h = ∑ i ∈ g k i / 2 m (2) \sum_he_{gh}=\sum_{i\in g}k_i/2m\tag{2} hegh=igki/2m(2)
本地特征组合性:
r ( v ) ( f ) = 1 Q max ⁡ ∑ g ( e g g ( v ) ( f ) − a g 2 ( f ) ) , f ∈ R F (3) r(v)(f)=\frac1{Q_{\max}}\sum_g\left(e_{gg}(v)(f)-a_g^2(f)\right),f\in\mathbb{R}^{F}\tag{3} r(v)(f)=Qmax1g(egg(v)(f)ag2(f)),fRF(3)
最终,我们定义如下同配性:
r ( f ) = 1 N ∑ v ∈ V r ( v ) ( f ) (4) r(f)=\frac1N\sum_{v\in\mathcal{V}}r(v)(f)\tag{4} r(f)=N1vVr(v)(f)(4)
本地特征组合向量可以被写作:
r ^ ( v ) = [ r ( v ) ( f 1 ) , r ( v ) ( f 2 ) , … , r ( v ) ( f F ) ] , r ^ ( v ) ∈ R F , (5) \hat{r}(v)=\begin{bmatrix}r(v)(f_1),r(v)(f_2),\ldots,r(v)(f_F)\end{bmatrix}, \hat{r}(v)\in\mathbb{R}^F,\tag{5} r^(v)=[r(v)(f1),r(v)(f2),,r(v)(fF)],r^(v)RF,(5)
其中, f i f_{i} fi是特征矩阵X的列

特征/结构相似性:

S ( u , v ) = α ⋅ P S ( u , v ) + ( 1 − α ) ⋅ F S ( u , v ) (6) S(u,v)=\alpha\cdot PS(u,v)+(1-\alpha)\cdot FS(u,v)\tag{6} S(u,v)=αPS(u,v)+(1α)FS(u,v)(6)
其中, S u , v S_{u,v} Su,v代表我们提出的特征&FDP-based 节点u和v的相似性

预增强

我们设置如上相似性矩阵的阈值为: S k = S max ⁡ ⋅ k S_k=S_{\max}\cdot k Sk=Smaxk.我们使用邻接矩阵 A ∗ A^{*} A取表示预增强图.其中, A i j ∗ = 1   i f   S i j > S k A_{ij}^{*}=1\mathrm{~if~}S_{ij}>S_{k} Aij=1 if Sij>Sk A i j = 1 , A i j ∗ = 0 A_{ij}=1,A_{ij}^*=0 Aij=1,Aij=0

视图生成

基于相似性的边删除

我们根据如下概率矩阵取删除边:
P d r o p ( u , v ) = min ⁡ ( ( 1 − S ( u , v ) ) ⋅ p r , τ r ) P_{\mathrm{drop}}(u,v)=\min\left(\left(1-S(u,v)\right)\cdot p_r,\tau_r\right) Pdrop(u,v)=min((1S(u,v))pr,τr)
其中, p r p_{r} pr是超参, τ r \tau_{r} τr是干涉值阻止图崩塌.删边在 A ∗ A^* A上执行

基于本地assortativity的特征增强

由于特征在高LFA的维度重要性会降低,(即特征维度的重要性和LFA负相关),我们定义特征维度的重要性为:
w f = 1 − r ( f ) w_f=1-r(f) wf=1r(f)
其中, w f w_{f} wf的范围为[0,1]
最终,我们可以应用正则化特征掩码概率:
P m a s k ( f ) = min ⁡ ( w max ⁡ − w f w max ⁡ − w min ⁡ ⋅ p f , τ f ) P_{mask}(f)=\min\left(\frac{w_{\max}-w_f}{w_{\max}-w_{\min}}\cdot p_f,\tau_f\right) Pmask(f)=min(wmaxwminwmaxwfpf,τf)
p f p_{f} pf 是控制超参控制特征源码概率. τ f < 1 \tau_{f}<1 τf<1 是为了控制掩码概率导致太系数的特征, 我们设置为 0.7
最终, 掩码后的节点特征矩阵可以表示为:
X ~ = [ x 1 ∘ m ~ ; x 2 ∘ m ~ ; ⋯   ; x N ∘ m ~ ] \widetilde{\mathbf{X}}=[\mathbf{x}_1\circ\widetilde{\mathbf{m}};\mathbf{x}_2\circ\widetilde{\mathbf{m}};\cdots;\mathbf{x}_N\circ\widetilde{\mathbf{m}}] X =[x1m ;x2m ;;xNm ]
m ~ \tilde{m} m~ 表示节点特征掩码矩阵, 其通过贝努力分布生成.

基于相似性的负样本采样

N S R ( u ) = { v ∣ v ≠ u , v ≠ u ′ , u , v ∈ V 1 ∪ V 2 } \mathrm{NSR}(u)=\{v\mid v\neq u,v\neq u',u,v\in V_1\cup V_2\} NSR(u)={vv=u,v=u,u,vV1V2}
其中, u 是目标/锚节点, u’是 u 在另外一个视图的置信节点. V i V_{i} Vi 表示第 i 个视图.
N S ( u ) = { v ∣ S ( u , v ) < ξ , v ∈ N S R ( u ) } \mathrm{NS}(u)=\{v\mid S(u,v)<\xi,v\in\mathrm{NSR}(u)\} NS(u)={vS(u,v)<ξ,vNSR(u)}
ξ \xi ξ 是控制负样本集的超参

损失函数

最终, 损失函数为:
ℓ ( u i , v i ) = log ⁡ e θ ( u i , v i ) / τ e θ ( u i , v i ) / τ + ∑ v k ∈ N S ( u i ) e θ ( u i , v k ) / τ \ell(\mathbf{u}_i,\mathbf{v}_i)=\log\frac{e^{\theta(\mathbf{u}_i,\mathbf{v}_i)/\tau}}{e^{\theta(\mathbf{u}_i,\mathbf{v}_i)/\tau}+\sum_{v_k\in NS(u_i)}e^{\theta(\mathbf{u}_i,\mathbf{v}_k)/\tau}} (ui,vi)=logeθ(ui,vi)/τ+vkNS(ui)eθ(ui,vk)/τeθ(ui,vi)/τ
u i u_{i} ui 是 anchor 节点. J = 1 2 N ∑ i = 1 N [ ℓ ( u i , v i ) + ℓ ( v i , u i ) ] . \mathcal{J}=\frac1{2N}\sum_{i=1}^N\Big[\ell(\mathbf{u}_i,\mathbf{v}_i)+\ell(\mathbf{v}_i,\mathbf{u}_i)\Big]. J=2N1i=1N[(ui,vi)+(vi,ui)].

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1972457.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

详细教程 MySQL 数据库 下载 安装 连接 环境配置 全面

数据库就是储存和管理数据的仓库&#xff0c;对数据进行增删改查操作&#xff0c;其本质是一个软件。 首先数据有两种&#xff0c;一种是关系型数据库&#xff0c;另一种是非关系型数据库。 关系型数据库是以表的形式来存储数据&#xff0c;表和表之间可以有很多复杂的关系&a…

通俗易懂玩Qt:时间滑动选择器实现(内附主要源码)

时间滑动选择器实现 组件说明&#xff1a; 本组件命名为时间滑动选择器&#xff0c;主要运用于 arm 平台下的触摸屏上&#xff0c;虽然 QT 自带有时间选择组件&#xff0c;但是对触摸屏的使用并不友好&#xff0c;为了提升项目界面的交互性&#xff0c;于是就有了时间滑动选择器…

【深海王国】初中生也能画的电路板?番外1:Arduino其他家族成员的拓展板开发(1)

Hi~ (o^^o)♪, 各位深海王国的同志们&#xff0c;早上下午晚上凌晨好呀~ 辛苦工作的你今天也辛苦啦(/≧ω) 今天大都督为大家带来电路板的番外系列——初中生也能画的电路板&#xff1f;番外1&#xff1a;Arduino其他家族成员的拓展板开发&#xff0c;带你给其他Arduino家族成…

数据库漫游记:表、视图、函数、存储过程及触发器之跨平台兼容性分析(上)

先言之 &#x1f31f;余撰此文&#xff0c;乃为导引初窥数据库之学人&#xff0c;俾其明了表、视图、函数、存储过程及触发器之义理&#xff0c;及其于诸般平台之上创建、修改与废弃之法式。盖初学之人&#xff0c;常陷于迷雾之中&#xff0c;难辨东西&#xff0c;故须详述而明…

lombok使用@slf4j 运行时提示找不到符号log(Missing POM for org.projectors:lombok:jar)

1.问题表现 原本是之前搭建好的工程&#xff0c;只是换了个开发环境重新启动就不行了。一直编译不通过&#xff01; 可以看到IDEA其实是引入了依赖的 都没有出现红色波浪线 <mapstruct.version>1.5.5.Final</mapstruct.version> <lombok.version>1.18.30<…

鸿蒙(API 12 Beta2版)NDK开发【JSVM-API使用规范】

JSVM-API使用规范 生命周期管理 【规则】 合理使用OH_JSVM_OpenHandleScope和OH_JSVM_CloseHandleScope管理JSVM_Value的生命周期&#xff0c;做到生命周期最小化&#xff0c;避免发生内存泄漏问题。 每个JSVM_Value属于特定的HandleScope&#xff0c;HandleScope通过OH_JSV…

【Python实战因果推断】71_图因果模型6

目录 Positivity Assumption An Identification Example with Data Confounding Bias Positivity Assumption 调整公式同样强调了正则性&#xff08;positivity&#xff09;的重要性。因为你正在对治疗和结果之间的差异在X的条件下求平均&#xff0c;你必须确保对于所有X的…

【32单片机篇】项目:WIFI天气预报

一、项目需求 使用 ESP8266 通过 HTTP 获取天气数据&#xff08;心知天气&#xff09;&#xff0c;并显示在 OLED 屏幕上。 按键 1 &#xff1a;循环切换今天/明天/后天天气数据&#xff1b; 按键 2 &#xff1a;更新天气 二、项目框图 三、硬件部分 四、项目源码及实现 1.项…

MySQL是怎样运行的——第1章 初识MySQL

文章目录 1. 1 MySQL的客户端/服务器架构1.2 安装MySQL&#xff08;略&#xff09;1.3 启动MySQL服务器程序1.4 启动MySQL客户端程序1.5 客户端与服务器连接的过程1.6 服务器处理客户端请求 1. 1 MySQL的客户端/服务器架构 MySQL的运行过程就是C/S架构。多个客户端程序连接到服…

洛谷 P1868 饥饿的奶牛

原题 题目描述 有一条奶牛冲出了围栏&#xff0c;来到了一处圣地&#xff08;对于奶牛来说&#xff09;&#xff0c;上面用牛语写着一段文字。 现用汉语翻译为&#xff1a; 有 N 个区间&#xff0c;每个区间x,y 表示提供的x∼y 共y−x1 堆优质牧草。你可以选择任意区间但不…

dockerfile定制镜像 docker-compose编排容器

1 dockerfile dockerfile本质上是利用了Linux系统的挂载&#xff08;UnionFS&#xff09;&#xff0c;将多个目录挂载到同一目录下&#xff0c;实现镜像的层叠式结构&#xff0c;从而实现功能聚合。 1.1 一个最简单的程序 package mainimport "fmt"func main() {f…

【leetcode详解】覆盖所有点的最少矩形数目(C++思路详解)

思路详解&#xff1a; 0. 题目情境并未限制矩形高度&#xff0c;故矩形数目的判断只和点的横坐标有关 1. 为了不重不漏地考虑到所有点&#xff0c;故笔者选择首先将二维数组中的点按横坐标的大小排序 //说明&#xff1a;本来笔者以为需要自定义sort排序&#xff0c;后来发现…

智慧水务项目(三)django(drf)+angular 18 创建系统管理的用户、角色、部门、权限管理等model

一、说明 添加各model 添加requirement.txt中的库 添加env.py中的动态配置 二、env.py全文 import os from smartwater.settings import BASE_DIR# # # ************** mysql数据库 配置 ************** # # # # 数据库地址 DATABASE_ENGINE "django.db.backends.…

SQL查询注意事项

判断字符串长度要用函数CHAR_LENGTH(str)&#xff0c;他会返回字符串的长度&#xff0c;如果使用length(str)函数&#xff0c;在对中文字符或特殊字符时&#xff0c;返回的是在当前编码下该字符的字节数。如在mysql中的utf-8编码情况下&#xff0c;length(&#xffe5;)返回结果…

ASUS/华硕幻14 2021 GA401Q系列 原厂win10系统 工厂文件 带F12 ASUS Recovery恢复

华硕工厂文件恢复系统 &#xff0c;安装结束后带隐藏分区&#xff0c;一键恢复&#xff0c;以及机器所有驱动软件。 系统版本&#xff1a;windows10 原厂系统下载网址&#xff1a;http://www.bioxt.cn 需准备一个20G以上u盘进行恢复 请注意&#xff1a;仅支持以上型号专用…

《最新出炉》系列初窥篇-Python+Playwright自动化测试-62 - 判断元素是否可操作

软件测试微信群&#xff1a;https://bbs.csdn.net/topics/618423372 有兴趣的可以扫码加入 1.简介 有些页面元素的生命周期如同流星一闪&#xff0c;昙花一现。我们也不知道这个元素在没在页面中出现过&#xff0c;为了捕获这一美好瞬间&#xff0c;让其成为永恒。我们就来判…

HiFi桌搭的新选择,更符合发烧友使用习惯的飞傲K19

飞傲的便携设备很多人都用过&#xff0c;性价比很高&#xff0c;设计也很精致&#xff0c;并且功能上针对不同的需求也有丰富的选择&#xff0c;而在针对耳机的台式设备方面&#xff0c;飞傲同样非常有实力&#xff0c;我最近用了一款飞傲K19&#xff0c;这台设备不仅功能完备&…

ZYNQ SDK/Vitis undefined reference to `sin‘ wave.c

问题 ZYNQ SDK或者VItis在使用到sin函数时编译报错&#xff1a; undefined reference to sin wave.c问题解决&#xff1a; 右键点开C/C Build Settings 选项 在Settings 选项的Libraries 添加 m&#xff0c;点击OK

用Java手写jvm之模拟运行时数据区的虚拟机栈,局部变量表,操作数栈等

写在前面 下图是jvm的运行时数据区内存图&#xff1a; &#xff0c;本文要模拟的是虚拟机栈的相关内存结构的交互过程。 1&#xff1a;正文 因为我们这里模拟的是线程执行方法调用的过程&#xff0c;所以这里先来定义一个线程对象&#xff1a; public class Thread {// 程…