【阅读笔记】Semi-supervised Domain Adaptation in Graph Transfer Learning

news2024/12/1 0:35:20

Background

真实世界的图上节点的标签数据是很难拿到的。
因此图转移学习被提出将知识从标记的源图转移出来,以帮助预测域变化的目标图中节点的标签。

尽管图迁移学习算法取得了重大进展,但它们通常假定源图中的所有节点都被标记出来了。
因此文章定义了半监督域自适应框架来进行图上的节点分类。
在这里插入图片描述
半监督域自适应面临2个挑战:

  1. 如何克服跨域带来的域转移问题,学习图的域不变信息来进行预测?
  2. 如何缓解标签稀疏的问题

Contributions

  1. 为了解决第一个挑战,文章提出在原图编码的时候加入 shift parameter ,并且提出一个对抗迁移模块去学习域不变节点表征
  2. 为了缓解标签稀疏,提出一个伪标签方法,使用后验评分来监督未标记节点的训练,提高了模型对目标图的鉴别能力。
  3. 实验效果好

Related Works

domain adaptation:

基于距离的方法:
基于距离的方法显式地计算源域和目标域之间的分布距离,并在嵌入空间中最小化它们。

基于对抗学习的方法:
通常在隐藏嵌入之上训练一个域鉴别器,并试图以隐式的方式融合它进行域对齐

Graph Transfer Learning:
大多数工作在图学习上建立了类似于那些在图像上的方法,而没有考虑图的复杂结构或显式地利用图的拓扑信息。

Semi-supervised Learning on Graphs.
针对节点分类,即图上只有少数节点有标签

Problem definition

源域(少量标签、目标域(没有标签 他们在数据分布上有明显的不同,但是共享相同的标签空间。
文章的目的是学习一个模型,在部分标记的源图的帮助下,准确地预测目标图中的节点类。

Methodology

在这里插入图片描述

  • Node embedding generalization:探索两个图中的高阶结构化信息来学习广义节点表示。
  • Adversarial transformation:在源图中引入了自适应分布的位移参数,并对一个域鉴别器以对抗性的方式进行训练。
  • Pseudo-labeling with Posterior Scores :解决标签稀疏问题。

Node embedding generalization

  1. 计算节点之间的 Positive Pointwise Mutual Information (PPMI)来探索高阶无标签图拓扑信息,并且使用图卷积网络去编码节点到泛化的低维空间。 【PPMI是一种用于衡量两个事件之间关联程度的统计量。它通常用于自然语言处理和信息检索领域
  2. 根据PPMI这个指标获得一个矩阵 P P P, P i , j P_{i,j} Pi,j代表节点i与j之间的相关性。
    在这里插入图片描述在这里插入图片描述

Adversarial Transformation via Shifting

领域自适应的一般学习目标是训练一个特征编码器来消除分布。
通常,域自适应的一般学习目标是训练一个特征编码器来消除源域与目标域之间的分布差异 ,生成在两个域上分布相似的embedding。

通过在输入空间上添加可训练参数(如扰动)来执行迁移已被证明在将一个分布转移到另一个分布方面是有效的。
文章提出了一个对抗变换模块,其目的是在源图上添加移位参数来修改其分布,并使用对抗学习来训练 graph encoder和shift parameters,以对齐跨域分布。

其中optimization objective定义为:
在这里插入图片描述
D d D_{d} Dd是一个域鉴别器,用于鉴别输入的节点embedding属于目标域还是源域;
具有shift parameters的编码器则生成难以区分的源节点嵌入,最后产生域不变节点嵌入。

Pseudo-Labeling with Posterior Scores

而在有监督情况下,由于标签比较少,所以容易导致过拟合。
特别是,在没有任何监督的情况下,目标图中分布在边界附近、远离其对应类的簇的质心的节点很容易被误分类。
文章提出了一种新的基于节点后验评分的伪标记策略,以提高对未标记节点的预测精度。
具体步骤:
在每次训练中,更新源域与目标域中原始无标签节点的伪标签;
文章假设节点靠近它们的伪标签聚类的结构质心则更容易被分类成功,文章将这种节点的伪标签视为更高质量的自监督信号,旨在提高这些节点embedding的识别能力。
因此,文章引入一个后验得分来定义ni如何接近其重构邻接矩阵P上的伪标签簇的结构质心:
从属于类X的节点到节点 n j n_{j} nj的互信息(变量间相互依赖性的量度),
文章中认为如果一个节点拥有的伪标签X与其他真实标签为X的节点的互信息值大,那么可以认为该节点的是接近类X的质心的,且 w i w_{i} wi值也会变大。
在这里插入图片描述
伪标签的损失函数如下所示:
在这里插入图片描述
最终的loss function:
在这里插入图片描述

Experiment

数据集:
在这里插入图片描述

在这里插入图片描述

conclusion:

  • 提出了一个新的图半监督域适应研究问题
  • 提出了一种称为SGDA的方法,它使用shift parameters和对抗性学习来实现模型迁移。
  • 此外,SGDA还使用带有自适应后验分数的伪标签来缓解标签稀疏的问题
读后感

框架图看了3遍没看懂什么意思,只知道会产生三种loss
感觉伪标签这块解释的有点绕,涉及到很多指标计算或者处理细节;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1348090.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#调用(python通过excel坐标生成的曲面地形图)案例

效果图: 文件图: 详解一:环境和python库问题 1.python 中只需要下载 matplotlib3.8.2和scipy1.11.4 2.我安装的python版本 详解二:解释器问题 python解释器这里有两种形式 第一种形式 1.调用 pycharm项目下的解释器,需要安装python必须的包(命令安装或者搜索安装)。 2.修改…

2022年全球软件质量效能大会(QECon上海站)-核心PPT资料下载

一、峰会简介 近年来,以云计算、移动互联网、物联网、工业互联网、人工智能、大数据及区块链等新一代信息技术构建的智能化应用和产品出现爆发式增长,突破了对于软件形态的传统认知,正以各种展现方式诠释着对新型智能软件的定义。这也使得对…

【华为机试】2023年真题B卷(python)-猴子爬山

一、题目 题目描述: 一天一只顽猴想去从山脚爬到山顶,途中经过一个有个N个台阶的阶梯,但是这猴子有一个习惯: 每一次只能跳1步或跳3步,试问猴子通过这个阶梯有多少种不同的跳跃方式? 二、输入输出 输入描述…

SpringCloud-高级篇(九)

(1)Seata高可用 我们学习了Seata的各种用法了,Seata的服务是单节点部署的,这个服务如果挂了,整个事务都没有办法完了,下面我们学习Seata的高可用的知识。 实现高可用,还是比较简单,…

【深度学习:Convolutional Neural Networks】卷积神经网络入门指南

【深度学习:Convolutional Neural Networks】卷积神经网络入门指南 介绍为什么选择ConvNets而不是前馈神经网络?Input Image 输入图像基本架构Convolution Layer 卷积层 — 内核Pooling Layer 池化层Classification — Fully Connected Layer (FC Layer)…

一起学量化之KDJ指标

KDJ指标,也称为随机指数,是一个常用的技术分析工具。它由三条线组成:K线、D线和J线,分别代表不同的市场动态。KDJ指标通过分析最高价、最低价和收盘价计算得出。 1. KDJ指标理解 J线是移动速度最快的线,可以提供更加敏锐的市场信号。K线是指标的核心,显示市场的即时动态。…

QtitanRibbon 开始使用实例

新建一个界面程序: 修改项目里面的源码: 至此,一个简单界面就出来了,效果如下所示:

域名转移:将腾讯云转移至阿里云

当时注册域名时,腾讯域云相对便宜,但目前阿里云在业界更加成熟,因此将自己申请的域名由阿里云转移至阿里云,并记录转移过程。 一、域名转出 进入腾讯云,登陆后选择控制台,选择我的资源–域名注册–全部域名…

EOS链Ubuntu环境Install Prebuilt Binaries(安装预构建的二进制文件)的安装

[TOC](EOS链Ubuntu环境Install Prebuilt Binaries(安装预构建的二进制文件)的安装) EOS官网:https://eos.io/ 第一步 Ubuntu安装命令: 以下有两种安装方式,可以任选其一: 本文章已经上传绑定资源,也可以用命令安装。…

2023-12-12LeetCode每日一题(下一个更大元素 IV)

2023-12-12每日一题 一、题目编号 2454. 下一个更大元素 IV二、题目链接 点击跳转到题目位置 三、题目描述 给你一个下标从 0 开始的非负整数数组 nums 。对于 nums 中每一个整数,你必须找到对应元素的 第二大 整数。 如果 nums[j] 满足以下条件,那…

HLS 2017.4 导出 RTL 报错:ERROR: [IMPL 213-28] Failed to generate IP.

软件版本:HLS 2017.4 在使用 HLS 导出 RTL 的过程中产生如下错误: 参考 Xilinx 解决方案:https://support.xilinx.com/s/article/76960?languageen_US 问题描述 DESCRIPTION As of January 1st 2022, the export_ip command used by Vivad…

requestAnimationFrame 解析

文章目录 什么是 requestAnimationFrame为什么 setInterval 实现动画会有一些抖动感使用 requestAnimationFramerequestAnimationFrame 对比 setInterval 本文将给大家介绍一个使用 js 实现动画的利器,requestAnimationFrame,我们一般情况下,…

java零拷贝zero copy MappedByteBuffer

目录 调用操作系统的 mmap 未使用 mmap 的文件通过网络传输的过程 使用 mmap 的文件通过网络传输的过程 使用例子 调用操作系统的 sendfile() 在 java 中的具体实现 mmap的优劣 mmap 的不足 mmap 的优点 mmap 的使用场景 对于零拷贝(zero copy&#xff09…

数据资产入表之——数据确权

关注WX公众号: commindtech77, 获得数据资产相关白皮书下载地址 1. 回复关键字:数据资源入表白皮书 下载 《2023数据资源入表白皮书》 2. 回复关键字:光大银行 下载 光大银行-《商业银行数据资产会计核算研究报告》 3. 回复关键字…

计算机网络 (期末救命版)

文章目录 Ⅰ 网络概述1. 互联网概述与组成2. 计算机网络的类别3. 计算机网络的性能指标4. 计算机网络体系结构 Ⅱ 物理层1. 物理层的任务2. 信道复用技术 Ⅲ 数据链路层1. 点对点信道2. 基本问题3. 点对点协议 PPP4. 使用广播信道的数据链路层 Ⅳ 网络层1. 网络层的服务2. 网际…

怎么挑选猫粮?挑选主食冻干猫粮的步骤

各位铲屎官都知道猫天性是食肉动物,无肉不欢的。而冻干猫粮对于猫咪来说是最好还原猫咪食肉天性的食物,不仅可以当成猫咪的主食,也可以用来给猫咪当成零食,帮助猫咪补充营养。冻干猫粮是经过真空冷冻干燥处理的鲜肉,能…

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK设置相机本身的数据保存(CustomData)功能(C#)

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK设置相机本身的数据保存(CustomData)功能(C#) Baumer工业相机Baumer工业相机的数据保存(CustomData)功能的技术背景CameraExplorer如何使用图像剪切&#xff…

移动端开发框架mui代码在安卓模拟器上运行2(HbuilderX连接到模拟器)模拟器窗口及多开设置

开发工具 HBuilder X 3.8.12.20230817 注意:开发工具尽量用最新的或较新的。太旧的版本在开发调试过程中可能会出现莫名其妙的问题。 接上篇,移动端开发框架mui代码在安卓模拟器上运行(HbuilderX连接到模拟器),这篇主要…

Python开发环境[PycharmEclipseAnaconda]

Pycharm配置Python开发环境 每种语言的开发工具都有很多,如果写一些小的脚本或者小的工具,建议直接使用命令行或者Python自带的IDLE,如果进行大型的开发工作建议使用Pycharm,当然这属于个人喜好。 虽然Pycharm给了我们一个美观的…

【Python特征工程系列】教你利用AdaBoost模型分析特征重要性(源码)

这是Python特征工程系列原创文章,我的第187篇原创文章。 一、问题 应用背景介绍: 如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一样的。有些可能是冗余的…