2023/5/28周报

news2025/1/4 17:17:58

目录

摘要

论文阅读

1、标题和现存问题

2、使用GNN进行文本分类

3、INDUCT-GCN

4、实验准备

5、实验结果

深度学习

1、时空图的种类

2、图在环境中的应用

3、STGNN

总结


摘要

本周在论文阅读上,阅读了一篇InducT-GCN:归纳图卷积文本分类网络的论文。基于训练文档的统计量构造一个图,并将文档向量用单词向量的加权和表示。然后在测试过程中进行单向GCN传播。实验证明,文章模型优于最先进的方法。在深度学习上,继续对图相关知识进行学习,在下周计划开始研究论文写法。

This week,in terms of thesis reading,perusaling a paper on InducT-GCN: Inductive Graph Convolutional Text Classification Network.Constructing a graph based on the statistics of the training document and representing the document vector as a weighted sum of word vectors.Then conducting one-way GCN propagation during the testing process.Experiments have shown that the article model outperforms state-of-the-art methods.In deep learning,continue learning about graph related knowledge and planning to start researching paper writing methods next week

论文阅读

1、标题和现存问题

标题:InducT-GCN:归纳图卷积文本分类网络

现存问题:大多数图模型本质上是转换的。单词/文档的学习节点表示/嵌入并不能自然地推广到未见过的单词/文档,这使得它很难应用到现实世界中。当语料库规模较大时,这些基于图的学习模型的转导性质需要相对较大的计算空间。因此,需要一个归纳模型。将基于图变换的文本分类扩展为归纳模型。

要求:1、归纳学习模型在训练过程中不能包含任何测试集信息。

2、归纳模型在学习一个新的样本时,不能在整个新的图上重新训练模型。

3、利用语料库级基于图的文本分类方法建立归纳模型。

2、使用GNN进行文本分类

gnn在各种NLP任务中得到了运用,包括文本分类。基于gnn的文本分类模型可以分为两种类型,文档级和语料库级方法。在一些基于图的文本分类模型以单词为节点为每个文档构建一个图。单词节点由外部资源和预先训练的嵌入表示,这些边要么使用词共现信息要么仅仅连接句子中的概念词。因此,在模型训练/学习过程中,没有考虑到一个语料库/整个数据集的显式全局结构信息。

文章提出了文本分类 textcn中的语料库级 GNN,以文档和单词为节点构建整个文本语料库的图。它捕获整个语料库的全局信息,并进行节点(文档)分类。

文章中的模型InducT-GCN是一个基于归纳图的文本分类框架,它构建了一个语料库级的图,但采用了归纳学习的性质,自然地归纳到看不见的节点。

3、INDUCT-GCN

文章提出了一种用于文本分类的归纳图卷积网络(归纳图卷积网络),命名为“InducT-GCN”,它可以是传统的基于转导式GCN的文本分类模型的扩展。采用传统的基于gcn转导的文本分类模型,包括TextGCN[6]和SGC,并重点将其扩展为高效的归纳学习模型。

在GCN模型中,每个隐含层的传播规律为:

 

在GCN之后,TextGCN构建了一个大型语料库级图,但以文本信息、文档和单词作为节点,因此可以对全局词-文档共现进行建模。所构造的图包含训练集和测试集的文档和单词节点。TextGCN的目标是用两个主要边来建模全局的word-document发生:1)word-word边缘:由共现信息点互信息(PMI)计算,2)文档-word边缘:TF-IDF。将一热向量输入两层GCN模型,共同学习文档和单词的嵌入。训练集中文档节点的表示用于训练分类模型,而测试集中文档节点的表示用于预测。

基于归纳gcn的文本分类模型InducT-GCN严格不考虑来自测试集的任何信息或统计数据,这些信息或统计数据被认为是看不见的节点。相反,只使用训练文档信息来构造节点。考虑一组节点V = {Vtrain, Vword}, Vword是训练文档中唯一的单词。为了定义InducT-GCN图中图节点的输入向量H(0),考虑两个要求:

(1)在传播阶段,将图视为同构图,即将所有节点视为同一类型,而不检查它们是文字节点还是文档节点。然后,文档节点和word节点的所有输入向量应相互对齐。

(2)我们的InducT-GCN不能使用一个热向量来表示文档节点,以避免在训练过程中学习测试文档的任何表示。

为InducT-GCN图定义了两边类型:

(1)带有PMI的WordWord和

(2)带有TF-IDF的Word-Doc边。

注意,每个节点也连接到自己。PMI是根据切片窗口中一对单词的共现来计算的。

当两个输入文档为“word1 word1 word2 word3”和“word3 word4”时的表示:

 

在构建完图之后,使用两层GCN来训练它。第一个GCN层学习单词嵌入。第二层GCN层的维数是数据集的类数,输出被输入softmax激活函数。例如,一个二元分类任务将导致第二层GCN层的维数为2。训练文档上的节点表示用于交叉熵损失计算和反向传播。在形式上,传播可以描述为:

 

在GCN中,每一层的传播是通过节点的一阶邻居和节点本身的加权和来更新节点。为了对测试集做出预测,每个测试文档的一阶和二阶邻居表示应该被聚合。注意,我们只在测试阶段使用测试文档,因此在传播期间不需要更新图中的所有节点。

4、实验准备

导入- gcn培训和测试阶段:

测试阶段可以描述为:

数据集准备:R8, R52, Ohsumed, 20NG,mr。

所有数据集都进行预处理。如果在训练文档中出现的单词少于两次,我们将删除这些单词,因为只出现一次的单词不能作为两个文档节点之间的桥梁。NLTK停止词列表中列出的词也被删除。对所有的实验都采用相同的预处理方法。

将同一组超参数应用于所有数据集,而不进行超参数调优,以便进行公平的比较。对于TextGCN , SGC,我们的InducT-GCN和InducT-SGC,采用了两层图卷积,隐维为200。学习速率为0.02的Adam优化器用于训练。每次实验之后,设200个epoch为最大的epoch数,提前停止10个epoch。随机选取训练集的10%作为验证集。通过使用默认的超参数,其他基线模型也应用了早期停止机制。然后,我们使用精度作为评价指标,并对每个测试结果产生10次运行结果的平均值和标准差。

5、实验结果

下表显示了原始的转导SGC模型和我们的InducT-SGC模型的对比。如表所示,当标记数据有限时,我们的InducTSGC比原始的SGC产生更高的性能。原始的和我们的归纳模型textgcn - induct - gcn和SGCto-InductSGC之间的性能改进,清楚地显示了我们所提出的归纳框架的泛化能力。它也可以应用到其他语料库级的基于图的文本分类模型中

  

不同初始化嵌入方法的测试精度:

  

TextGCN和InducT-GCN、SGC在不同测试尺寸下的对比:

 

测试规模越大,TextGCN与InducT-GCN之间的差距越大。当测试大小最大时,TextGCN的性能会更差。这主要是因为只有一小部分文档节点会在较大的测试集下对TextGCN中的梯度做出贡献。特别是在训练阶段,TextGCN很难通过反向传播来学习与word节点连接较少的测试文档节点的嵌入。此外,测试大小增加时,InducT-GCN的性能只下降了一点点(小于0.5)。将归纳图构建和学习框架InducT-SGC应用于SGC,也在SGC上进行了同样的评估。就像我们的InducT-GCN产生的结果一样,InducT-SGC提供了比原来的SGC更高的性能。性能趋势显示了我们的归纳学习框架如何完美地适应归纳学习的本质。

 

还使用完整的数据集评估了我们的InducT-GCN的性能,就像评估TextGCN一样。从表中可以看出,当使用具有相同超参数的整个数据集时,InducT-GCN和TextGCN在R8和R52上的性能是可以比较的。可以得出结论,InducT-GCN在性能和计算上都优于TextGCN,不仅在更小的空间和更少的参数,而且在整个数据集设置。

深度学习

1、时空图的种类

基于拓扑的时空图

邻接矩阵公式化:

 

其中 a_t 表示时刻t邻接矩阵中的元素。由于拓扑结构中的连接可以是对称的或非对称的,因此基于拓扑的图可以是有向的或无向的。拓扑只表示非欧几里得空间中的连接,因此基于拓扑的图是未加权的。此外,社会系统中的拓扑结构通常在相当长的一段时间内是固定的,所以我们可以将它们视为静态图。

基于距离的时空图

基于距离的时空图是一种用于表示时间和空间关系的图形结构,其中节点之间的连接关系是基于它们之间的距离或空间关系而建立的。这种图形结构可以用于描述空间中的邻近性、距离、路径等信息,并结合时间维度来展示时空上的变化。

在基于距离的时空图中,节点表示空间位置或地点,边表示空间位置之间的距离或连接关系。可以使用欧氏距离、曼哈顿距离、最短路径距离等度量方法来计算节点之间的距离。边的权重可以反映空间位置之间的距离程度,或者表示它们之间的邻近性。

 

基于相似性的时空图

基于相似性的时空图是一种用于表示时间和空间关系的图形结构,其中节点之间的连接关系是基于它们之间的相似性或相关性而建立的。这种图形结构可以用于描述空间中的相似性、关联性、模式等信息,并结合时间维度来展示时空上的变化。

在基于相似性的时空图中,节点表示空间位置或对象,边表示节点之间的相似性或相关性。相似性可以基于不同的度量方法计算,例如距离度量、相关系数、相似性指数等。边的权重可以反映节点之间的相似程度,或者表示它们之间的关联强度。

 

2、图在环境中的应用

空气质量预测 Air Quality Prediction

空间质量指数(AQI)、PM2.5和排放量是我们关心的指标,这些相关数据有城市级或国家级观测站收集,由于空气流动性,距离较近或风向相同的观测站可能收集到相关的结果。构建基于时空图的深度学习模型不仅可以建立这种空间相关性,还可以捕捉空气质量的时变动态性。

  1. 空间相关性建模:时空图可以展示不同空间位置之间的相关性和相互影响。通过分析历史空气质量数据,可以构建时空图来捕捉不同地点之间的空间相关性。这样可以利用邻近地点的信息来预测目标地点的空气质量,并提高预测的准确性。

  2. 时间序列预测:时空图可以用于建模和分析时间序列上的空气质量数据。通过将不同时间点的数据连接起来,形成时空图,可以捕捉到空气质量随时间变化的模式和趋势。这样可以利用时间序列分析和预测方法,预测未来时间点的空气质量水平。

  3. 空间插值和填补:时空图可以用于进行空间插值和填补,填补缺失的空气质量数据。通过分析相邻地点的数据和空间相关性,可以利用时空图的结构来预测缺失位置的空气质量值,从而提供完整的数据集用于预测和分析。

  4. 空气污染扩散模拟:时空图可以用于建立空气污染扩散模型。通过考虑空间位置之间的相对位置和空气流动的影响,可以构建时空图来模拟和预测空气污染物的传播和扩散情况。这样可以帮助预测污染物的扩散范围和潜在的影响区域。

气象预测 Meteorological Prediction

与空气质量数据类似,气象数据也由分布的观测站收集。然而,不同站点之间的相关性可能更加复杂,并且容易受到更多因素的影响。

3、STGNN

STGNN是指时空图神经网络。它是一种用于处理时空数据的神经网络模型,能够有效地对时空图数据进行建模和预测。STGNN结合了图神经网络(Graph Neural Network,GNN)和时间序列建模的技术,具备处理时空图数据的能力。它适用于具有复杂时空关系的数据集,如交通流量、气象数据、空气质量数据等。

STGNN的主要思想是将时空数据表示为图结构,并利用图神经网络的方法对图数据进行建模和分析。它能够同时考虑节点之间的空间关系和时间关系,以捕捉节点在时空维度上的动态变化。

STGNN主要由3个模块构成。数据处理模块,从原始数据中构建时空图数据。时空学习模块,捕获复杂的社会系统中隐藏的时空依赖关系。任务感知预测模块:将STGLM中的时空隐藏表示映射到下游预测任务的空间中。

 

通常通过一定的时空融合神经网络架构将空间学习网络和时间学习网络有机结合在一起。对于空间学习网络,可以选择谱域图卷积网络、空间图卷积网络、图注意力网络GAT;对于时间学习网络,可以选择循环神经网络RNN、时间卷积网络TCN、时间自注意力网络TSAN。

总结

在结束本周的学习后,下周计划开展论文的工作,尽量将论文框架搭建起来,确定思路和逻辑,早日动工。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/579186.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AWVS使用手册

目录 AWVS基本操作 AWVS工具介绍 AWVS界面介绍 AWVS主要操作区域简介 AWVS的功能及特点的功能及特点 AWVS的菜单栏,工具栏简介 AWVS基本功能介绍 AWVS的蜘蛛爬虫功能 AWVS目标目标探测工具 AWVS的子域名探测工具 AWVS的的HTTP嗅探工具 AWVS的的HTTP模糊…

排序算法的时间复杂度、空间复杂度对比总结

参考:八大排序算法的稳定性和时间复杂度

【linux】守护进程(精灵进程)

文章目录 一、TCP服务器日志二、守护进程预备知识2.1 守护进程概念2.2 前台任务和后台任务2.3 进程组与组长ID2.4 前台进程后台进程的切换2.5 自成会话 三、实现守护进程3.1 自建会话setsid3.2 守护进程的条件3.3 代码实现 一、TCP服务器日志 上一章我们写了一个TCP网络服务器…

SAP-MM-计算方案字段解析

01、 “步骤”:标识此条件类型在计算方案中的顺序编号,此编号会影响到后续业务中条件类型的排序,不同条件类型之间的编号最好间隔大一些,这样设置便于以后对计算方案进行扩展; 02、 “计数器”&#xff1…

(哈希表 ) 349. 两个数组的交集 ——【Leetcode每日一题】

❓349. 两个数组的交集 难度:简单 给定两个数组 nums1 和 nums2 ,返回 它们的交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 。 示例 1: 输入:nums1 [1,2,2,1], nums2 [2,2] 输出:[…

Hbase学习笔记

1 HBase介绍 (1) HBase是什么 HBase是一个开源的非关系型分布式、实时数据库(Nosql),运行于HDFS文件系统之上,因此key容错地存储海量稀疏的数据。 海量稀疏就是说不能保证每一个key它的列都有value。 关系型数据库:mysql、oracle 非关系…

Midjourney AI绘画咒语与生成的作品(实例)

据说Midjourney出来后,有一大批设计师抱着电脑,哭晕了~~ 有兴趣的朋友,可以看一下我前两天发的,地址如下: Midjourney AI绘画中文教程详解(完整版)模型、命令、参数与各种高级用法https://blog…

马斯洛的的五层需求完美吗 不

马斯洛五层需求难道就很完美吗?不! 我很佩服的复旦大学哲学王德峰教授批判 对马斯洛的自我实现,他认为 中国人没有西方意义上的自我实现 比如儒家成人达己、圆满、道问学和尊德性,比如孔子的学生颜回 比如佛家的渡人、觉悟。比如弘…

使用sklearn进行机器学习案例(1)

文章目录 案例一. 加州房价预测案例二. MNIST手写数字识别案例三. 波士顿房价预测 案例一. 加州房价预测 线性回归通过对训练集进行训练,拟合出一个线性方程,使得预测值与实际值之间的平均误差最小化。这个过程可以使用梯度下降法等优化算法来实现。即通…

使用curl命令传输数据

文章目录 一、curl命令二、举例和注意事项Reference 一、curl命令 curl是传输数据的命令行工具,可以通过命令行发送HTTP请求和接收HTTP响应。它的名字是“client for URLs”,意为URL的客户端,表示该工具主要用于处理URL相关的任务。curl可以…

Mysql数据库对表的基本操作

一.表基本操作 1.当前数据库内创建表 2.查看表 3.删除表 4.修改表结构 5.复制表(结构) 二.表约束创建 1.约束的作用 2.约束的类型 3.演示 一.表基本操作 1.当前数据库内创建表 CREATE TABLE 表名( 列名 列数据类型, 列名 列…

如何在华为OD机试中获得满分?Java实现【寻找关键钥匙】一文详解!

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题(2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述…

使用compose desktop构建桌面应用

使用compose desktop构建桌面应用时遇到的一些坑 官方指导移步:多平台开发说明,我这里只写一些自己遇到问题 我在mac机器开发,然后使用githubAction构建的win平台的包,现记录一下遇到的问题 构建文件build.gradle编写不同平台的程…

SAM-MM-配额协议字段解析

1、有效起始日:配额协议的生效日期,系统默认为当前创建日期,灰色,不可更改; 2、有效至:配额协议的失效日期,要手动填一个日期; 3、最小数量拆分:如果要按照配额比例&am…

.NET面向AI编程——SK框架(SemanticKernel)的简易入门实践

前言:随着ChatGPT开始在各个领域遍地开花,有关的应用也开始层出不穷。随着微软开源SK框架,无疑是给.NET开发者带来面向AI应用的新机遇。以下内容,通过创建一个简单的prompt开始,开发一个使用SK框架进行开发的入门教程&…

xss跨站之waf绕过及安全修复(28)

手工探针xss绕过waf规则 打开靶场 写入跨站测试语句发现拦截 这里就做一个最经典的方法,做一个关键字拆分来确立拦截的是什么东西。 去掉最后字符串,访问还是拦截,再去掉alert(1),访问还是拦截&#xff…

八大排序-直接插入排序、希尔排序、直接选择排序、冒泡排序、堆排序、快速排序、归并排序、基数排序(上)

目录 前言 直接插入排序(Insertion Sort) 一、概念及其介绍 二、过程图示 三、代码 四、复杂度 希尔排序(Shell Sort) 一、概念 二、实现思路 三、图示过程 四、代码 4.1代码 4.2运行结果 4.3解释 五、复杂度 堆排…

华为诺亚实验室VanillaNet学习笔记

华为诺亚实验室VanillaNet学习笔记 VanillaNet: the Power of Minimalism in Deep Learning Abstract 基础模型的核心理念是“多而不同”,计算机视觉和自然语言处理领域的惊人成功就是例证。然而,优化的挑战和变压器模型固有的复杂性要求范式向简单性…

Linux:finalshell虚拟机与真实机的上传和下载;rz、sz

使用命令rz上传的速度会比拖拽上传的速度慢

Day3:Windows网络编程-UDP

对比TCP与UDP的通信区别 UDP Server没有listen()和accept() TCP Server #include <iostream> #include <WinSock2.h> // 包含网络库 #pragma comment(lib,"ws2_32.lib") using namespace std;int main() {// 1. 初始化套接字 初始化套接字库cout <&l…