2023/6/4周报

news2025/1/12 6:01:56

目录

摘要

论文阅读

1、标题和现存问题

2、使用GNN进行文本分类

3、INDUCT-GCN

4、实验准备

5、实验结果

深度学习

1、时空图的种类

2、图在环境中的应用

3、STGNN

总结


摘要

本周在论文阅读上,阅读了一篇InducT-GCN:归纳图卷积文本分类网络的论文。基于训练文档的统计量构造一个图,并将文档向量用单词向量的加权和表示。然后在测试过程中进行单向GCN传播。实验证明,文章模型优于最先进的方法。在深度学习上,继续对图相关知识进行学习,在下周计划开始研究论文写法。

This week,in terms of thesis reading,perusaling a paper on InducT-GCN: Inductive Graph Convolutional Text Classification Network.Constructing a graph based on the statistics of the training document and representing the document vector as a weighted sum of word vectors.Then conducting one-way GCN propagation during the testing process.Experiments have shown that the article model outperforms state-of-the-art methods.In deep learning,continue learning about graph related knowledge and planning to start researching paper writing methods next week

论文阅读

1、标题和现存问题

标题:InducT-GCN:归纳图卷积文本分类网络

现存问题:大多数图模型本质上是转换的。单词/文档的学习节点表示/嵌入并不能自然地推广到未见过的单词/文档,这使得它很难应用到现实世界中。当语料库规模较大时,这些基于图的学习模型的转导性质需要相对较大的计算空间。因此,需要一个归纳模型。将基于图变换的文本分类扩展为归纳模型。

要求:1、归纳学习模型在训练过程中不能包含任何测试集信息。

2、归纳模型在学习一个新的样本时,不能在整个新的图上重新训练模型。

3、利用语料库级基于图的文本分类方法建立归纳模型。

2、使用GNN进行文本分类

gnn在各种NLP任务中得到了运用,包括文本分类。基于gnn的文本分类模型可以分为两种类型,文档级和语料库级方法。在一些基于图的文本分类模型以单词为节点为每个文档构建一个图。单词节点由外部资源和预先训练的嵌入表示,这些边要么使用词共现信息要么仅仅连接句子中的概念词。因此,在模型训练/学习过程中,没有考虑到一个语料库/整个数据集的显式全局结构信息。

文章提出了文本分类 textcn中的语料库级 GNN,以文档和单词为节点构建整个文本语料库的图。它捕获整个语料库的全局信息,并进行节点(文档)分类。

文章中的模型InducT-GCN是一个基于归纳图的文本分类框架,它构建了一个语料库级的图,但采用了归纳学习的性质,自然地归纳到看不见的节点。

3、INDUCT-GCN

文章提出了一种用于文本分类的归纳图卷积网络(归纳图卷积网络),命名为“InducT-GCN”,它可以是传统的基于转导式GCN的文本分类模型的扩展。采用传统的基于gcn转导的文本分类模型,包括TextGCN[6]和SGC,并重点将其扩展为高效的归纳学习模型。

在GCN模型中,每个隐含层的传播规律为:

 

在GCN之后,TextGCN构建了一个大型语料库级图,但以文本信息、文档和单词作为节点,因此可以对全局词-文档共现进行建模。所构造的图包含训练集和测试集的文档和单词节点。TextGCN的目标是用两个主要边来建模全局的word-document发生:1)word-word边缘:由共现信息点互信息(PMI)计算,2)文档-word边缘:TF-IDF。将一热向量输入两层GCN模型,共同学习文档和单词的嵌入。训练集中文档节点的表示用于训练分类模型,而测试集中文档节点的表示用于预测。

基于归纳gcn的文本分类模型InducT-GCN严格不考虑来自测试集的任何信息或统计数据,这些信息或统计数据被认为是看不见的节点。相反,只使用训练文档信息来构造节点。考虑一组节点V = {Vtrain, Vword}, Vword是训练文档中唯一的单词。为了定义InducT-GCN图中图节点的输入向量H(0),考虑两个要求:

(1)在传播阶段,将图视为同构图,即将所有节点视为同一类型,而不检查它们是文字节点还是文档节点。然后,文档节点和word节点的所有输入向量应相互对齐。

(2)我们的InducT-GCN不能使用一个热向量来表示文档节点,以避免在训练过程中学习测试文档的任何表示。

为InducT-GCN图定义了两边类型:

(1)带有PMI的WordWord和

(2)带有TF-IDF的Word-Doc边。

注意,每个节点也连接到自己。PMI是根据切片窗口中一对单词的共现来计算的。

当两个输入文档为“word1 word1 word2 word3”和“word3 word4”时的表示:

 

在构建完图之后,使用两层GCN来训练它。第一个GCN层学习单词嵌入。第二层GCN层的维数是数据集的类数,输出被输入softmax激活函数。例如,一个二元分类任务将导致第二层GCN层的维数为2。训练文档上的节点表示用于交叉熵损失计算和反向传播。在形式上,传播可以描述为:

 

在GCN中,每一层的传播是通过节点的一阶邻居和节点本身的加权和来更新节点。为了对测试集做出预测,每个测试文档的一阶和二阶邻居表示应该被聚合。注意,我们只在测试阶段使用测试文档,因此在传播期间不需要更新图中的所有节点。

4、实验准备

导入- gcn培训和测试阶段:

测试阶段可以描述为:

数据集准备:R8, R52, Ohsumed, 20NG,mr。

所有数据集都进行预处理。如果在训练文档中出现的单词少于两次,我们将删除这些单词,因为只出现一次的单词不能作为两个文档节点之间的桥梁。NLTK停止词列表中列出的词也被删除。对所有的实验都采用相同的预处理方法。

将同一组超参数应用于所有数据集,而不进行超参数调优,以便进行公平的比较。对于TextGCN , SGC,我们的InducT-GCN和InducT-SGC,采用了两层图卷积,隐维为200。学习速率为0.02的Adam优化器用于训练。每次实验之后,设200个epoch为最大的epoch数,提前停止10个epoch。随机选取训练集的10%作为验证集。通过使用默认的超参数,其他基线模型也应用了早期停止机制。然后,我们使用精度作为评价指标,并对每个测试结果产生10次运行结果的平均值和标准差。

5、实验结果

下表显示了原始的转导SGC模型和我们的InducT-SGC模型的对比。如表所示,当标记数据有限时,我们的InducTSGC比原始的SGC产生更高的性能。原始的和我们的归纳模型textgcn - induct - gcn和SGCto-InductSGC之间的性能改进,清楚地显示了我们所提出的归纳框架的泛化能力。它也可以应用到其他语料库级的基于图的文本分类模型中

不同初始化嵌入方法的测试精度:

 

TextGCN和InducT-GCN、SGC在不同测试尺寸下的对比:

 

测试规模越大,TextGCN与InducT-GCN之间的差距越大。当测试大小最大时,TextGCN的性能会更差。这主要是因为只有一小部分文档节点会在较大的测试集下对TextGCN中的梯度做出贡献。特别是在训练阶段,TextGCN很难通过反向传播来学习与word节点连接较少的测试文档节点的嵌入。此外,测试大小增加时,InducT-GCN的性能只下降了一点点(小于0.5)。将归纳图构建和学习框架InducT-SGC应用于SGC,也在SGC上进行了同样的评估。就像我们的InducT-GCN产生的结果一样,InducT-SGC提供了比原来的SGC更高的性能。性能趋势显示了我们的归纳学习框架如何完美地适应归纳学习的本质。

 

还使用完整的数据集评估了我们的InducT-GCN的性能,就像评估TextGCN一样。从表中可以看出,当使用具有相同超参数的整个数据集时,InducT-GCN和TextGCN在R8和R52上的性能是可以比较的。可以得出结论,InducT-GCN在性能和计算上都优于TextGCN,不仅在更小的空间和更少的参数,而且在整个数据集设置。

深度学习

1、时空图的种类

基于拓扑的时空图

邻接矩阵公式化:

 

其中 a_t 表示时刻t邻接矩阵中的元素。由于拓扑结构中的连接可以是对称的或非对称的,因此基于拓扑的图可以是有向的或无向的。拓扑只表示非欧几里得空间中的连接,因此基于拓扑的图是未加权的。此外,社会系统中的拓扑结构通常在相当长的一段时间内是固定的,所以我们可以将它们视为静态图。

基于距离的时空图

基于距离的时空图是一种用于表示时间和空间关系的图形结构,其中节点之间的连接关系是基于它们之间的距离或空间关系而建立的。这种图形结构可以用于描述空间中的邻近性、距离、路径等信息,并结合时间维度来展示时空上的变化。

在基于距离的时空图中,节点表示空间位置或地点,边表示空间位置之间的距离或连接关系。可以使用欧氏距离、曼哈顿距离、最短路径距离等度量方法来计算节点之间的距离。边的权重可以反映空间位置之间的距离程度,或者表示它们之间的邻近性。

 

基于相似性的时空图

基于相似性的时空图是一种用于表示时间和空间关系的图形结构,其中节点之间的连接关系是基于它们之间的相似性或相关性而建立的。这种图形结构可以用于描述空间中的相似性、关联性、模式等信息,并结合时间维度来展示时空上的变化。

在基于相似性的时空图中,节点表示空间位置或对象,边表示节点之间的相似性或相关性。相似性可以基于不同的度量方法计算,例如距离度量、相关系数、相似性指数等。边的权重可以反映节点之间的相似程度,或者表示它们之间的关联强度。

 

2、图在环境中的应用

空气质量预测 Air Quality Prediction

空间质量指数(AQI)、PM2.5和排放量是我们关心的指标,这些相关数据有城市级或国家级观测站收集,由于空气流动性,距离较近或风向相同的观测站可能收集到相关的结果。构建基于时空图的深度学习模型不仅可以建立这种空间相关性,还可以捕捉空气质量的时变动态性。

  1. 空间相关性建模:时空图可以展示不同空间位置之间的相关性和相互影响。通过分析历史空气质量数据,可以构建时空图来捕捉不同地点之间的空间相关性。这样可以利用邻近地点的信息来预测目标地点的空气质量,并提高预测的准确性。

  2. 时间序列预测:时空图可以用于建模和分析时间序列上的空气质量数据。通过将不同时间点的数据连接起来,形成时空图,可以捕捉到空气质量随时间变化的模式和趋势。这样可以利用时间序列分析和预测方法,预测未来时间点的空气质量水平。

  3. 空间插值和填补:时空图可以用于进行空间插值和填补,填补缺失的空气质量数据。通过分析相邻地点的数据和空间相关性,可以利用时空图的结构来预测缺失位置的空气质量值,从而提供完整的数据集用于预测和分析。

  4. 空气污染扩散模拟:时空图可以用于建立空气污染扩散模型。通过考虑空间位置之间的相对位置和空气流动的影响,可以构建时空图来模拟和预测空气污染物的传播和扩散情况。这样可以帮助预测污染物的扩散范围和潜在的影响区域。

气象预测 Meteorological Prediction

与空气质量数据类似,气象数据也由分布的观测站收集。然而,不同站点之间的相关性可能更加复杂,并且容易受到更多因素的影响。

3、STGNN

STGNN是指时空图神经网络。它是一种用于处理时空数据的神经网络模型,能够有效地对时空图数据进行建模和预测。STGNN结合了图神经网络(Graph Neural Network,GNN)和时间序列建模的技术,具备处理时空图数据的能力。它适用于具有复杂时空关系的数据集,如交通流量、气象数据、空气质量数据等。

STGNN的主要思想是将时空数据表示为图结构,并利用图神经网络的方法对图数据进行建模和分析。它能够同时考虑节点之间的空间关系和时间关系,以捕捉节点在时空维度上的动态变化。

STGNN主要由3个模块构成。数据处理模块,从原始数据中构建时空图数据。时空学习模块,捕获复杂的社会系统中隐藏的时空依赖关系。任务感知预测模块:将STGLM中的时空隐藏表示映射到下游预测任务的空间中。

 

通常通过一定的时空融合神经网络架构将空间学习网络和时间学习网络有机结合在一起。对于空间学习网络,可以选择谱域图卷积网络、空间图卷积网络、图注意力网络GAT;对于时间学习网络,可以选择循环神经网络RNN、时间卷积网络TCN、时间自注意力网络TSAN。

总结

在结束本周的学习后,下周计划开展论文的工作,尽量将论文框架搭建起来,确定思路和逻辑,早日动工。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python-pandas按各种时间统计和案例

使用到的库 pandas、matplotlib、numpy 使用到的函数 df.resample(“H”).sum() 参数 B business day frequency C custom business day frequency (experimental) D calendar day frequency W weekly frequency M month end frequency BM business month end frequency CBM…

【奶奶看了都会】云服务器ChatGLM模型fine-tuning微调,让你拥有自己的知识库

1.背景 大家好啊,上次给大家写了ChatGLM-6B的部署使用教程,【奶奶看了都会】云服务器部署开源ChatGLM-6B,让你拥有自己的ChatGPT 但是因为模型比较小的问题,所以日常工作中可能用不上。而且大家更希望的是模型能训练自己的数据&…

【Python Bokeh】零基础也能轻松掌握的学习路线与参考资料

Python Bokeh是一款为开发者提供数据可视化的Python库。它可以帮助开发者轻松地创建交互式网页应用程序,而无需编写大量的JavaScript代码。Bokeh支持各种绘图类型和工具,包括线图、散点图、条形图等。Python Bokeh非常适合在大数据分析、商业智能和数据科…

chatgpt赋能python:Python去除重复元素的几种方法

Python去除重复元素的几种方法 在Python编程中,去除列表、集合、字典等数据结构中的重复元素是一个常见的操作。本文将介绍Python中去除重复元素的几种方法,并分析它们的优缺点。 方法一:使用set去重 Set是Python中的一种集合类数据结构&a…

17_Linux根文件简介与Busybox构建文件系统

目录 根文件系统简介 文件目录简介 BusyBox简介 编译BusyBox构建根文件系统 修改Makefile添加编译器 busybox中文字符支持 配置 busybox 编译busybox 向根文件系统添加lib库 向rootfs的“usr/lib”目录添加库文件 创建其他文件夹 根文件系统初步测试 根文件系统简介…

Unity制作二次元卡通渲染角色材质——3、高光反射与ILM贴图

Unity制作二次元材质角色 回到目录 大家好,我是阿赵。 这里继续来讲二次元角色的材质。上次讲了光影的色阶化问题,这次继续讲光照模型效果的问题。 之前我们说过,光照模型的最后效果是: 环境色漫反射高光反射。 这里我们可以先忽略…

【嵌入式系统】思考题复习

嵌入式系统思考题 0. 名词解释1. 嵌入式系统概述2. ARM处理器体系结构3. ARM指令集4. S5PV210微处理器与接口5. ARM-Linux内核6. 嵌入式Linux文件系统7. 嵌入式Linux系统移植及调试8. 设备驱动程序设计9. QT图形界面应用程序开发基础10. SQLite数据库11. 嵌入式系统的开发设计案…

Qt6.5.1LTS搭建Android开发环境填坑

Qt6第二个LTS出来了,周日找时间安装并测试了Qt6.5LTS,安装我是按我之前的一个博客记录来做的,用的是国内境像,顺利快速安装完成,下面是设置的过程关键总结。 一、Devices Android设备(Device)选择 二、Kits &#xf…

网络安全-XSS的原理、攻击及防御

简介 跨站脚本攻击(全称Cross Site Scripting,为和CSS(层叠样式表)区分,简称为XSS)是指恶意攻击者在Web页面中插入恶意javascript代码(也可能包含html代码),当用户浏览网页之时,嵌入其中Web里面…

【C++开发】Qt+Tesseract实现文字识别的各种坑(已解决)

文章目录 Tesseract库下载Qt版本选择安装步骤 VS2017安装MSVC调试器安装构建套件的导入文字识别功能的检测 最近在给之前Qt医疗管理系统项目添加一个文字识别功能,但是在其中遇到非常多坑,花费了我比较多的时间(查阅了很多文章)&a…

基础学习——关于list、numpy、torch在float和int等数据类型转换方面的总结

系列文章目录 Numpy学习——创建数组及常规操作(数组创建、切片、维度变换、索引、筛选、判断、广播) Tensor学习——创建张量及常规操作(创建、切片、索引、转换、维度变换、拼接) 基础学习——numpy与tensor张量的转换 基础学习…

【软件测试】一个完整的项目流程是什么样的?

软件测试是使用人工或者自动的手段来运行或者测定某个软件系统的过程,其目的在于检验它是否满足规定的需求或弄清预期结果与实际结果之间的差别。 在软件投入使用前,要经过一系列的严格测试,才能保证交付质量。 一、引言 1.编写目的 本文档…

2023年度第四届全国大学生算法设计与编程挑战赛(春季赛)

目录 2023年度第四届全国大学生算法设计与编程挑战赛(春季赛)1、A2、Bx3、Cut4、Diff5、EchoN6、Farmer7、GcdGame8、HouseSub9、IMissYou!10、Jargonless 2023年度第四届全国大学生算法设计与编程挑战赛(春季赛) 1、A 题目描述…

【C++初阶】C/C++内存管理(没有对象的都进来看看吧~)

👦个人主页:Weraphael ✍🏻作者简介:目前学习C和算法 ✈️专栏:C航路 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你有帮助的话 欢迎 评论💬 点赞&#x1…

2023 华为 Datacom-HCIE 真题题库 08/12--含解析

单项选择 1.[试题编号:190385] (单选题)以下关于BGP/MPLSIPVPN路由交互的描述,错误的是哪一项? A、PE与CE之间交互的是IPv4路由信息 B、出口PE可以通过BGP、IGP或静态路由的方式向远端CE发送IPv4路由 C、入口PE将从CE接收到的I…

ODOO随笔(二)—— Odoo16的主题样式变更

1 登陆界面的修改 系统默认的登陆界面,有更改odoo logo和去除“管理数据库”、“由Odoo提供支持”两个需求。 (1)更改odoo logo 系统管理员登陆后,选择菜单栏:设置——公司——管理公司 点击相机图标,上传…

Round#13 web专项部分wp

flask?jwt? 忘记密码处有secretkey 然后就是伪造session了,这里猜一下要什么 最后应该是_is_admin有用,我没细看,当时平台卡麻了 指正:改_user_id为1 ez_factors 注意到可以拼接命令,但是执行的回显只有数字 那么可以考虑读取后用od命令来转8进制读取 flask?jwt?(hard) …

2023.5.30 深信服 c++ 一面

深信服,c一面小记 导语面试内容重点问题解析弱引用弱在哪里?手撕memcpy水壶倒水问题 导语 最近开始面试,记录一下面试经历。   应该是会给我发感谢信的吧~我也是真的菜。工作的原因其实也没时间准备,最近工作还是挺忙的。另外一…

【云原生docker】

容器化越来越受欢迎,因为容器是: ●灵活:即使是最复杂的应用也可以集装箱化。 ●轻量级:容器利用并共享主机内核。 ●可互换:可以即时部署更新和升级。 ●便携式:可以在本地构建,部署到云&#…

LVGL学习(2):图片的转换和显示

我们在设计UI的过程中可能需要显示一些图片,本篇文章将介绍如何转换并显示一个固定的图片到lv_img中。 文章目录 1 图片转换1.1 GUI Guider1.2 在线转换 2 图片的显示 1 图片转换 和之前我写的一篇字体转换的文章一样:LVGL学习(1):中文字体…