【文本分类】《融合注意力和剪裁机制的通用文本分类模型》

news2025/4/6 17:33:14

·阅读摘要：
针对实际场景中长短文本大量的情况，提出了双通道注意力机制与长文本裁剪机制来改进文本分类模型，最终提高了精度。
·参考文献：
[1] 融合注意力和剪裁机制的通用文本分类模型

参考论文信息

论文名称：《融合注意力和剪裁机制的通用文本分类模型》

发布期刊：《计算机应用》

期刊信息：CSCD扩展
在这里插入图片描述
本文主要是针对数据集中长文本和短文本互相混和的情况，设计了一些改进。主要有六：

·词向量表示模块
·卷积神经网络模块
·双通道注意力模块
·长文本裁剪模块
·循环神经网络模块
·融合分类模块

其中，值得说的是双通道注意力模块与长文本裁剪模块，其他的模块都是比较基础的。

模型结构

模型结构如下：

在这里插入图片描述

【注】：这个网络结构，我只能说是“简单的复杂”。纯把数据倒来倒去，然后拼接在一起，做个分类。它做了这么多工作，其实很有可能会产生debuff，甚至不如直接在BERT后面接个分类结果好。但是实践出真知，我持保留意见。

【注】：上面的模型除了数据倒来倒去，原理还是较为简单的，双通道注意力模块与长文本裁剪模块值得看一下。

·双通道注意力模块
在这里插入图片描述
比较好理解，平均池化、最大池化、LSTM、激活、拼接……

【注】：1、我感觉“注意力”这个词，已经被用的完全背离它原始的定义了，现在什么都叫注意力；2、再说一次，步骤搞的这么多，真的不会产生负效果吗。

·长文本裁剪模块
在这里插入图片描述

对于双通道注意力机制的输出，根据一定的阈值，把它们变成0-1值（二值化），这叫做阈值阶段。

连通分量筛选没看懂，如下：
在这里插入图片描述

最后把连通分量筛选的结果和BERT+LSTM的结果点乘，最后再结果一系列操作……

【注】：这么多乱七八糟的操作，真的不会影响文本的实际表示吗…………

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/27114.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

第三版全球干旱指数和潜在蒸散数据发布

第三版全球干旱指数和潜在蒸散数据发布

Robert J. Zomer ；JianchuXu；AntonioTrabucco(Kunming Institute of Botany, Chinese Academy of Science；Euro-Mediterranean Center on Climate Change, IAFES Division, Sassari, Italy) 摘要潜在蒸散(Potential evapotranspiration&…

阅读更多...

Linux Shell 自动交互功能实现

Linux Shell 自动交互功能实现

1. EOF 多文本输入需求案例 1 新交付了一批机器，每台机器只分配了一块落盘 ，现在根据需求对该盘进行分区并实现挂载，如何实现？ 需求分析： 对于一个盘，实现分区挂载到不同目录，通常思路有两…

阅读更多...

灯具行业MES解决方案，实现产品的正反向追溯

灯具行业MES解决方案，实现产品的正反向追溯

灯具照明行业产业链主要包括上游原材料、中游照明产品生产及封装、下游照明细分应用领域。产业链上游、中游多为资本密集与技术密集型行业，产品高度标准化，市场相对集中。而产业链下游产品需求相对个性化，多品类、多SKU，市场集中度…

阅读更多...

探索性数据分析

探索性数据分析

有目的性的探索数据集以获取具体的优化方向和思路。 Intuition 探索性数据分析 (EDA) 以了解数据集的信号和细微差别。这是一个循环过程，可以在开发过程的各个阶段（标记之前/之后、预处理等）完成，具体取决于问题的定义程度。例如&…

阅读更多...

【Proteus仿真】【STM32单片机】蔬菜大棚温湿度控制系统设计

【Proteus仿真】【STM32单片机】蔬菜大棚温湿度控制系统设计

文章目录一、主要功能二、硬件资源三、软件设计四、实验现象联系作者一、主要功能本项目使用Proteus8仿真STM32单片机控制器，使用LCD1602液晶、DHT11温湿度、蜂鸣器、按键、LED、继电器、电机模块等。主要功能： 系统运行后，LCD1602显示DH…

阅读更多...

setup获取props和自定义事件、通过expose暴露给ref获取属性和方法、setup顶层async、setup返回函数

setup获取props和自定义事件、通过expose暴露给ref获取属性和方法、setup顶层async、setup返回函数

文章目录1. setup获取props和自定义事件2. 通过expose暴露给ref获取属性和方法3. setup顶层async4. setup返回函数1. setup获取props和自定义事件 child 组件： <template><div><h3>我是child组件 -- {{ title }}</h3><button click&qu…

阅读更多...

We have awesome remote U.S. jobs waiting for engineers like you.

We have awesome remote U.S. jobs waiting for engineers like you.

发件人：Turing - U.S. Software Jobs <hiringturing.com> Hi I saw your profile online and wanted to reach out! You might be a great fit for many high-paying remote U.S. software engineering opportunities on Turing.com. Turing is based in …

阅读更多...

steam搬砖，长期稳定副业，附防坑指南助你不掉坑

steam搬砖，长期稳定副业，附防坑指南助你不掉坑

大家伙，我是阿阳今天给大家拆解一个冷门项目，国外steam游戏搬砖项目，这个项目也是自己正在做的第二个项目，虽然冷门，不暴利，做了这么久赚钱一直很稳定。站在一个搞钱人的角度来说，这个项目作为…

阅读更多...

Docker部署单节点Kafka

Docker部署单节点Kafka

文章目录Docker部署单节点Kafka参考镜像wurstmeister/zookeeper Overviewwurstmeister/kafka Overview部署单Brokerkafka 环境变量：启动与停止命令测试验证：参考文章Docker部署单节点Kafka 参考镜像 wurstmeister/zookeeper Overview docker pull wur…

阅读更多...

Hadoop总结——HDFS

Hadoop总结——HDFS

一、HDFS概述 1.1 HDFS产生背景随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件…

阅读更多...

记一次自定义starter引发的线上事故复盘

记一次自定义starter引发的线上事故复盘

前言本文素材来源于业务部门技术负责人某次线上事故复盘分享。故事的背景是这样，该业务部门招了一个技术挺不错的小伙子小张，由于小张技术能力在该部门比较突出，在入职不久后，他便成为这个部门某个项目组的team leader&#xff…

阅读更多...

计算机外设：显示器是如何工作的？

计算机外设：显示器是如何工作的？

本节我们将了解计算机的外设之一：显示器的底层工作原理。通过本节，你会知道电脑显示器是如何实时展示我们在计算机上的操作的，比如显示出一张“E”的字符。最后总结了计算机编程的本质，就是人们是通过设计，让字节代表不…

阅读更多...

超迷你机械臂机器人，YYDS

超迷你机械臂机器人，YYDS

真正的大师,永远都怀着一颗学徒的心！ 一、项目简介超迷你机械臂机器人，YYDS 核心板： REF核心板 REF底板（机械臂底座里面的控制器电路板） 步进电机驱动 Peak示教器文件： 3D模型设计源文件。 20步进…

阅读更多...

Python机器学习 | AI芯片调研

Python机器学习 | AI芯片调研

AI芯片调研 1、概念 AI芯片又叫AI加速器，专门用于处理人工智能应用中的大量计算任务的模块。注意：其他非计算任务仍由CPU处理 2、背景神经网络需要大量的矩阵运算，CPU和传统计算架构无法满足对于并行计算能力的需求，需要特殊定制的AI芯片（GPU、TPU、NPU、DPU等等）…

阅读更多...

Go Web项目学习之项目结构

Go Web项目学习之项目结构

风离不摆烂学习日志 Day4 — Go Web项目学习之项目结构创建项目配置代理下载加速 go 包代理 GOPROXYhttps://goproxy.cn,direct 本项目学习自： [github.com](https://github.com/gnimli/go-web-mini) 项目结构分层 ├─common # casbin mysql zap validator 等公…

阅读更多...

web概述18

web概述18

JSP JSP是Sun为了解决动态生成HTML文档的技术，通过Servlet输出简单html页面信息都非常不方便。如果要输出一个复杂页面的时候，就更加的困难，而且不利于页面的维护和调试。所以sun公司推出一种叫做jsp的动态页面技术来实现对页面的输出繁锁工…

阅读更多...

【设计模式】 - 结构型模式 - 适配器模式

【设计模式】 - 结构型模式 - 适配器模式

目录标题1. 前言适配器模式1. 概述2. 结构3. 实现3.1 类适配器模式（ 继承）--耦合度高代码实现3.2 对象适配器模式（聚合）代码实现类适配器与对象适配器的区别4. 适配器模式的优缺点1. 前言结构型模式描述如何将类或对象按某种布局…

阅读更多...

Borland Delphi 2005对Delphi语言的支持

Borland Delphi 2005对Delphi语言的支持

Borland Delphi 2005对Delphi语言的支持 Borland Delphi是Borland Delphi的最新版本，它为用户的Microsoft Windows操作系统和1.1本身的Microsoft.NET Framework版本提供了快速应用程序开发。Delphi Borland 2005被认为具有主要的三个不同的字符，如Win32…

阅读更多...

目标检测论文解读复现之十五：基于YOLOv5的光学遥感图像舰船目标检测算法

目标检测论文解读复现之十五：基于YOLOv5的光学遥感图像舰船目标检测算法

前言此前出了目标改进算法专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读最新目标检测算法论文&#xff0…

阅读更多...

关于商业智能BI，今天只谈这五点

关于商业智能BI，今天只谈这五点

数据在当下的价值不断提高，但数据本身只是一种资产，一旦超过一定数据量就很难被人类理解，所以想要利用数据，就必须将数据转化为信息和知识，让管理者看到的是信息，而不是数据堆砌。之前的文章里写过很多关…

阅读更多...

推荐文章

最新文章