10分钟揭秘摘要抽取:探索信息提炼的奥秘

news2024/12/27 14:37:45

Introduction

本文分别介绍摘要数据集,摘要分类,摘要架构,相关baseline。并介绍若干篇EMNLP2023论文,介绍其最新工作。

1.数据集

1.1 文本摘要

DUC/TAC 英文|数据集较小|适用于传统摘要方法的评估

Gigaword 英文|启发式规则构成|适用于深度神经网络方法

CNN/DailyMail 多句摘要数据|常用于生成式摘要方法

NYTAC 长度较短|可用于文本摘要、信息检索、信息抽取

ASNAPR 商品评论数据|可用于评论和情感的摘要

LCSTS 中文|新浪微博数据|短文本|深度网络摘要方法 --哈工大

NLPCC 中文,文本摘要、情感分类、自动问答等任务 --字节跳动

NLPCC分版本
2017,2020,2021

1.2 对话摘要

两个或两个以上的对话参与者

AMI 英|规模小|会议多模态数据|可用于抽取式与生成式摘要

SAMSum英|规模大|闲聊数据|人工标注|适用于生成式摘要

ICSI 英|规模较小|会议语料库

1.3 From ATS Survey

在这里插入图片描述

1.4 From Hugging Face

在这里插入图片描述

2.摘要分类

在这里插入图片描述

在这里插入图片描述

3.模型架构

hugging face

在这里插入图片描述

微调T5 Small 做文本摘要

url:https://huggingface.co/Falconsai/text_summarization

在这里插入图片描述

4.baseline

评估指标 - Rouge

在这里插入图片描述

在这里插入图片描述

5.Recently Work From EMNLP

在这里插入图片描述

1.Is ChatGPT a Good NLG Evaluator? A Preliminary Study

自然语言生成(NLG)评估指标与人类判断的相关性很差,作者探索ChatGPT是否是一个很好的NLG评估指标。

结论:实验结果表明,与以前的自动度量相比,ChatGPT在大多数情况下与人类判断达到了最先进或竞争的相关性。此外,我们发现ChatGPT评估器的有效性可能会受到元评估数据集创建方法的影响。对于很大程度上依赖于参考而产生的元评估数据集,ChatGPT评估器可能会失去其有效性。

2. Zero-Shot Cross-Lingual Summarization via Large Language Models

评估大模型跨语言摘要(CLS)的 zero-shot 能力

在这里插入图片描述

3.SimCSum: Joint Learning of Simplification and Cross-lingual Summarization for Cross-lingual Science Journalism

作者通过引入一种结合NLP任务的新颖的多任务学习架构,扩展了跨语言科学新闻的研究。作者的方法是联合训练SIMCSUM中的两个高级NLP任务来生成跨语言科普摘要。

在这里插入图片描述

4. Extract, Select and Rewrite: A Modular Sentence Summarization Method

作者提出一种三阶段abstractive 句子方法 - Extract-Select-Rewrite (ESR),

作者将摘要分解为三个阶段:

(i)知识提取,我们使用现成的工具从文本中提取关系三元组;

(ii)内容选择,其中选择三元组的子集;

(iii)重写

4.1ESR步骤

在这里插入图片描述

4.2 实验结果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.3 1The codes are available on https://github.com/SeanG-325/ESR.

5. Summarization-based Data Augmentation for Document Classification

尽管预训练语言模型在自然语言理解任务中很流行,d但由于数据稀疏性问题,理解冗长的文本(如文档)仍然具有挑战性。

受人类通过阅读较短的文本来发展理解冗长文本的能力的启发,作者提出了一种简单而有效的基于摘要的数据增强方法summag,用于文档分类。

在这里插入图片描述

首先通过汇总原始训练样例的输入来获得目标文档分类任务的易于学习的样例,同时有选择地合并原始标签以符合汇总的输入。

然后,我们使用生成的伪示例来执行课程学习。

提供IMD数据集

在这里插入图片描述

5.1We release our code and data at https://github.com/etsurin/summaug

5.2 实验结果

作者针对

在这里插入图片描述

6.In-context Learning of Large Language Models for Controlled Dialogue Summarization: A Holistic Benchmark and Empirical Analysis

控制对话摘要大语言模型的语境学习:整体基准与实证分析

作者提出目前若干问题:

LLM在少数镜头Abstractive对话摘要背景下的表现仍未得到充分探索。本研究在几个镜头框架内评估了SAMSum数据集上的各种最先进的LLM。我们在受控环境(实体控制、长度控制和以人为中心的规划)和非受控环境中评估这些模型,并在少数镜头对话总结中建立一个全面的基准。我们的研究结果为对话摘要的质量和模型可控性提供了新的见解,为今后的对话摘要研究提供了重要的参考。

6.1 实验结果

表1 为实验模型

表2 为实验数据集

表4 - 7 表示不同对比实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

6.3 结论

本研究的一个局限性是,由于硬件的限制,只有小于10B个参数的llm被实验。针对这一问题,我们发布了评价代码,以便于后续的研究。

同时,本工作中的控制信号为oracle,这意味着我们假设用户提供了指示性关键字以包含在摘要中。

有从对话中提取关键字的自动方法(He et al, 2022),但这不是重点,因此不在本研究中讨论。

由于时间限制,我们采用GPT-3进行自动定性评价。虽然基于gpt的评估已被证明在某些评估任务中具有竞争力,但人工评估的必要性仍然存在。

7. From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

对GPT-4摘要做出总结

8.Generating Extractive and Abstractive Summaries in Parallel from Scientific Articles Incorporating Citing Statements

作者开发了一个模型,利用源文献和引用文献中的信息来总结科学文献。

模型如下,未开源代码

在这里插入图片描述

9.Supervising the Centroid Baseline for Extractive Multi-Document Summarization

https://github.com/Priberam/cera-summ

作者通过在句子选择中添加一个束搜索过程和一个质心估计注意力模型来进一步改进它,提升性能。作者在几个多文档摘要数据集(包括多语言场景)进行验证。

实验结果如下

在这里插入图片描述

10. DebateKG – Automatic Policy Debate Case Creation with Semantic Knowledge Graphs

https://huggingface.co/spaces/Hellisotherpeople/DebateKG

自然语言处理系统在解决竞争性辩论中发现的问题方面具有适用性。在竞争性辩论中,最重要的任务之一是辩手创造高质量的辩论案例。

作者证明了有效的辩论案例可以在论证语义知识图上使用约束最短路径遍历来构建。我们在一种名为“政策辩论”的美国竞争性辩论的背景下研究这种潜力,这种辩论已经有了一个名为“DebateSum”的大规模数据集。

11.Improving Multi-Stage Long Document Summarization with Enhanced Coarse Summarizer

多阶段长文档摘要是一种从长文档中捕获重要信息的灵活方法,它将长文档分成多个部分,每个部分用于在多个阶段生成粗摘要,然后使用最后一个粗摘要生成最终摘要。然而,即使粗汇总影响最终汇总,现有多阶段汇总中的粗汇总器也是使用对生成最终汇总无用的数据段进行粗训练的。

本文提出了一种多阶段长文档摘要的新方法。该方法首先生成新的片段对,确保它们都与生成最终的摘要相关。然后,我们将对比学习结合到粗摘要器的训练中,它试图在训练过程中最大化源片段和目标摘要之间的相似性。通过在六个长文档摘要数据集上的大量实验,我们证明了我们提出的方法不仅增强了现有的多阶段长文档摘要方法,而且达到了与最先进的方法相当的性能,包括使用大型语言模型进行长文档摘要的方法。

在这里插入图片描述

The proposed method is publicly available at https://github.com/Jinhyeong-Lim/Summ-N-ECS

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1620416.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构与算法】8.二叉树的基本概念|前序遍历|中序遍历|后序遍历

📚博客主页:爱敲代码的小杨. ✨专栏:《Java SE语法》 | 《数据结构与算法》 | 《C生万物》 |《MySQL探索之旅》 |《Web世界探险家》 ❤️感谢大家点赞👍🏻收藏⭐评论✍🏻,您的三连就是我持续更…

【Linux】iptables的应用

iptables 防火墙 防火墙是一种网络安全系统,它位于内部网络与外部网络(如互联网)之间,通过实施预定义的安全策略来控制网络间的通信。防火墙的主要目标是保护内部网络资源免受未经授权的访问、攻击或潜在威胁,同时允…

经风靡全球的 PHP 为何逐渐失去优势?

TIOBE 编程语言人气指数发布更新,并提出“PHP 的魔力是否正在消散?”的灵魂拷问。今年 4 月,PHP 在 TIOBE 编程语言指数榜上仅位列第 17,“成为其有史以来的最低排位”。 暴露 PHP 人气急剧下滑的还不只是 TIOBE 榜单。在年度 Sta…

到底什么是爬虫

1. 引言 在数据驱动的世界里,网络爬虫(Web Crawling)技术扮演着获取和处理网上数据的关键角色。无论是为了数据分析、机器学习项目的数据集构建还是简单地监测网页变化,学习如何创建一个基本的网页爬虫可以大大提升你的工作效率和…

JAVASE基础语法(异常、常用类)

一、异常 1.1 什么是异常 异常就是指不正常。是指代码在运行过程中可能发生错误,导致程序无法正常运行。 package com.atguigu.exception;public class TestException {public static void main(String[] args) {int[] arr {1,2,3,4,5};System.out.println(&quo…

【c++】探究C++中的list:精彩的接口与仿真实现解密

🔥个人主页:Quitecoder 🔥专栏:c笔记仓 朋友们大家好,本篇文章来到list有关部分,这一部分函数与前面的类似,我们简单讲解,重难点在模拟实现时的迭代器有关实现 目录 1.List介绍2.接…

CSS3新增特性(二)

四、2D 转换 • 属性名:transform (可用于制作2D转换,也可用于制作3D转转换;2D转换是平面上的转换,3D转换是在三维立体空间的转换) • 作用:对元素进行水平或垂直方向的移动、缩放、旋转、拉长…

你们项目日志是如何处理的???

ELK日志采集系统 1.什么是ELK ELK 是一套流行的数据搜索、分析和可视化解决方案,由三个开源项目组成,每个项目的首字母合起来形成了“ELK”这一术语: Elasticsearch (ES): Elasticsearch 是一个基于 Apache Lucene 构建的分布式、实时搜索与…

【Python性能优化】list、array与set

list、array与set 详述测试代码 详述 本文对比 list 与 set 在插入和取值时的性能差异,以提供一条什么时候该选择什么数据类型的建议。先上结果: array 与 list 的不同: 内存方面 array 是 C array 的包装,它直接存储数据&#xf…

Vu3+QuaggaJs实现web页面识别条形码

一、什么是QuaggaJs QuaggaJS是一个基于JavaScript的开源图像识别库,可用于识别条形码。 QuaggaJs的作用主要体现在以下几个方面: 实时图像处理与识别:QuaggaJs是一款基于JavaScript的开源库,它允许在Web浏览器中实现实时的图像…

授权协议OAuth 2.0之通过OIDC实现SSO

写在前面 本文来一起看下OIDC(openid connect)相关内容。 1:什么是OIDC OIDC的全称是openid connect,和OAuth2.0一样,也是属于协议和规范的范畴。OAuth2.0是一种授权协议,即规定了what you can do的内容…

kafka部分partition的leader=-1修复方案整理

kafka部分partition的leader-1修复方案整理 1. 背景说明2. 修复测试2.1 创建正常的topic并验证生产和消费2.2 停止kafka模拟leader-12.3 修复parition2.4 修复完成验证生产消费是否恢复 3. 疑问和思考3.1 kafka在进行数据消费时,如果有partition的leader-1&#xff…

MySQL基础之多表操作(多表查询,事务,索引)

目录 一、多表关系1.1 一对多1.2 外键约束1.3 一对一1.4 多对多 二、多表查询2.1 测试数据准备2.2 笛卡尔积2.3 内连接2.4 外连接2.5 子查询1.标量子查询2.列子查询3.行子查询4.表子查询 三、事务3.1 问题场景引入3.2 概念3.3 事务操作3.4 事务的四大特性ACID 四、索引4.1 概念…

人工智能高速发展 苹果能否赶上AI热潮

近年来,人工智能高速发展,科技大佬们竞相布局人工智能赛道。苹果虽然“晚”了一步,但也在不断追赶这股热潮。随着AI技术不断发展,这项技术已经成为手机发展的新风向标,甚至2024年被视为AI手机元年。 众多手机厂商铆足了…

vue做导入导出excel文档

系统中经常会遇到要实现批量导入/导出数据的功能,导入就需要先下载一个模板,然后在模板文件中填写内容,最后导入模板,导出就可能是下载一个excel文件。 1、导出 新建一个export.js文件如下: import {MessageBox,Mes…

【Xilinx】时序约束学习 TIMING-2: 基准时钟源管脚无效

在错误的管脚 <pin_name> 上创建了基准时钟 <clock_name>。建议仅在适当的时钟根&#xff08;不含时序弧的输入端口或原语输出管脚&#xff09; 上创建基准时钟。 描述 基准时钟必须在时钟树的源时钟上定义。例如&#xff0c; 源时钟可能是设计的输入端口。如果在…

4.20.1 深度神经网络提高放射科医生在乳腺癌筛查中的表现

新颖的两阶段神经网络&#xff0c;用于将全局和局部信息与适当的训练过程结合起来。这使我们能够使用非常高容量的块级网络从像素级标签中学习&#xff0c;同时网络也可以从宏观乳房级标签中学习。模型可以生成可解释的热图&#xff0c;指示可疑发现的位置。即使在拥有大量图像…

Neo4j数据库(二)

目录 WHERE子句 简单WHERE子句语法 复杂WHERE子句语法 DELETE删除 删除节点 DELETE节点子句语法 REMOVE删除 删除节点/关系的属性 REMOVE属性子句语法 SET子句 SET子句语法 WHERE子句 像SQL一样&#xff0c;Neo4j CQL在CQL MATCH命令中提供了WHERE子句来过滤MATCH查询…

VMware-Linux切换桥接模式上网教程(超详细)

这里写目录标题 1. 虚拟机关机2. VMware 虚拟网络配置2.1 检查是否存在 VMnet02.2 修改桥接模式2.3 修改Linux虚拟机网络适配器 3. Linux 系统配置3.1 修改系统网卡配置3.1.1 配置项含义解释3.1.2 查看物理机网络信息3.3.3 修改配置 3.2 重启服务 4. 测试网络连接情况5. 注意事…

Oracle Analytics BIEE 操作方法(四)仪表盘导出“区域”不换行也不合并居中的方法

1 分析 取消所有区域内列格式里面的换行 2 仪表盘 点击“工具” 打印和导出选项 设置固定列宽&#xff08;范围是&#xff1a;0-300&#xff09;