EMNLP 2023 录用论文公布,速看NLP各领域最新SOTA方案

news2024/11/19 10:35:25

EMNLP 2023 近日公布了录用论文。

开始前以防有同学不了解这个会议,先简单介绍介绍:EMNLP 是NLP 四大顶会之一,ACL大家应该都很熟吧,EMNLP就是由 ACL 下属的SIGDAT小组主办的NLP领域顶级国际会议,一年举办一次。相较于ACL,EMNLP更偏向于NLP在各个领域解决方案的学术探讨。

今年的EMNLP 2023大会将于12月6日-10日在新加坡召开,我先整理了10篇录用论文来和大家分享,帮助NLP领域的同学了解今年的技术进展以及最新的SOTA方案,发论文更有方向。

需要论文原文及代码的同学看文末

1.Unlocking Context Constraints of LLMs: Enhancing Context Efficiency of LLMs with Self-Information-Based Content Filtering

标题:解锁LLM的上下文约束:利用基于自信息的内容过滤提高LLM上下文效率

内容:由于大型语言模型(LLM)在各种任务上都取得了显著的性能,因此受到了广泛的关注。但是,它们固定的上下文长度在处理长文本或进行长时间对话时碰到了挑战。本文提出了一种称为Selective Context的方法,该方法利用自信息量来过滤掉信息量较少的内容,从而提高固定上下文长度的效率。作者在文本摘要和问答等任务上验证了该方法的有效性,实验数据源包括学术论文、新闻文章和对话记录。

2.New Intent Discovery with Pre-training and Contrastive Learning

标题:基于预训练和对比学习的新意图发现

内容:在本文中,作者为新意图发现提供了两个重要研究问题的新解决方案:(1)如何学习语义表达表示,(2)如何更好地聚类表达。具体来说,作者首先提出了一个多任务预训练策略,以利用丰富的无标注数据以及外部标注数据进行表示学习。然后,作者设计了一个新的对比损失,以利用无标注数据中的自监督信号进行聚类。在三个意图识别基准测试中进行的大量实验证明,该方法无论是在无监督还是半监督场景中,都明显优于当前最先进的方法。

3.Dialogue for Prompting: a Policy-Gradient-Based Discrete Prompt Optimization for Few-shot Learning

标题:Dialogue for Prompting:基于策略梯度的少样本学习离散提示优化

内容:论文提出了一种基于策略梯度的离散提示词优化方法DP2O。作者首先基于GPT-4设计了多轮对话setAlignment策略来生成可读性提示集。然后,提出了一个高效的提示词筛选指标来识别高质量提示词,其复杂度为线性。最后,构建了一个基于策略梯度的强化学习框架,用于最佳匹配提示词和输入。

4.CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Data Limitation With Contrastive Learning

标题:CoCo:对比学习缓解数据稀缺下的机器生成文本检测与连贯性提升

内容:在本文中,作者提出了一个名为 CoCo 的基于连贯性的对比学习模型,以在低资源场景下检测可能的 MGT。受到语言特征的区分性和持久性的启发,作者将文本表示为一个连贯性图,以捕获其实体一致性,该连贯性图进一步由预训练模型和图神经网络编码。为了应对数据缺乏的挑战,作者采用对比学习框架,并提出改进的对比损失,以在训练阶段充分利用难样本。

5.Can Language Models Understand Physical Concepts?

标题:语言模型能理解物理概念吗?

内容:作者设计了一个覆盖视觉概念和具身概念的基准测试。结果显示,随着模型规模的增大,语言模型对某些视觉概念的理解确实提高了,但对很多基本概念仍然缺乏理解。相比之下,融合视觉信息的语言模型在具身概念上表现更好。这说明视觉表示中的丰富语义信息可以帮助语言模型获得具身知识。另外,作者还提出了一种从视觉语言模型向语言模型传递具身知识的知识蒸馏方法。

6.ImageNetVC: Zero-Shot Visual Commonsense Evaluation on 1000 ImageNet Categories

标题:ImageNetVC:在1000个ImageNet类别上进行零样本视觉常识评估

内容:论文提出了ImageNetVC,这是一个针对1000个ImageNet类别设计的细粒度人工标注数据集,专门用于跨类别的零样本视觉常识评估。利用ImageNetVC,作者深入研究了非模态PLMs和VaLMs的基本视觉常识,揭示了VaLMs的缩放定律和backbone模型的影响。此外,作者还研究了影响大规模模型视觉常识的因素,为开发融合视觉常识的语言模型提供了见解。

7.Label Words are Anchors: An Information Flow Perspective for Understanding In-Context Learning

标题:从信息流角度理解词内学习

内容:在本文中,作者通过信息流的视角来研究ICL的工作机制。作者发现,在示范例子中,标签词起着“锚点”的作用:(1)语义信息在浅层计算层处理过程中聚合到标签词的表达中,(2)标签词中聚合的信息为LLM的最终预测提供参考。基于这些见解,作者提出了一个锚点重新加权方法来改进ICL性能,一个示范压缩技术来加快推理,以及一个用于诊断GPT2-XL中的ICL错误的分析框架。

8.Can We Edit Factual Knowledge by In-Context Learning?

标题:我们能通过词内学习编辑事实知识吗?

内容:这篇论文探究了通过词内学习编辑语言模型中的事实知识。作者进行了全面的实证研究,结果显示词内知识编辑可以在不更新参数的情况下实现知识编辑,并取得与基于梯度的方法相当的成功率。与基于梯度的方法相比,词内知识编辑具有副作用更少的优势,包括对不相关事实过度编辑更少,以及对先前知识遗忘更少。该方法也表现出很好的可扩展性。

9.Beyond Labels: Empowering Human with Natural Language Explanations through a Novel Active-Learning Architecture

标题:超越标签:通过新颖的主动学习架构用自然语言解释赋能人类

内容:这篇论文提出一个新的主动学习架构,不仅提供分类标签,还同时生成自然语言解释来协助人类用户。该架构包含解释生成模块和数据选择模块。结果显示,与仅提供标签相比,该架构生成的自然语言解释可显著提高人类的分类准确率,特别是在少样本场景下。

10.Large Language Model Is Not a Good Few-shotInformation Extractor but a Good Reranker for HardSamples

标题:大语言模型不是一个好的少样本信息提取器,但是一个困难样本的好重排器

内容:这篇论文研究了大语言模型在少样本信息提取任务上的表现。大语言模型本身并不是很好的少样本信息提取器,但它们擅长对难样本进行重排。因此,作者提出了一种混合方法,使用小型预训练语言模型进行过滤,然后用大语言模型重排难样本。实验表明,这种方法可以在信息提取任务上取得显著改进,而且成本可控。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“EMNLP”获取论文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1088919.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高德地图选择点位改变图标

一.循环渲染点位 如图所示,紫色点位为动态循环点位 首先,我们请求完接口,返回点位 这里是全部代码 下方有拆分讲解 this.map.remove(this.marks) this.marks [] this.map.plugin([AMap.PlaceSearch], () > {var PlaceSearchOptions …

echarts一些配置项的使用

前言:我是自己最近写项目用到的,我做个整理; 一. 基本使用 1.具有大小(宽高)的div ,id唯一; 例如: <div id"crewEchart"></div> 2.在项目中引入: import * as echarts from "echarts"; 3.写一个关于他的方法,在mounted的时候调用: moun…

好用的爬取静态页面谷歌浏览器工具:Save All Resources

说明 该插件可以下载网页中的所有资源 使用方法

1513:受欢迎的牛(DFStarjan强连通分量)

信息学奥赛一本通&#xff08;C版&#xff09;在线评测系统 解析&#xff1a; tarjan算法&#xff0c;将有向图缩点&#xff0c;转换为拓扑图&#xff0c;并且统计出度为0的强连通分量&#xff1b; 如果这样的强连通分量只有一个&#xff0c;那么答案即为这个强连通分量中点的个…

fatal:Could not read from remote repository解决方法

Linux服务器如何连接GitHub&#xff1f; 生成SSH密钥 ssh-keygen -C “邮箱” -t rsa 存放位置一般是/root/.ssh/id_rsa 登录个人github&#xff0c;添加客户端生成的公钥 打开Settings&#xff0c;点击SSH and GPG keys&#xff0c;点击New SSH Key。Key中粘贴id_rsa.pub…

AutoGPT:让 AI 帮你完成任务事情 | 开源日报 No.54

Significant-Gravitas/AutoGPT Stars: 150.4k License: MIT AutoGPT 是开源 AI 代理生态系统的核心工具包。它采用模块化和可扩展的框架&#xff0c;使您能够专注于以下方面&#xff1a; 构建 - 为惊人之作打下基础。测试 - 将您的代理调整到完美状态。查看 - 观察进展成果呈…

2023年中国数据库一体机行业现状分析:随着IT发展,需求量增加[图]

数据库一体机服务器特指将数据库软件与标准硬件相结合的产物&#xff0c;其一般集数据处理、数据传输、数据存储3方面于一体&#xff0c;通过采用并行处理架构显著增加数据处理能力、可线性或准线性扩展的数据存储能力以及数据处理与数据存储之间的数据带宽&#xff0c;实现数据…

03 | Defining Query Methods 的命名语法与参数

Spring Data JPA 的最大特色是利用方法名定义查询方法&#xff08;Defining Query Methods&#xff09;来做 CRUD 操作&#xff0c;这一课时我将围绕这个内容来详细讲解。 在工作中&#xff0c;你是否经常为方法名的语义、命名规范而发愁&#xff1f;是否要为不同的查询条件写…

大模型微调学习

用好大模型的层次&#xff1a;1. 提示词工程(prompt engineering); 2. 大模型微调(fine tuning)为什么要对大模型微调&#xff1a; 1. 大模型预训练成本非常高&#xff1b; 2. 如果prompt engineering的效果达不到要求&#xff0c;企业又有比较好的自有数据&#xff0c;能够通过…

IOS17 轻松签全能签还能不能用?多开能否使用?升级后微信底栏消失怎么办?BY:后厂村路灯

从iphone15还没出就有小伙伴们追着问&#xff0c; 到现在也有人一直再问iOS17能不能用&#xff0c;看来换手机的人很多呀。 这里统一回答一下&#xff1a;“iOS17苹果签名可以用&#xff0c;多开也可以用”但是还是有些地方注意。 如果你是16系统直接升级刀17就可以&#xff…

20.1CubeMx配置FMC控制SDRAM【W9825G6KH-6】

本文使用stm32h723zgt6的fmc驱动sdram&#xff0c;实现内存扩展 sdram型号W9825G6KH-6 原理图&#xff1a; MCU引脚与SDRAM对应关系 引脚说明&#xff1a; SDRAM引脚&#xff1a; DQ[15:0]:数据线&#xff1b;数据位宽16 A[12:0]:地址线&#xff1b;行地址A[0:12]&#xff…

10月13日丨第十六届智慧城市大会《实景三维技术创新与应用》论坛日程抢先看!

第十六届智慧城市大会 智慧城市是数字中国、智慧社会的核心载体&#xff0c;是数字时代城市发展的高级形态。由中国服务贸易协会中国测绘学会、中国遥感委员会主办的第十六届智慧城市大会&#xff0c;将以“数实融合开放创新智引未来为主题&#xff0c;邀请行业主管单位和智慧…

【UE 插件】UE4 虚幻引擎 插件开发(带源码插件打包、无源码插件打包) 有这一篇文章就够了!!!

目录 0 引言1 快速入门1.1 新建插件的前提1.2 创建插件步骤1.3 打包插件 2 无源代码的插件制作3 插件详细介绍3.1 插件的使用方法3.1 UE 预置插件模版3.1.1 空白3.1.2 纯内容3.1.3 编辑器独立窗口3.1.4 编辑器工具栏按钮3.1.5 编辑器模式3.1.6 第三方库3.1.7 蓝图库 3.2 插件中…

milvus和相似度检索

流程 milvus的使用流程是 创建collection -> 创建partition -> 创建索引(如果需要检索) -> 插入数据 -> 检索 这里以Python为例, 使用的milvus版本为2.3.x 首先按照库&#xff0c; python3 -m pip install pymilvus Connect from pymilvus import connections c…

Java初学者容易犯的错误,Java程序员必须知道的学习路线

万事开头难&#xff0c;java 编程的初学者常常会遇到各种各样的问题。对于自学的读者来说&#xff0c;则是需要花费更多的时间、精力来解决这些问题&#xff0c;而且一旦遇到的问题几天都得不到解决&#xff0c;往往会带来很大的挫败感。 所以本节介绍一些初学者经常出现的错误…

Flutter笔记:电商中文货币显示插件Money Display

Flutter笔记 电商中文货币显示插件 Money Display 作者&#xff1a;李俊才 &#xff08;jcLee95&#xff09;&#xff1a;https://blog.csdn.net/qq_28550263 邮箱 &#xff1a;291148484163.com 本文地址&#xff1a;https://blog.csdn.net/qq_28550263/article/details/1338…

【数据结构】什么是线性表?

&#x1f984;个人主页:修修修也 &#x1f38f;所属专栏:数据结构 ⚙️操作环境:Visual Studio 2022 目录 线性表的定义 生活中常见的线性表 结语 线性表的定义 线性结构的特点: 在数据元素的非空有限集中: 存在唯一的一个被称作"第一个"的数据元素;存在唯一的一个…

Linux系统编程_文件编程第1天:打开、写入、读取、关闭文件等编程

1. 文件编程概述&#xff08;399.1&#xff09; 内容超多&#xff1a; 文件系统原理及访问机制文件在内核中的管理机制什么是文件信息节点inode文件的共享文件权限&#xff0c;各种用户对其权限。。。。。。 应用为王&#xff0c;如&#xff1a; 账单游戏进度配置文件等 关心如…

WEditor的安装和使用

WEditor 编辑器能够提供辅助编写脚本&#xff0c;查看组件信息&#xff0c;调试代码等功能。 Screenshot 安装 依赖项目 Python3.6 uiautomator2facebook-wda Only tested in Google Chrome, IE seems not working well. pip3 install -U weditor # uiautomator2, faceboo…