ACL2023 Prompt 相关文章速通 Part 1

news2025/1/18 13:57:08

Accepted Papers

link: ACL2023 main conference accepted papers

文章目录

  • Accepted Papers
    • Prompter: Zero-shot Adaptive Prefixes for Dialogue State Tracking Domain Adaptation
    • Query Refinement Prompts for Closed-Book Long-Form QA
    • Prompting Language Models for Linguistic Structure
    • Zero-shot Approach to Overcome Perturbation Sensitivity of Prompts
    • PMAES: Prompt-mapping Contrastive Learning for Cross-prompt Automated Essay Scoring
    • Exploring Lottery Prompts for Pre-trained Language Models
    • Marked Personas: Using Natural Language Prompts to Measure Stereotypes in Language Models
    • MultiTool-CoT: GPT-3 Can Use Multiple External Tools with Chain of Thought Prompting
    • END

Prompter: Zero-shot Adaptive Prefixes for Dialogue State Tracking Domain Adaptation

将 soft prompt 以及 Hyper Prompt 架构用在了对话情景追踪(DST)任务上,详见这篇博客。

Query Refinement Prompts for Closed-Book Long-Form QA

文章链接

又是一个没见过的任务,Closed-Book Long-Form QA,字面意思就是闭卷长QA。显而易见有两个约束,一个是闭卷,也就是LLM只能基于预训练的知识做回答;另一个是长,这里指QA的A即回答比较长。这个任务的实例由作者给出:
在这里插入图片描述
这个任务的问题就比较笼统,答案是可以说很多的,作者就将其总结为多角度回答,具体来讲就是回答一个这样的问题分为3步:

  1. 将这个笼统的大问题拆分成几个不同方面的子问题;
  2. 回答不同的子问题;
  3. 将子问题的答案组织成一个连贯的长回答。

作者也是受CoT的启发,将“拆分子问题”这个过程显式地加在输出里,让LLM产生更好的输出。实际上做法很经典,用几个人工的demo做few-shot,从demo库里面按照相似度找跟当前问题最相似的demo做few-shot。

思路是CoT的,应用在了比较小众的一个问题上。

Prompting Language Models for Linguistic Structure

文章链接

在这里插入图片描述
任务是给PLM样例让PLM给句子的每个单词打词性标签,从而研究PLM是否理解的语言,还是只是单纯的缝合训练数据。结论是PLM的语言能力应该是比单纯的记忆训练数据高的。

Zero-shot Approach to Overcome Perturbation Sensitivity of Prompts

文章链接

给一个base prompt,该工作生成一个更好的prompt,同时保证zero-shot,即不使用验证集来评估生成的prompt的好坏,而是用new metric来选出更好的prompt。这个setting还是挺好的,确实很多prompt generate的工作需要验证集来评估生成的prompt的好坏从而筛选。

在这里插入图片描述
然而细细观之,作者的做法比较复古,作者说主要是针对低资源场景的,因此模型也只用了BERT,任务也仅考虑了情感分析任务。

首先生成Prompt的方式是类似GrIPS的操作,在单词层面对base prompt进行修改,分为换位置(prompt放在input前面/后面)、加连词(prompt在前面时用because连接,放在后面时用so连接)以及用BERT paraphrase某个token。

打分是重头戏的部分,作者的打分基于一个假设:好的prompt应该对一些“关键词”敏感,比如说“This film is great.”的情感是positive, 那在这个“great”变成反义词,如“terrible”的时候,情感就该反转变成negative。类似地,变成同义词这个情感就该不变。由此,作者就通过prompt对关键词的敏感程度来评判prompt的好坏,而不需要知道真正的label是什么。

看下来感觉这个操作类似于数据增强,作者的这个想法还是很有意思的,但应用范围目前还只局限于二分类任务。同时我认为带有“关键词”的输入本身就比较简单,都能找到关键词了那么其实离正确答案也不远了。但作者的立意比较新,而且基于BERT,主打low resource。

PMAES: Prompt-mapping Contrastive Learning for Cross-prompt Automated Essay Scoring

文章链接

这篇好像跟prompt engineer的prompt不是一个意思啊,是为文章进行打分的,不知道essay的prompt是个什么东东?

Exploring Lottery Prompts for Pre-trained Language Models

文章链接,简洁但有效的搜索并集成prompt的方法,详见这篇博客

Marked Personas: Using Natural Language Prompts to Measure Stereotypes in Language Models

文章链接

看名字就知道是偏人文的,主要考察LLM对人类群体的刻板印象,大体上的思路是让LLM生成对某个种族或者别的群体的描述,分析其中的情感,就不细说了。

MultiTool-CoT: GPT-3 Can Use Multiple External Tools with Chain of Thought Prompting

文章链接
在这里插入图片描述
用Few-shot-CoT的方式教会LLM使用外部工具,样例中有一些特别的token,在LLM输出这些token的时候就会调用外部工具,比如计算器和化学反应工具,弥补LLM的专业技能。方法不复杂,作者称他们是SOTA。

END

暂时先更到这里,剩下的文章以后再看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/926141.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

亚马逊评论后多久显示?有没有快速留评的方法?

通常情况下,亚马逊上的产品评论会在提交后的一到两天内显示出来。然而,实际的显示时间可能会因多种因素而有所不同,包括评论审核时间、产品销量、亚马逊服务器负载等等。在某些情况下,评论可能会更快地显示出来,而在其…

Ubuntu 22.04.3 LTS 维护更新发布

导读近日消息,Canonical 今天发布了代号为 Jammy Jellyfish、长期支持的 Ubuntu 22.04 第 3 个维护版本更新,距离上个版本相隔 6 周时间。 Ubuntu 22.04.3 LTS 最大的亮点在于内核升级到 Linux Kernel 6.2,此外 Mesa 图形堆栈也升级到 23.0.…

徐庆臣(黑客洗白者)个人介绍

徐庆臣(黑客洗白者),具备10年以上研发、渗透测试和网络信息安全领域从业经验,具有较强的网络安全管理、技术实战项目经验。曾就职于新浪、用友等互联网知名企业,并担任项目经理和安全技术总监等负责人角色,…

Modelica由入门到精通—为什么要学习Modelica语言

1.为什么要学习Modelica语言 本人正在研究Modelica 多领域统一建模仿真语言,特此做学习入门介绍,希望可以帮助需要的小伙伴。 文章目录 1.为什么要学习Modelica语言一、背景二、系统建模与仿真2.1 系统仿真与系统模型2.2 仿真价值与可靠性 三、物理建模…

kettle开发-Day42-远程执行作业

目录 前言: 一、远程执行 1、先看定义 2、前置条件 2.1网络畅通 2.2数据库DB连接一致 二、实战案例-Windows 1、初始配置-被远程端 1.1启动carte服务 1.2cmd 命令启动carte服务 2、初始化-远程端 3、实际应用 3.1、错误案例 3.2、正确案例 三、总结 前言&…

react import 引用失效 node_modules/@types/react/index.d.ts not a module.ts

问题描述 react ts的项目,正常使用vs code打开, 先运行 npm install 安装依赖过后 结果所有的react引用依旧标红,如下图所示: 点击红线 show problem(查看问题),提示node_modules/types/react/index.d.ts not a mod…

day-31 代码随想录算法训练营(19)贪心part01

455.分发饼干 思路一:贪心思路,大饼干先分给大胃口 思路二:小饼干先分给小胃口 376.摆动序列 分析摆动:记 presub 为前面与当前数之差,lastsub 为当前与后面数之差 思路: 1.正常摆动时,需要 …

Talk | 上海交通大学官同坤:识别任意文本,隐式注意力与字符间蒸馏在文本识别中的应用

本期为TechBeat人工智能社区第525期线上Talk! 北京时间8月23日(周三)20:00,上海交通大学博士生—官同坤的Talk已准时在TechBeat人工智能社区开播! 他与大家分享的主题是: “隐式注意力与字符间蒸馏在文本识别中的应用”,分享了识别…

基于Jenkins+Git+Ansible 发布PHP 项目-------从小白到大神之路之学习运维第88天

第四阶段提升 时 间:2023年8月25日 参加人:全班人员 内 容: 基于JenkinsGitAnsible 发布PHP 项目 目录 基于JenkinsGitAnsible 发布PHP 项目 一、部署PHP 运行环境 二、主机环境配置 三、Tomcat主机操作: 四、Jenkins主…

【PHP】echo 输出数组报Array to string conversion解决办法

代码&#xff1a; <?PHP echo "Hello World!";$demoName array("kexuexiong","xiong");echo "<pre>";var_dump($demoName);echo $demoName; print_r($demoName);echo "</pre>"; ?>输出结果&#xff1…

【点云分割】points3d框架学习01 —— 安装和配置

安装 $ pip install torch1.12.1cu113 torchvision0.13.1cu113 torchaudio0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113 $ pip install torch-points3d $ pip install ipython $ pip install trame $ pip install h5py $ pip install gdown案例 from to…

自动化测试 —— Pytest fixture及conftest详解

前言 fixture是在测试函数运行前后&#xff0c;由pytest执行的外壳函数。fixture中的代码可以定制&#xff0c;满足多变的测试需求&#xff0c;包括定义传入测试中的数据集、配置测试前系统的初始状态、为批量测试提供数据源等等。fixture是pytest的精髓所在&#xff0c;类似u…

AD(第三部分---PCB封装库的创建方法及现有封装调用)

封装库可以理解成实物图 PCB封装是我们电子设计图和实物图之间的映射体&#xff0c;具有精准数据的要求。 16.常见CHIP封装的创建(电阻 容SOT二极管) 下文做的是1N589W二极管的封装库 首先要找到产品规格书&#xff0c;重要部分(三视图尺寸&#xff0c;分别是顶视图&#xf…

php插件Workerman聊天室示例

chat.php内容如下 <?php//使用workerman&#xff0c;只需引入这个文件require_once "workerman-4.0/Autoloader.php";//创建服务器&#xff0c;监听3000端口$wsServernew \Workerman\Worker("websocket://127.0.0.1:3000");$wsServer->onConnectfu…

Android Studio开发之路 (五)导入OpenCV以及报错解决

一、步骤 官网下载opencv包&#xff08;我下的是4.7.0&#xff09;并解压&#xff0c;openvc官网 先创建一个空项目&#xff0c;简单跑一下能正常输出helloworld 点击file->new->Import Module选择解压之后的opencv-android-sdk文件夹中的SDk文件夹&#xff0c; modu…

城市管理革命,AI药方解决城市病烦恼!

引言&#xff1a;现代中文语境的“城市”是中国近代逐渐与世界接轨的舶来词语&#xff0c;根据“city”翻译而来&#xff0c;由“城”与“市”组合而成&#xff0c;其中“城”是由军事防御产生的&#xff0c;属于行政地域概念&#xff0c;“市”是由商品交换&#xff08;市场&a…

[系统] 电脑突然变卡 / 电脑突然** / 各种突发情况解决思路

今天来公司办公&#xff0c;开机之后发现电脑出现各种问题&#xff0c;死机、卡顿、点什么都加载&#xff0c;甚至开一个文件夹要1分钟才能打开&#xff0c;花了2个小时才解决&#xff0c;走了很多弯路&#xff0c;其实早点想通&#xff0c;5分钟就能解决问题&#xff0c;所以打…

无人机甚高频无线电中继通讯U-ATC118

简介 甚高频无线电中继通讯系统使用经过适航认证的机载电台连接数字网络传输模块&#xff0c;通过网络远程控制无缝实现无人机操作员与塔台直接语音通话。无人机操作员可以从地面控制站远程操作机载电台进行频率切换、静噪开关、PTT按钮&#xff0c;电台虚拟面板与真实面板布局…

肺功能指标 fev1 frc 肺指标 呼吸参数 fev1 pre-bd

肺功能报告不会看&#xff1f;手把手教你识别各种参数&#xff01; - 丁香园 (dxy.cn) pred是predict的缩写&#xff0c;中文的解释意思为预计&#xff0c;fev1&#xff05;pred是患者做肺功能检查时体现出来。患者行肺功能检查时做最大吸气至肺总量后&#xff0c;开始做用力呼…

C++学习|CUDA编程入门

CUDA编程入门 GPU介绍CUDA 介绍NVCC——CUDA编译器cu/cuh文件——CUDA文件核函数——操作GPU线程模型——CUDA逻辑结构CUDA程序运行流程CUDA内存管理 GPU介绍 GPU&#xff08;Graphics Processing Unit&#xff0c;图形处理器&#xff0c;显卡&#xff09;&#xff1a;最早主要…