chatgpt 数据相关应用论文策略简介

news2025/1/2 2:56:45

hatGPT等预训练大模型,一个核心能力就是经过海量语料的训练加上强化学习的引导,其具有强大的接近人类的文本生成能力。这个能力的一大用途,就是可以为我们生产数据或者标注数据,再基于这些数据训练我们自己的模型。

On the Feasibility of Specialized Ability Extracting for Large Language Code Models

这篇文章在代码总结,代码翻译,代码生成三种任务上,研究了如何利用预训练黑盒大模型生成训练数据。整体分成3个部分:首先人工基于多种类型的prompt生成问题;然后将问题输入到大模型中,产出答案;最后人工检查这些答案是否有效。获取到的所有有效答案,作为训练数据,训练下游的模型。通过这种方式生成的数据训练模型,可以达到和原大模型近似,甚至超过原大模型的效果。
在这里插入图片描述

AugGPT: Leveraging ChatGPT for Text Data Augmentation

这篇文章利用ChatGPT解决小样本场景下的模型训练问题。主要思路也是数据增强,将原始的少量样本,结合合适和prompt,输入到ChatGPT中,让ChatGPT生成语义相似的增强数据。在得到ChatGPT的增强数据后,使用原始数据+增强数据训练下游的BERT模型。
在这里插入图片描述
文中设计的prompt也很简单,就是告诉ChatGPT生成下面句子的一个语义相似版本。文中对比了使用ChatGPT进行数据增强,和使用其他传统方法(随机增删词、回译等)进行数据增强的效果对比,使用ChatGPT的增强数据取得了更优异的效果。

在这里插入图片描述

ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks

这篇文章对比了在各项NLP标注任务中,使用ChatGPT进行样本标注,对比使用人工进行样本标注的准确率,ChatGPT的标注效果已经超过了人工标注。并且使用ChatGPT进行标注,每条成本也只有大概0.003美元,比MTurk这种众包标注平台便宜20倍(看来ChatGPT对标注平台一定会造成不小的冲击)。

在这里插入图片描述

Is GPT-3 a Good Data Annotator?

这篇文章是2022年年底发表的,探讨了GPT3在训练数据标注和生成上的能力。文中尝试了多种类型的利用GPT-3进行数据标注的方法。包括利用prompt让GPT3为无标签数据打标、直接用prompt让GPT3生成有标签数据、利用维基百科引导GPT3生成领域特定样本等方法。文中使用这些方法在句子级别和token级别的任务上分别进行了对比,验证了GPT-3进行数据标注的能力,在文本分类任务上取得比较好的效果,但是在tagging任务上的效果不如文本分类。

在这里插入图片描述

InPars: Data Augmentation for Information Retrieval using Large Language Models

这篇文章主要针对的是检索任务,判断document和query的关系。其核心做法是,利用预训练语言模型生成训练document-query的正样本对作为训练数据。整个过程如下图。利用预训练语言模型的in-context learning能力,构造输入文本,包括多个document-query对例子,以及一个待生成训练数据的document,让语言模型生成query。从语言模型生成的多个query中,根据模型打分概率选择topK个query,作为当前document的正样本。利用这些模型生成的document-query对,作为训练数据,输入到下游模型中进行匹配任务的训练。
在这里插入图片描述
在实验中,文中尝试了如下两种类型的prompt来生成document对应的正例query。第一种方法给出简单的document+query例子。第二种方法在第一种方法的基础上,给了模型good question和bad question的例子。对于负样本,使用query+BM25检索出document,随机选择一个作为负样本。

在这里插入图片描述
整体的实验效果如下表,文中提出的模型为monoT5,从实验结果可以看出,利用文中的方法生成的训练数据,有助于检索模型的效果提升。
在这里插入图片描述

Large Language Models Are Human-Level Prompt Engineers

这篇文章利用预训练大模型生成合适的prompt。核心思路是利用训练数据构造demonstration,将其输入到预训练语言模型中,生成大量的prompt候选。文中提出了3种类型的prompt生成方法,并使用Execution accuracy或Log probability来评估prompt好坏,主要就是看使用当前prompt各个样本的打分效果好坏。用这种方式,可以将prompt生成和答案预测,都交给预训练模型自己完成。
在这里插入图片描述

Promptagator: Few-shot Dense Retrieval From 8 Examples

这篇文章主要针对小样本场景下的检索任务,利用少量的样本,结合预训练大模型来生成样本,以训练检索模型。文中的核心是prompt based query generation,利用少量query-passage样本和prompt构造输入,让预训练大模型根据语料库中的document生成相关的query,以此构造一批数据集,并基于这些数据训练检索模型。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/476906.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa 十天免登录的功能

B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa 十天免登录的功能 文章目录 B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa 十天免登录的功能每博一文案1. Cookie 的概述2. session 与 Cookie 之间的联系:3. Cookie 的作用&#xff…

Android 9.0 原生SystemUI下拉通知栏UI背景设置为圆角背景的定制(一)

1.前言 在9.0的系统rom产品定制化开发中,在原生系统SystemUI下拉状态栏的通知栏的通知背景默认是白色四角的背景, 由于在产品设计中,需要把四角背景默认改成圆角背景,所以就需要分析系统原生下拉通知栏的每条通知的默认背景, 然后通知显示流程,设置默认下拉状态栏UI中的…

LaTeX基础文本排版命令

LaTeX基础文本排版命令 1. 字体大小2. 字体的粗体与斜体2.1. 粗体2.2 斜体2.3 同时启用粗体和斜体 3. 空格长度4. 高度与宽度尺寸 在LaTeX中,文本排版可以通过简单的命令实现,这些命令可以控制字体大小、粗体与斜体、空格、行高和宽度等方面,…

【C++】模板进阶:非类型模板参数模板的特化模板分离编译

文章目录 1. 非类型模板参数2. 模板的特化1. 概念2. 函数模板特化3.类模板特化 3. 模板分离编译4. 模板总结 在之前的博客中我们初次接触到了泛型编程和模板的概念 【C】模板初阶,当时只讲了一些基本的用法,现在做一些补充 1. 非类型模板参数 模板参数…

js判断是否为null,undefined,NaN,空串或者空对象

js判断是否为null,undefined,NaN,空串或者空对象 这里写目录标题 js判断是否为null,undefined,NaN,空串或者空对象特殊值nullundefinedNaN空字符串("")空对象(…

【Linux】4. 开发工具的使用(yum/vim)

前言 工具的本质就是指令 在介绍工具之前先介绍一下互联网生态 Linux 软件包管理器 yum 1. 什么是软件包 在Linux下安装软件, 一个通常的办法是下载到程序的源代码, 并进行编译, 得到可执行程序. 但是这样太麻烦了, 于是有些人把一些常用的软件提前编译好, 做成软件包(可以…

【算法】一文彻底搞懂ZAB算法

文章目录 什么是ZAB 算法?深入ZAB算法1. 消息广播两阶段提交ZAB消息广播过程 2. 崩溃恢复选举参数选举流程 ZAB算法需要解决的两大问题1. 已经被处理的消息不能丢2. 被丢弃的消息不能再次出现 最近需要设计一个分布式系统,需要一个中间件来存储共享的信息…

手把手教你开发第一个HarmonyOS (鸿蒙)移动应用

⼀、移动应⽤开发的介绍 移动应⽤开发: AndroidIOSHarmonyOS (鸿蒙) ⼆、HarmonyOS介绍 文档概览-HarmonyOS应用开发官网 2.1 系统的定义 2.1.1 系统的定位 HarmonyOS有三⼤特征: 搭载该操作系统的设备在系统层⾯融为⼀体、形成超级终…

常见元件、封装、尺寸、表面处理等

参考:https://www.bilibili.com/read/cv11024927?fromsearch&spm_id_from333.337.0.0 参考:https://www.bilibili.com/read/cv18413169?fromsearch&spm_id_from333.337.0.0 目录 通孔插件(THT)和表面贴装(SMT)技术封装类型SOP/SOIC封装DIP封装…

实战打靶集锦-018-decoy

提示:本文记录了博主的一次打靶过程 目录 1. 主机发现2. 端口扫描3. 服务枚举4. 服务探查4.1 浏览器探查 5. 突破边界6. 提权6.1 rbash绕过6.2 枚举系统信息6.3 枚举定时任务6.4 枚举可执行文件 7. 获取flag 1. 主机发现 目前只知道目标靶机在65.xx网段&#xff0c…

thinkphp6数据库操作

文章目录 数据库链接 查询构造器查询 添加修改删除链式操作链式操作wheretablefieldpageodrderjoincache 聚合查询分页查询 数据库 链接 在config下有个database.php文件,一般情况下我们配置这个文件即可 return [default > mysql,connections > …

学习记录:2023.4.27

2023.4.27 实习学习记录 Vue连接远程数据库Java基础 Vue cursor: pointer; 表示鼠标指针在该元素上时会变成手形,表示该元素可以被点击或者有交互性。这是一种CSS样式属性,常用于网页设计中。VueECharts实现热词图: 1、安装依赖:…

Linux命令集(Linux常用命令--cat指令篇)

Linux命令集(Linux常用命令--cat指令篇) Linux常用命令集(cat指令篇)4.cat(concatenate)1. 查看文件内容:2. 连接多个文件:3. 创建文件并通过终端写入内容4. 输出内容编号 Linux常用命令集(cat指…

操作系统概述

概述 一、简单描述 1、系统资源的管理者; 2、最接近硬件的一层软件; 3、向上层提供方便容易使用的服务; 二、提供的功能 1、处理机管理; 2、储存器管理; 3、文件管理; 4、设备管理; 举例说明…

Redis学习——day01

Redis学习基础 Nosql:Redis入门:Redis安装:Windows:Linux安装: Nosql: Nosql Not Only Sql(不仅仅Sql)NoSQL,泛指非关系型的数据库。随着互联网web2.0网站的兴起&#…

了解 AlphaFold2 论文必备知识,不会有人还不知道吧

你知道 AlphaFold2 吗?它真正解决了蛋白质三维结构预测的算法困境,堪称蛋白质界的 chat-GPT4,甚至它的意义不是 chat-GPT4 所能够匹敌的。它为世界疾病治疗药物开发以及探究生物生命之谜提供了通向天神的一条道路,未来是生物的世纪…

深入与浅谈 Vue 中计算属性和侦听器的区别和使用(Vue3版本为例)

#五一技术创作马拉松# 📋前言 计算属性 computed 和侦听器 watch 都是 Vue.js 框架中用来响应式更新视图的重要概念。在 Vue 项目开发中,这两个技术点是非常重要的,同时也是 Vue 基础中不可缺少的知识点。在面试中,计算属性 comp…

【前端知识】内存泄漏与垃圾回收机制 (下)

【前端知识相关分享】内存泄漏与垃圾回收机制 (下) 6. 内存泄漏的解决方法6.1 解决方法概述6.2 什么是垃圾6.3 垃圾回收机制的定义及规则6.4 垃圾回收算法的基本流程 7. 垃圾回收的常见算法7.1 引用计数7.2 标记清除7.3 复制算法7.4 标记整理&#xff08…

十大经典排序算法总结(C语言版本)

前言:排序算法是最经典的算法知识,也是每个合格程序员应该需要掌握的知识点。考虑到排序算法通常代码简短,逻辑思维强和应用范围广等特性,排序算法题目便成为了面试中的常客。在面试中最常考的是快速排序和归并排序等基本的排序算…

SQL(基础)

DDL: 数据定义语言 Definition,用来定义数据库对象(数据库、表、字段)CREATE、DROP、ALTER DML: 数据操作语言 Manipulation,用来对数据库表中的数据进行增删改 INSERT、UPDATE、DELETE 注意: DDL是改变表的结构 DML…