【论文笔记】基于指令回译的语言模型自对齐-MetaAI

news2025/1/19 23:13:42

MetaAI最近发布的Humpback，论文链接：https://arxiv.org/abs/2308.06259

解决什么问题？

大量高质量的指令微调数据集的生成。

思路

在这项工作中，我们通过开发迭代自训练算法来利用大量未标记的数据来创建高质量的指令调优数据集。该方法使用模型本身来增强和管理高质量的训练样例，以提高其自身的性能。我们的方法名为指令反翻译(instruction backtranslation)，其灵感来自机器翻译的经典反翻译方法，即用模型生成的另一种语言的源句子自动注释人类编写的目标句子。

就是最初我们有大语言模型 $M_0$ 、无标注的数据和人工生成的少量初始问答对（seed data)，用seed data对 $M_0$ 进行微调，微调后的 $M_0$ predict出一些能在seed data中找到合适答案的问题（QA对），通过prompt让 $M_0$ 自己筛选出其中较高质量的QA对，并入seed data中，迭代。
最终是可以得到一个能产生高质量问答数据的大模型 $M_k$ ,从而可以得到一系列高质量问答对。
迭代过程
每个迭代的大模型会执行两个步骤：

自增强(self-augment):为未标记数据(即web语料库)生成指令，以生成(指令，输出)对的候选训练数据，用于指令调优。
自我管理 (self-curate):自我选择高质量的演示示例作为训练数据，以微调基本模型。这种方法是迭代完成的…

过程

初始数据生成：从一组人工注释的(指令，输出)示例开始，这些示例将用于微调语言模型，以在两个方向上给出初始预测:预测给定指令的输出，以及给定输出的指令。
无标签数据收集，同时清洗(重复消除，长度过滤，启发式方法删除潜在低质量)：使用web语料库作为未标记数据的来源
微调以得到能生成高质量问题的模型
让模型对自己生成的问题进行评分
掐尖，加入seed data中（通过后缀进行区分），迭代

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/895849.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IC流程中 DFT 学习笔记（2）

IC流程中 DFT 学习笔记（2）

引言 DFT是ASIC芯片设计流程中不可或缺的环节。其主要目的是在芯片前端设计验证完成后插入一些诸如寄存器链等可供测试的逻辑，算是IC后端设计的范畴，属于结构测试而非功能测试。主要是在ASIC芯片流片完成后，通过这些已插入的逻辑&#xff0c…

阅读更多...

Rancher-RKE-install 部署k8s集群

Rancher-RKE-install 部署k8s集群

一、为什么用Rancher-RKE-install 1.CNCF认证的k8s安装程序。 2.有中文文档。二、安装步骤 1.下载Rancher-Rke的二进制包-下面是项目的地址 GitHub - rancher/rke: Rancher Kubernetes Engine (RKE), an extremely simple, lightning fast Kubernetes distrib…

阅读更多...

javaScript:还有人不会js中的Math方法？

javaScript:还有人不会js中的Math方法？

目录一.前言二.Math方法 1.Math.floor()向下取整（重点） 示例注意 2.Math.ceil()向上取整示例 3.Math.round() 四舍五入示例 4.Math.random()随机数（重点） 范围示例 m-n之间的随机整数数(重点) 示例输出10个[2…

阅读更多...

时序结构重要性加权图卷积网络用于时序知识图谱补全

时序结构重要性加权图卷积网络用于时序知识图谱补全

目录摘要部分四元数时间戳时间信息对四元数的影响知识图谱里的结构信息时序注意模块重要性加权的图卷积网络引言部分现有方法的不足本文主要贡献准备工作问题定义大部分方法的缺陷本文方法框架时序注意模块实体分类带有注意力机制的双向长短…

阅读更多...

Spring-MVC的数据响应-19

Spring-MVC的数据响应-19

在访问服务端MVC的时候，这个controller层进行相应操作之后他要做两件事：页面跳转和返回字符串，在做完这些操作之后，我们一般进行页面展示:排除页面展示之外，有些需求可能直接回写给我们一些数据： 页面跳…

阅读更多...

实验一 Hbase的安装部署与基本操作

实验一 Hbase的安装部署与基本操作

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目…

阅读更多...

gcc语法解析如何解决dangling else的问题？

gcc语法解析如何解决dangling else的问题？

GCC上古版本（3.4）还有yacc，学习GCC如何实现if else 嵌套的问题。即： 问题 else后面的if到底是else if语义 if (xxx)a1 else if (xxx) a2还是 else (语法块中的if else)。 if (xxx)a1 else if (xxx) a 2 else a2;PostgreSQL的…

阅读更多...

Codeforces Round 881 Div.3

Codeforces Round 881 Div.3

文章目录贪心：A. Sasha and Array Coloring结论：B. Long Long性质：C. Sum in Binary Treedfs求叶子数量：D. Apple Tree二分与前缀和：E. Tracking Segments 贪心：A. Sasha and Array Coloring Problem - A…

阅读更多...

作为10年的测试人员给学习软件测试的几点建议

作为10年的测试人员给学习软件测试的几点建议

下面几点给做测试的朋友参考一下： 1、钱肯定少过开发人员，除非你工作3，4年才能拿年薪10W以上。 2、加班的现象可以说是很普遍，周一到周五随时加班是很正常的，周末肯定有一天要加班。 3、不管怎么样努力和用什么测试效…

阅读更多...

ROS局部路径规划器插件teb_local_planner流程梳理（上）

ROS局部路径规划器插件teb_local_planner流程梳理（上）

在我之前的文章《ROS导航包Navigation中的 Movebase节点路径规划相关流程梳理》中已经介绍过Move_base节点调用局部路径规划器插件的接口函数是computeVelocityCommands，接下来，我们就从这个函数入手梳理一下teb_local_planner功能包的工作流程。 ☆注&a…

阅读更多...

Vue使用Element的表格Table显示树形数据，多选框全选无法选中全部节点

Vue使用Element的表格Table显示树形数据，多选框全选无法选中全部节点

使用Element的组件Table表格，当使用树形数据再配合上多选框，如下： 会出现一种问题，点击左上方全选，只能够选中一级树节点，子节点无法被选中，如图所示： 想要实现点击全选就选中所有的…

阅读更多...

强强联手：Eyeshot 2023.2 集成 CAD Exchanger SDK 3.21 Crack

强强联手：Eyeshot 2023.2 集成 CAD Exchanger SDK 3.21 Crack

Lab 中的新绘图模式和网格抽取、Eyeshot 集成以及从 CAD Exchanger 3.21.0 中的 CATIA 导入图形 PMI 通过探索新的绘图模式和可调整的网格抽取，更深入地了解实验室，见证与 devDept Eyeshot 的无缝集成，并直接从 CATIA 导入图形 PMI。今年 8…

阅读更多...

阿里云100元预算可选的云服务器配置2核2G3M带宽

阿里云100元预算可选的云服务器配置2核2G3M带宽

阿里云服务器100元可以买到哪些配置？如果是一年时长，轻量应用服务器2核2G3M带宽一年108元，系统盘为50GB高效云盘。以前阿里云服务器ECS卖过35元一年、69元、88元、89元和99元的都有过，但是现在整体费用上涨，入门级云服…

阅读更多...

超实用的40道JAVA经典算法题（含答案）

超实用的40道JAVA经典算法题（含答案）

作为一名Java程序员，想要拿到一份满意的offer，就必须做好充足的准备。众所周知，算法可以说是大厂面试Java程序员的必问题。好的算法可以让性能得到万倍提升，做到毫秒级处理千万数据的程度。因此，算法的重要性不言而喻&…

阅读更多...

【云原生，k8s】Helm应用包管理器介绍

【云原生，k8s】Helm应用包管理器介绍

目录一、为什么需要Helm？ （一）Helm介绍 （二）Helm有3个重要概念： （三）Helm特点二、Helm V3变化 （一）架构变化 （二）自动创建名…

阅读更多...

ICCV23 | Ada3D：利用动态推理挖掘3D感知任务中数据冗余性

ICCV23 | Ada3D：利用动态推理挖掘3D感知任务中数据冗余性

论文地址：https://arxiv.org/abs/2307.08209 项目主页：https://a-suozhang.xyz/ada3d.github.io/ 01. 背景与动因 3D检测(3D Detection)任务是自动驾驶任务中的重要任务。由于自动驾驶任务的安全性至关重要(safety-critic)，对感知算法的延…

阅读更多...

CodeSite for .NET Crack

CodeSite for .NET Crack

CodeSite for .NET Crack CodeSite for.NET与Visual Studio集成，通过实时查看器日志记录系统提供对代码执行的更深入了解，该系统有助于在本地或远程执行代码时快速查找问题。超越传统的断点调试，在应用程序继续运行时记录应用程序的执行&…

阅读更多...

强训第34天

强训第34天

选择 A B D 由协议处理粘包问题 C C C host字段表示要访问的IP地址 Connection为Close，为短连接 A RTT报文往返时间，根据窗口大小和拥塞控制可以得知发了1 2 4 8 总共16个接收缓存并且没由进行数据提取，则剩余接收量为16-151，会经…

阅读更多...

k8s简介、虚拟机快速搭建k8s集群、集群管理方式及K8S工作原理和组件介绍

k8s简介、虚拟机快速搭建k8s集群、集群管理方式及K8S工作原理和组件介绍

文章目录 1、k8s简介1.1、部署方式的变迁1.2、定义1.3、Kubernetes提供的功能 2、虚拟机快速搭建k8s集群2.1、虚拟机配置（centos7 2G内存2个处理器）2.2、基础环境准备2.3、docker安装（易踩坑）2.4、安装k8s组件2.5、master节点部署…

阅读更多...

Power BI 之初相识

Power BI 之初相识

一、简介传统数据分析工具入Excel等分析大数据量存在一些弊端，一是无法应对多数据源，二是数据量大容易卡死，三是无法根据数据源动态变化，导致每天重复分析数据，无法关注数据价值本身。 Power BI（简写PBI…

阅读更多...

推荐文章

最新文章