WizardKM:Empowering Large Language Models to Follow Complex Instructions

news2026/2/13 22:49:36

WizardKM:Empowering Large Language Models to Follow Complex Instructions

Introduction
参考

Introduction

作者表明当前nlp社区的指令数据比较单一，大部分都是总结、翻译的任务，但是在真实场景中，人们有各式各样的需求，这限制了模型的通用性。
作者提到这种人类标注的qa数据如果质量比较高，那么将很好的释放模型的性能，但是现在获取数据存在一些问题：

标注这类数据是非常费时费力的，并且十分昂贵。
由于labeler的专业程度有限，很难获取到优质的数据。

基于上述问题，作者提出了一个可以短时间内大量构建高质量数据的方法。
在这里插入图片描述
如上图，作者把这个方法叫做Evol-Instruct，从一个1+1等于多少开始，作者从两个方向对数据进行扩充：深度方向、广度方向。然后把问题送入ChatGPT获得qa数据对，然后对数据进行筛选。

为了验证这个方法的有效性，把用上述方法生成的数据，通过Llama7B微调，把它叫做WizardLM，然后与Alpaca、Vicuna进行对比。作者通过Alpaca的175条初始化数据通过Evol-Instrcut方法生成250k条数据，为了公平起见，作者在这些数据中sample了70k数据进行对比。

实验发现：

Evol- instruct生成的数据优于ShareGPT的数据。
在复杂的测试指令下，标注者更喜欢WizardLM的输出，而不是ChatGPT的输出。

参考

https://arxiv.org/pdf/2304.12244.pdf

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/467794.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MyBats

MyBats

一、MyBatis简介 1. MyBatis历史 MyBatis最初是Apache的一个开源项目iBatis, 2010年6月这个项目由Apache Software Foundation迁移到了Google Code。随着开发团队转投Google Code旗下， iBatis3.x正式更名为MyBatis。代码于2013年11月迁移到Github。 iBatis一词来…

阅读更多...

【Python | 基础语法篇】02、标识符、运算符、字符串扩展及数据输入

【Python | 基础语法篇】02、标识符、运算符、字符串扩展及数据输入

目录一、标识符 1.1 什么是标识符 1.2 标识符命名规则 1.2.1 标识符命名规则 - 内容限定 1.2.2 标识符命名规则 - 大小写敏感 1.2.3 标识符命名规则 - 不可使用关键字 1.3 案例演示 1.4 变量命名规范 1.4.1 变量命名规范 - 见名知意 1.4.2 变量命名规范 - 下划线…

阅读更多...

Spring aop如何寻找advisor

Spring aop如何寻找advisor

1.bean的生命周期第一步回去解析所有的advisor 2.第四个是我们之前开启的注解EnableAspectJAutoProxy 3.org.springframework.aop.framework.autoproxy.AbstractAutoProxyCreator#postProcessBeforeInstantiation 4.org.springframework.aop.framework.autoproxy.AbstractAutoP…

阅读更多...

ChatGPT的提示的一些高级知识

ChatGPT的提示的一些高级知识

作为一个大型语言模型(LLM)接口，ChatGPT有令人印象深刻的潜力，但是真正能否用好取决与我们的提示（Prompt ），一个好的提示可以让ChatGPT晋升到一个更好的层次。在这篇文章中，我们将介绍关于提示的一些高级…

阅读更多...

可视化 | Flask+Pyecharts可视化模板二

可视化 | Flask+Pyecharts可视化模板二

文章目录 🏳️‍🌈 1. 系统说明界面🏳️‍🌈 2. 柱状图示例界面🏳️‍🌈 3. 散点图示例界面🏳️‍🌈 4. 折线图示例界面🏳️‍🌈 5. 饼图示例界面&#x1f3f…

阅读更多...

单链表——你需要掌握的那些内容

单链表——你需要掌握的那些内容

如有错误，感谢不吝赐教、交流文章目录前言本文涉及题目：设计链表有无头结点的区别头指针无头结点有头结点为什么需要头结点呢？注意： 单链表，本文使用Java实现定义链表节点定义一个链表类并初始化get(int index)addA…

阅读更多...

HAproxy与web集群

HAproxy与web集群

文章目录一、HAproxy1.HAProxy是什么2.HAProxy的核心能力和关键特性3.LVS、Nginx、HAproxy的区别： 二、实验步骤1.Haproxy搭建 Web 群集总结一、HAproxy 1.HAProxy是什么 HAProxy是一个免费的负载均衡软件，可以运行于大部分主流的Linux操作系统上。…

阅读更多...

儿童生长发育迟缓的鉴别和干预

儿童生长发育迟缓的鉴别和干预

（英国）国家临床医学研究所（NICE）2017年发布关于婴儿/儿童生长发育迟缓的鉴别、评估和监测的指南，该指南确定了生长发育的界值，指出了诱因及危险因素，并提出了干预的方案。 ▼Part1：…

阅读更多...

“无人值守”时代已来，千巡翼X4给出怎样的答案？

“无人值守”时代已来，千巡翼X4给出怎样的答案？

随着技术和产品的逐渐成熟，无人机在各行业的应用越来越普遍，但如何进一步解放人力，提高运营效率，还有很大的探索空间。针对作业频率高、重复性高、周期性强、作业环境艰险危险等痛点，用户迫切需要更高效、更智能的全自…

阅读更多...

LeetCode876. 链表的中间结点

LeetCode876. 链表的中间结点

876. 链表的中间结点描述示例解题思路以及代码解法1解法2 描述给你单链表的头结点 head ，请你找出并返回链表的中间结点。如果有两个中间结点，则返回第二个中间结点。示例示例1 输入：head [1,2,3,4,5] 输出：[3,4,5] 解释…

阅读更多...

希尔排序的实现

希尔排序的实现

希尔排序是插入排序的一种升级，其基本思想是： 先选定一个整数，把待排序文件中所有记录分成个组，所有距离为的记录分在同一组内，并对每一组内的记录进行排序。然后，取，重复上述分组和排序的工作…

阅读更多...

可执行Jar项目

可执行Jar项目

一个复杂Jar的运行，要解决classpath问题，否则运行时会有ClassNotFoundException抛出。而用java，需要手动维护一个classpath文件，或者将所有的库位置放到命令行参数里。有没有更好的办法？ Jar库目录方式核心配置在于两…

阅读更多...

算法训练Day40:343. 整数拆分 96.不同的二叉搜索树

算法训练Day40:343. 整数拆分 96.不同的二叉搜索树

文章目录整数拆分题解（动态规划）贪心不同的二叉搜索树题解整数拆分 CategoryDifficultyLikesDislikesContestSlugProblemIndexScorealgorithmsMedium (62.22%)11660--0 Tags 数学 | 动态规划 Companies 给定一个正整数 n ，将其拆分为…

阅读更多...

推荐几个免费的在线文本转语音网站（支持中英文多种语音）

推荐几个免费的在线文本转语音网站（支持中英文多种语音）

如果你正在寻找一款免费的在线文本转语音工具，那么你来对地方了！本文将介绍几个完全免费的在线文本转语音网站，推荐收藏下来以备不时之需。 No.1 免费文本转语音（TTSMaker） TTSMaker是第一个推荐的工具，这…

阅读更多...

院内导航方案怎么样？什么地图可以用于医院导航系统？

院内导航方案怎么样？什么地图可以用于医院导航系统？

什么地图可以用于医院导航系统？随着医疗事业的不断发展，医院的建制规模越来越大，在医疗能力得到增强的同时，由于楼宇众多，院内寻路难度难免增加。不少前来医院就诊的患者经常会有“寻路难”的困扰。此时一张一目了然的…

阅读更多...

从在线监测与故障诊断系统视角，探讨动设备安全运行的重要性

从在线监测与故障诊断系统视角，探讨动设备安全运行的重要性

在工业生产中，动设备是生产线的重要组成部分，但是随着设备运行时间的不断延长，设备的损耗逐渐加大，设备故障和损坏的风险也随之增加，给生产效率和安全带来不小的影响。因此，如何保证动设备的安全运行成为了…

阅读更多...

更简单的存取Bean的方式(一)-五大类注解

更简单的存取Bean的方式(一)-五大类注解

目录使用类注解前置工作 Bean命名规则五大类的实现 JavaEE标准分层之前我们存储Bean时,是在spring-config.xml文件中添加bean注册内容来实现的通过"注解"我们可以替代这一项工作更加简单的存储方式: 使用类注解五大类注解: Controller(控制器):用来控制…

阅读更多...

常用的倾斜摄影三维模型3DTILES格式优缺点分析

常用的倾斜摄影三维模型3DTILES格式优缺点分析

常用的倾斜摄影三维模型3DTILES格式优缺点分析三维模型3DTILES格式是一种用于描述三维模型和场景数据的标准格式，具有以下优点和缺点： 优点： 1、多平台支持：3DTILES格式基于WebGL和JavaScript技术，可以在多个平台上…

阅读更多...

用Python搞定接口自动化测试：轻松实现RPC协议接口测试

用Python搞定接口自动化测试：轻松实现RPC协议接口测试

每天进步一点点，关注我哦，每天分享测试技术文章，文末有福利！ 目录：导读前言一、什么是RPC 二、RPC框架三、基于grpc框架服务的接口测试 01创建一个grpc服务接口 02调用grpc接口客户端 03接口框架中适配grpc封…

阅读更多...

nvm安装使用详解，附gnvm介绍

nvm安装使用详解，附gnvm介绍

最近工作中，再次遇到了需要处理 Node.js 多版本管理的事情，由于在windows系统下开发，于是使用了 nvm 来做版本管理。其实，之前在写文章介绍进行node和npm的版本升级的时候，也有提到 node 多版本管理工具&#xff0c…

阅读更多...

推荐文章

最新文章