大模型的涌现能力 (Emergent Abilities of LLM)

news2024/11/18 5:44:31

format,png

作者 | 曾伟豪 @北京邮电大学

整理 | NewBeeNLP

https://zhuanlan.zhihu.com/p/609339534

大家好,这里是NewBeeNLP。今天一起来研究下LLM中的emergent abilities现象。

067e3c6464d17e5de55af27d2cd2301b.png
  • 论文名称:Emergent Abilities of Large Language Models

  • 论文链接:https://arxiv.org/pdf/2206.07682.pdf

  • 论文来源:Google&Deepmind

1. Emergent Abilities Definition

本文中对LLM的emergent abilities的定义为:

在较小的模型中不出现,而在较大的模型中出现的能力,则可以称之为emergent.(An ability is emergent if it is not present in smaller models but is present in larger models.)

本文的目的不是去谈论是否存在一个scale就可以观察到emerge abilities,而是去讨论之前的工作中出现的emergent现象。

2. Few-Shot Prompted Tasks

本部分主要讨论在prompting范式下的emergent abilities, 该范式如下图所示:

c2c3924a55abec286c35a44f56acdc11.png

few-shot prompting的emergent主要体现为模型在没有达到一定规模前,得到的表现较为随机,在突破规模的临界点后,表现大幅度提升。如下图所示,在BIG-Bench上,GPT-3和LaMDA在未达到临界点时,模型的表现都是接近于零。而在GPT-3的规模突破2·10^22 training FLOPs (13B参数),LaMDA的规模突破10^23 training FLOPs (68B参数),模型的表现开始快速上升。

e1f815c247cc8a62b17df95856ebcd01.png

3. Augmented Prompting Strategies

除了few-shot prompting可以反映emergent abilities, 作者认为如果在某个任务上的某个手段,模型达到一定规模以前,使用该手段,相比于基线没有提升或者是有害的,那么可以将该手段看成emergent ability.

作者在Multi-step reasoning(chain-of-thought prompting); Instruction following(使用instructions描述任务,不使用few-shot exemplars); Program execution;Model calibration(calibration需要模型去评估自己是否能正确回答某个问题)

437a348871e4413d54c8f635206f1aa3.png

下表给出了大模型出现emergent ablities的规模统计

cd73f2ec6d5a7e7a8f5e9d11c9d4a9ce.png

4. Discussion

4.1 Potential explanations of emergence

  1. 对于模型突破某个规模的临界值后,出现emergent abilities的现象。作者给出直观上的猜想,某个multi-step reasoning任务需要l个step的计算,那么可能需要模型主要需要O(l)层的数目。同时也可以很自然猜想更多的参数和更多的训练有助于模型记忆更多的world knowledge. 比如在closed-book question-answering可能需要模型有更多的参数去记忆尝试知识。

  2. 衡量emergent abilities的evaluation metrics也值得探究。仅仅使用最终的指标如acc等并不一定很好反映emergence.

4.2 Beyond scaling

虽然本文主要探究模型超过一定规模后出现emergent ability, 但模型仍然有可能通过数据,算法的改进在更小规模出现emergence. 比如在BIG-Bench任务上,LaMDA在137B,GPT-3在175B上出现emergent ability,而PaLM在62B就可以出现。

4.3 Another view of emergence

虽然模型的规模与大模型的表现高度相关,但是但模型的规模不是观察到emergent abilities的唯一尺度。如下图所示,模型的emergent abilities可以看成一系列相关变量的函数。

28890a51a5bbb655c9f0bb3f201415cd.png

4.4 Directions for future work

作者为未来研究大模型中的emergent abilitie提供了一些方向。

  1. Further model scaling: 继续增加模型的规模探究模型的表现的提升。

  2. Improved model architectures and training :从模型的结构和训练过程上提高模型的质量,从而使模型在较低的训练成本下就可以获得emergent abilities.

  3. Data scaling: 增大数据集的规模

  4. Better techniques for and understanding of prompting:更好地发挥prompt在模型中的作用

  5. Frontier tasks: 仍然有些任务无法出现emerent abilities,这也是值得探究的。

  6. Understanding emergence: 关于emergent abilities为什么会在语言模型中发生仍然是未知的。

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

format,png

033db2f457036ca9e291767623b78adc.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/670395.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java进阶1(数组)

数组 数组是数据的集合,一个容器,用来存储任何类型的数据,包括原始数据类型和引用数据类型,但是一旦指定了数组的类型之后,就只能用来存储指定类型的数据。 数组声明的三种方式: 数据类型[] 数组名 new …

通过netstat命令查看进程与端口的对应关系

文章目录 前言一、linux 离线安装二、使用 前言 netstat是一个用于显示当前网络连接状态和统计信息的命令行工具。使用netstat可以解决以下问题: 查看当前计算机上的网络连接状态,了解计算机是否正在与其他计算机通信。 检查计算机上是否存在未经授权的…

k8s日志收集组件 Grafana loki --- 快速安装

grafana提供了基于loki的完整安装模式,可基于helm3实现在k8s上完整部署。具体安装与快速使用方式如下所示。 上手指南 添加loki-stack仓库 helm repo add grafana https://grafana.github.io/helm-charts创建loki namespace kubectl create namespace loki部署l…

若依(ruoyi)前端Vue3 Element Plus Vite版样式修改

1. 导航栏样式 背景色 位置:src/layout/components/Navbar.vue 类名:.navbar // 比如背景色等 background: #1b2535;右侧图标(全屏等) .right-menu-item {display: inline-block;padding: 0 8px;height: 100%;font-size: 18p…

Json在Qt中的使用

文章目录 Json在Qt中的使用主要使用的类QJsonValueQJsonObjectQJsonDocument实战1. 手动写Json文件2. 实现程序(从Json文件中读取数据,更改Json文件中的数据) Json在Qt中的使用 主要使用的类 Json 类介绍QJsonDocument它封装了一个完整的 J…

Loki+Grafana(外)采集Kubernetes(K8s)集群(基于containerd)

一、Loki简介 1、简介 Loki Loki是一个开源、分布式的日志聚合系统,由Grafana Labs推出。Loki的设计目标是为了高效地处理大规模的日志数据,并具有良好的可扩展性。Loki的最大优点是它具有低资源占用和高效的查询速度。这是因为Loki不需要在处理日志数据…

工具篇6--kafka消息模型介绍

前言:kafka 诞生于需要处理大数据量的背景下,在当前的开发中,数据量的量级也是不断的提高,所以就非常有必要去研究一下kafka 的模型了; kafka 的官网先放一下: 1 英文官网; 2 中文网站&#xf…

Spring Boot 中使用 JSR-303 数据校验

Spring Boot 中使用 JSR-303 数据校验 在 Web 开发中,数据校验是一个非常重要的环节。它可以帮助我们在用户提交表单数据时验证数据的合法性,防止一些不必要的错误和漏洞。在 Spring Boot 中,我们可以使用 JSR-303 数据校验规范来实现数据校…

黑马程序员前端 Vue3 小兔鲜电商项目——(三)Layout 首页页面布局

文章目录 组件结构快速搭建首页组件结构Nav 组件Header 组件Footer 组件index.vue 中添加组件 字体图标渲染一级导航渲染封装接口函数渲染数据 吸顶导航交互实现安装 VueUser 插件组件静态结构添加组件实现吸顶交互 Pinia优化重复请求 组件结构快速搭建 首页组件结构 页面效果…

字节跳动的项目经理,是什么神仙存在?

早上好,我是老原。 要是说起项目经理的待遇天花板,你觉得会是什么样的? 在2022年,虽然很多互联网大厂都在大裁员,同时也刺激了更多人想进大厂的心。 就从项目经理这个岗位来看,你说大小厂的工作内容差距…

Win11的两个实用技巧系列之找不到项目的文件如何删除、无法用蓝牙耳机的多种解决办法

Win11 新预览版怎么恢复文件管理器经典功能? Win11 新预览版怎么恢复文件管理器经典功能?Win11最新版去掉了文件管理器经典功能,该怎么操作呢?下面我们就来看看详细的恢复方法 微软在日前发布的 Win11 Dev Build 23481 预览版更新中&#x…

建筑中的智能照明系统

【摘要】:建筑智能照明工程中智能照明控制系统发展迅速,具有舒适性和节能性两方面优势。智能照明控制系统已经处于模块化高速发展阶段,如今更好的控制方案成为制约系统发展的瓶颈。文章在研究了国内外智能照明系统的基础上,从照明…

Java 结合中文分词库 jieba 统计一堆文本中各个词语的出现次数【代码记录】

文章目录 1、需求2、代码3、结果 1、需求 2、代码 package com.zibo.main;import com.huaban.analysis.jieba.JiebaSegmenter;import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; import java.util.HashMap; import java.util.List; imp…

Picker, ColorPicker, DatePicker 的使用

1. Picker 选择器的使用 1.1 实现 /// 选择器 struct PickerBootcamp: View {State var selection: String "Most Recent"let filterOptions:[String] ["Most Recent", "Most Popular", "Most Liked"]init(){UISegmentedControl.ap…

Python基础(16)——Python集合(set)

Python基础(16)——Python集合(set) 文章目录 Python基础(16)——Python集合(set)目标一. 创建集合二. 集合常见操作方法2.1 增加数据2.2 删除数据2.3 查找数据 三. 总结 目标 创建…

Python基础(17)——Python运算符、公共方法、类型转换

Python基础(17)——Python运算符、公共方法、类型转换 文章目录 Python基础(17)——Python运算符、公共方法、类型转换目标一. 运算符1.1 1.2 *1.3 in或not in 二. 公共方法2.1 len()2.2 del()2.3 max()2.4 min()2.5 range()2.6 e…

4个重要的云安全方向

导语 伴随着云计算的不断发展和成熟,云安全越来越受到重视,每一年云安全都有不同的重点话题值得关注,今天我们一起来看看2023非常重要4个云安全话题 云攻击路径发现和威胁建模 随着攻击面的扩大,企业云安全的复杂性也会增加。为您…

一文搞懂 MySQL 中的常用函数及用法

0️⃣前言 MySQL是一种常用的关系型数据库管理系统,它提供了许多内置函数来处理数据。本文将介绍MySQL中的各种常用函数,包括字符串函数、日期函数、数学函数、聚合函数等。 文章目录 0️⃣前言1️⃣字符串函数1.1CONCAT函数1.2SUBSTRING函数1.3REPLACE函…

测试用例常用方法和选择原则

目录 前言: 一、等价类划分法 等价类思考步骤: 二、边界值 边界值的方法小结: 三、因果图法 因果图中的符号: 利用因果导出测试用例需要经过以下几个步骤: 四、判定表法 组成部分: 书写步骤: 五…

神经网络笔记

多分类问题 Softmax 高级优化算法 Adam Algorithm Intuition 每个参数有不同的学习率 卷积层 每个神经元只看前一层输入的一部分 原因: 1.更快的计算 2.需要更少的训练数据(不容易过度拟合) 模型评估 成本函数 分类 训练集用来训练…