李宏毅LLM——大模型+大资料的神奇力量

李宏毅LLM——大模型+大资料的神奇力量

news2026/2/14 15:57:55

在这里插入图片描述

文章目录

大模型的重要性
- 顿悟时刻
大资料的重要性
- 数据预处理
- 不一样的做法：KNN LM

对应视频P12-P14

大模型的重要性

模型参数和数据集越大，文字接龙的错误率越低
在这里插入图片描述

顿悟时刻

在这里插入图片描述
当模型超过10B-20B时，会突然顿悟

启示：不能只看最终结果。要看推理过程的提升

chain of thoughut、instruction tuning 只有在大模型才能起作用

语言模型知不知道自己心虚呢？

瞎掰的时候是心虚的

在某些任务上，有没有可能模型越大，结果越差呢？
在这里插入图片描述
变差只是所谓的“大模型”还不够大

但是U型曲线怎么出现的呢？
小模型：随机乱编
中模型：一知半解
大模型：计算期望

模型还能不能更大呢？
包含很多模组，但是只调用其中一部分模组

大资料的重要性

需要多少资料才能让大模型学到东西呢？
两个能力：文法用词和对世界的理解
在这里插入图片描述

数据预处理

内容过滤：谷歌的安全搜索，去除有害内容
在这里插入图片描述
去除重复资料

固定运算资源下，要大模型还是大资料？怎么找到平衡点？
目前的趋势是发展更大模型，但这是明智的选择吗？
在这里插入图片描述
固定的运算资源下，性能测试
都是U型曲线

标出最低点，找出最优曲线

小模型大资料相较于大模型小资料更优

结论：现在更需要的是大资料

快速让模型变强，文字接龙的正确率并不代表结果，Instruction-tuning可以帮助我们得到更好的结果
在这里插入图片描述

花费很少的运算资源就可以达到很显著的提升
在这里插入图片描述

例子：如果不做Instruction-tuning，大模型会以为我们需要更多的数学题，而做了Instruction-tuning后，大模型就会知道我们需要的是正确的答案
在这里插入图片描述

对决：小模型经过人类老师的训练可以打败不经过训练的大模型
在这里插入图片描述

应该根据人类的使用来调整模型
在这里插入图片描述

不一样的做法：KNN LM

一般的LM的方式：
在这里插入图片描述
KNN LM的做法：

100M资料+外加3B资料，可以比3B资料结果更好。
KNN-LM不能单独使用，需要和LM结合。

为什么KNN LM没有流行？
计算距离花费太多时间，是一般LM速度的十分之一

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1438090.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

股票K线简介

股票K线简介

股票K线（K-Line）是用于表示股票价格走势的图形，主要由四个关键价格点组成：开盘价、收盘价、最高价和最低价。K线图广泛应用于股票市场技术分析中，它提供了丰富的信息，帮助分析师和投资者理解市场的行情走势…

阅读更多...

tee漏洞学习-翻译-2：探索 Qualcomm TrustZone的实现

tee漏洞学习-翻译-2：探索 Qualcomm TrustZone的实现

原文：http://bits-please.blogspot.com/2015/08/exploring-qualcomms-trustzone.html 获取 TrustZone image 从两个不同的位置提取image 从手机设备本身从google factory image 已经root的Nexus 5设备，image存储在eMMC芯片上，并且eMMC芯片…

阅读更多...

爬虫工作量由小到大的思维转变---＜第四十六章 Scrapyd 用gerapy管理多台机器爬虫(2)＞

爬虫工作量由小到大的思维转变---＜第四十六章 Scrapyd 用gerapy管理多台机器爬虫(2)＞

前言: 继续上一篇爬虫工作量由小到大的思维转变---＜第四十四章 Scrapyd 用gerapy管理多台机器爬虫＞-CSDN博客要想在电脑B上,部署爬虫应该做哪些? 正文: 前期准备: 1.已经成功在电脑A上启动了gerapy.并能够成功连接电脑A的ip; 原理: 首先,我需要…

阅读更多...

图数据库之 Neo4j - 环境搭建(2)

图数据库之 Neo4j - 环境搭建(2)

运行环境： centos7 Docker version 18.09.6 下载镜像 docker search neo4j docker pull neo4j 创建 neo4j 用户 # 创建 neo4j 用户 # -M 不创建用户的主目录 sudo useradd -M neo4j # usermod 用于修改用户属性命令 # -L 锁定用户，用户无法登录系统 user…

阅读更多...

C++中的闭包

C++中的闭包

在编程语言中，闭包(closure)，又称为词法闭包(lexical closure)或函数闭包(function closure)，是一种在具有一流函数的语言中(a language with first-class functions)实现词法作用域名称绑定的技术。从操作上来说，闭包是一个将函数…

阅读更多...

HiveSQL——借助聚合函数与case when行转列

HiveSQL——借助聚合函数与case when行转列

一、条件函数 if 条件函数 if函数是最常用到的条件函数，其写法是if(xn,a,b), xn代表判断条件，如果xn时，那么结果返回a ,否则返回b。 selectif(age < 25 or age is null, 25岁以下, 25岁以上) as age_cnt,count(1) as number from table…

阅读更多...

C语言第二十弹---指针(四)

C语言第二十弹---指针(四)

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】指针 1、字符指针变量 2、数组指针变量 2.1、数组指针变量是什么？ 2.2、数组指针变量怎么初始化 3、⼆维数组传参的本质 4、函数指针变量 4.1…

阅读更多...

spring boot(2.4.x之前版本)和spring cloud项目中自动装配的监听执行顺序

spring boot(2.4.x之前版本)和spring cloud项目中自动装配的监听执行顺序

目录扫描 org.springframework.context.ApplicationListener 指定的类内置的监听 spring boot 中的监听 spring boot autoconfigure 中的监听 spring boot context 中的监听将加载的监听进行排序 spring boot 中的监听 spring boot context 中的监听监听执行监听…

阅读更多...

Apache Paimon 文件操作

Apache Paimon 文件操作

本文旨在澄清不同文件操作对文件的影响。本页面提供具体示例和实用技巧，以有效地管理这些操作。此外，通过对提交（commit）和压实（compact）等操作的深入探讨，我们旨在提供有关文件创建和更新的见…

阅读更多...

006集——where语句进行属性筛选——arcgis

006集——where语句进行属性筛选——arcgis

在arcgis中， dBASE 文件除了 WHERE 语句以外，不支持其它 SQL 命令。选择窗口如下： 首先，我们了解下什么是where语句。 WHERE语句是SQL语言中使用频率很高的一种语句。它的作用是从数据库表中选择一些特定的记录行来进行操作。WHE…

阅读更多...

第二证券：沪指涨近1%收复2800点，券商等板块拉升，稀土板块爆发

第二证券：沪指涨近1%收复2800点，券商等板块拉升，稀土板块爆发

7日早盘，两市股指延续昨日强势，再度拉升。沪指涨近1%克复2800点，深成指、科创50指数大涨约3%；两市半日成交超6000亿元，北向资金净买入超20亿元。截至午间收盘，沪指涨0.91%报2814.89点，深成指涨…

阅读更多...

第1章认识Flask

第1章认识Flask

学习目标了解Flask框架，能够说出Flask框架的发展史以及特点熟悉隔离Python环境的创建方式，能够独立在计算机上创建隔离的Python环境掌握Flask的安装方式，能够独立在计算机上安装Flask框架掌握PyCharm配置隔离环境的方式，能…

阅读更多...

电脑文件误删除怎么办？8个恢复软件解决电脑磁盘数据可能的误删

您是否刚刚发现您的电脑磁盘数据丢失了？不要绝望！无论分区是否损坏、意外格式化或配置错误，存储在其上的文件都不一定会丢失到数字深渊。我们已经卷起袖子，深入研究电脑分区恢复软件的广阔领域，为您带来一系列最有效…

阅读更多...

如何在 emacs 上开始使用 Tree-Sitter （archlinux）

如何在 emacs 上开始使用 Tree-Sitter （archlinux）

文章目录如何在emacs上开始使用Tree-Sitter（archlinux） 如何在emacs上开始使用Tree-Sitter（archlinux） 在archlinux上使用比windows上不知道要方便多少倍！ $ sudo pacman -S emacs $ sudo pacman -S tree-sitter这里…

阅读更多...

国内首个openEuler师训营圆满结营！麒麟信安助力培养国产操作系统高质量师资人才

国内首个openEuler师训营圆满结营！麒麟信安助力培养国产操作系统高质量师资人才

2024年1月22日，全国首个openEuler师训营圆满结营！旨在深化产教融合，加速开源教育走进高校，提高师资队伍openEuler专业能力及实践教学水平。本次师训营由长沙市大数据产业链、长沙市新一代自主安全计算系统产业链指导&#xff0c…

阅读更多...

RxJava Subject

RxJava Subject

目录 AsyncSubjectBehaviorSubjectPublishSubjectReplaySubjectSerializedSubjectUnicastSubject 在Rxjava中， Subject可以同时表示Observer和Observable, 允许从单个源到多个子观察者multiple child Observers。除了 onSubscribe(io.reactivex.disposables.Dispos…

阅读更多...

云计算运维1

云计算运维1

1、企业服务器LNMP环境搭建集群：多台服务器在一起作同样的事。分布式 ：多台服务器在一起作不同的事。环境准备： 1、设置静态ip（NAT模式网关为.2） # cat /etc/sysconfig/network-scripts/ifcfg-ens33 TYPE"E…

阅读更多...

【C生万物】C语言分支和循环语句

【C生万物】C语言分支和循环语句

📚博客主页：爱敲代码的小杨. ✨专栏：《Java SE语法》 | 《数据结构与算法》 | 《C生万物》 ❤️感谢大家点赞👍🏻收藏⭐评论✍🏻，您的三连就是我持续更新的动力❤️ 🙏小杨水平有…

阅读更多...

uniapp /微信小程序使用map组件实现手绘地图方案

uniapp /微信小程序使用map组件实现手绘地图方案

获取地图范围点图拾取坐标-地图开放平台|腾讯位置服务获取需要手绘地图左下角和右上角GPS坐标以北京故宫为例： 截取需要手绘地图进行手绘地图制作素材处理由于地图素材文件比较大，小程序又限制包大小<2M,无…

阅读更多...

51单片机基础：定时器

51单片机基础：定时器

1.定时器介绍 51单片机通常有两个定时器：定时器 0/1，好一点的可能有定时器3。在介绍定时器之前我们先科普下几个知识： 1，CPU 时序的有关知识 ①振荡周期：为单片机提供定时信号的振荡源的周期（晶振周期或…

阅读更多...

推荐文章

最新文章