02.构建和使用的大型语言模型（LLMs）阶段

02.构建和使用的大型语言模型（LLMs）阶段

news2025/4/15 10:20:08

我们为什么要建立自己的LLMs？LLM从头开始编码是了解其机制和局限性的绝佳练习。此外，它还为我们提供了必要的知识，可以保留或微调现有的开源LLM架构，以适应我们自己的特定领域的数据集或任务。

研究表明，在建模性能方面，定制（LLMs为特定任务或领域量身定制的）可以胜过 ChatGPT LLMs 等通用型，后者专为各种应用而设计。这方面的例子包括 BloombergGPT，它专门用于金融，LLMs专为医学问答量身定制（有关详细信息，请参阅本章末尾的“进一步阅读和参考”部分）。

创建 LLM的一般过程，包括预训练和微调。“预训练”中的术语“预训练”是指在大型、多样化的数据集上训练模型LLM以发展对语言的广泛理解的初始阶段。然后，这个预训练模型作为基础资源，可以通过微调进一步完善，在这个过程中，模型在更特定于特定任务或领域的更窄的数据集上专门训练。图 1.3 描述了由预训练和微调组成的两阶段训练方法。

图 1.3 预训练涉及LLM对大型未标记文本语料库（原始文本）的下一个单词预测。然后，可以使用较小的标记数据集对预训练LLM进行微调。

如图 1.3 所示，创建文本的第一步是在大型文本数据语料库（有时称为原始文本LLM）上对其进行训练。在这里，“原始”是指这些数据只是没有任何标签信息的常规文本[1]。（可以应用过滤，例如删除未知语言的格式字符或文档。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1372547.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

前端项目构建打包生成Git信息文件

前端项目构建打包生成Git信息文件

系列文章目录 TypeScript 从入门到进阶专栏文章目录系列文章目录前言一、前端项目构建打包生成Git信息文件作用二、步骤1.引入相关的npm包1.1. **fs** 包1.2. **child_process** 包1.3. **os** 包 (非必须如果你想生成的文件信息中包含当前电脑信息则可用)1.4. **path** 包…

阅读更多...

Qt QCheckBox复选按钮控件

Qt QCheckBox复选按钮控件

文章目录 1 属性和方法1.1 文本1.2 三态1.3 自动排他1.4 信号和槽 2 实例2.1 布局2.2 代码实现 Qt中的复选按钮类是QCheckBox它和单选按钮很相似，单选按钮常用在“多选一”的场景，而复选按钮常用在"多选多"的场景比如喜欢的水果选项中&#xf…

阅读更多...

Python从入门到网络爬虫（控制语句详解）

Python从入门到网络爬虫（控制语句详解）

前言做任何事情都要遵循一定的原则。例如，到图书馆去借书，就需要有借书证，并且借书证不能过期，这两个条件缺一不可。程序设计亦是如此，需要使用流程控制实现与用户的交流，并根据用户需求决定程序“做什么…

阅读更多...

特征工程：图像数据不足时的处理办法

特征工程：图像数据不足时的处理办法

在机器学习中，绝大部分模型都需要大量的数据进行训练和学习（包括有监督学习和无监督学习），然而在实际应用中经常会遇到训练数据不足的问题。比如图像分类，作为计算机视觉最基本的任务之一，其目标是将每幅图…

阅读更多...

Android学习（四）：常用布局

Android学习（四）：常用布局

Android学习（四）：常用布局五种常用布局线性布局：以水平或垂直方向排列相对布局：通过相对定位排列帧布局：开辟空白区域，帧里的控件(层)叠加表格布局：表格形式排列绝对布局&#x…

阅读更多...

Linux的基本指令（5）

Linux的基本指令（5）

目录 bc指令 uname指令压缩解压相关的指令 zip指令 unzip指令 tar打包压缩指令 tar解压解包指令传输指令sz&rz 热键关机命令安装：yum install -y 指令 bc指令 bc命令可以很方便的进行浮点运算 Linux中的计算器 uname指令语法：unam…

阅读更多...

MySQL之导入以及导出远程备份v

MySQL之导入以及导出远程备份v

目录一.navact数据导入导出 1.1 导入 1.2 导出二. mysqldump命令导入导出数据 2.1 导入 2.2 导出三.load data file进行数据导入导出（只限于单表） 3.1 导入 3.2 导出四.远程连接好啦就到这里了哦!!!希望帮到你哦!!! 一.navact数据导入导…

阅读更多...

RIP复习实验

RIP复习实验

条件: R1为外网，R8和r9的环回分别是172.16.1.0/24和172.16.2.0/24 中间使用78.1.1.0/24 剩下的路由器2-6使用172.16.0.0/16 要求: R1为运营商 r1远程登录r2实际登录r7 R2访问r7要求走r5去访问全网可达实现流程: 首先配置好各接口ip address 然后r2-r7使用rip…

阅读更多...

Python Matplotlib 库使用基本指南

Python Matplotlib 库使用基本指南

简介 Matplotlib 是一个广泛使用的 Python 数据可视化库，它可以创建各种类型的图表、图形和可视化效果。无论是简单的折线图还是复杂的热力图，Matplotlib 提供了丰富的功能来满足我们的数据可视化需求。本指南将详细介绍如何安装、基本绘图函数以及常见…

阅读更多...

Vue 自定义仿word表单录入之日期输入组件

Vue 自定义仿word表单录入之日期输入组件

因项目需要，要实现仿word方式录入数据，要实现鼠标经过时才显示编辑组件，预览及离开后则显示具体的文字。鼠标经过时显示正常显示及离开时显示组件代码 <template ><div class"paper-input flex flex-col border-box "…

阅读更多...

2024-01-03 无重叠区间

2024-01-03 无重叠区间

435. 无重叠区间思路：和最少数量引爆气球的箭的思路基本都是一致了！贪心就是比较左边的值是否大于下一个右边的值 class Solution:def eraseOverlapIntervals(self, points: List[List[int]]) -> int:points.sort(keylambda x: (x[0], x[1]))# 比较…

阅读更多...

怎么把epub转换成word文档？

怎么把epub转换成word文档？

怎么把epub转换成word文档？在看电子书的时候，相信大家都接触过各种电子书格式，比如epub格式，这种格式优点很多，但有个致命的缺点就是编辑能力比较差，这种坏处带来的后果是非常严重的，会让我们无…

阅读更多...

OCP NVME SSD规范解读-6.标准日志要求-2

OCP NVME SSD规范解读-6.标准日志要求-2

STD-LOG-12:针对日志存储的类型定义了多种，复位（包括控制器复位，NSSR、FLR、PCIe hot reset）与断电重启POWER CYCLE有不同的操作要求。 STD-LOG-14: Lockdown命令是NVMe管理命令集中的一个命令，主要用于安全和管理目的…

阅读更多...

数组和函数实践：扫雷游戏玩法和棋盘初始化（1）

数组和函数实践：扫雷游戏玩法和棋盘初始化（1）

各位少年，大家好，我是博主那一脸阳光，我们学会了数组，exturn声明外部文件，static修饰静态变量，那么很显然，我们需要用到我们学习这些，实现一个扫雷游戏。扫雷游戏介绍以及玩法在地…

阅读更多...

idea git回滚之前提交记录

idea git回滚之前提交记录

提交代码时，如果不小心提交了不需要提交的内容，在本地仓库中，此时需要回滚版本，如何回滚 1.打开git控制台，左下角git,选择要处理的分支，选择刷新获取最新git提交记录 2）选中自己commit需要回滚…

阅读更多...

计算机导论03-计算机组成

计算机导论03-计算机组成

计算机系统结构冯•诺依曼体系结构冯•诺依曼体系结构的基本要点冯•诺依曼思想即冯•诺依曼体系结构思想，其最基本的概念是存储程序概念，它奠定了现代计算机的结构基础。功能部件: 计算机必须具备五大基本组成部件，包括：运…

阅读更多...

【读书笔记】学习突围

【读书笔记】学习突围

最近在读一本书《学习突围》，作者是常青，知乎大V。对他的一些回答非常认同，受益匪浅，特此买来纸质书籍细细学习一番！ 1.【学习心态】（拖延症、自控、执行力、专注力） 2.【学习方法】&#xff0…

阅读更多...

[后端] 微服务的前世今生

[后端] 微服务的前世今生

微服务的前世今生整体脉络: 单体 -> 垂直划分 -> SOA -> micro service 微服务 -> services mesh服务网格 -> future 文章目录微服务的前世今生单一应用架构特征优点：缺点： 垂直应用架构特征优点缺点 SOA 面向服务架构特征优点缺点微服…

阅读更多...

Vue入门四（组件介绍与定义｜组件之间的通信）

Vue入门四（组件介绍与定义｜组件之间的通信）

文章目录一、组件介绍与定义介绍定义1）全局组件2）局部组件二、组件之间的通信1）父组件向子组件传递数据2）子传父通信一、组件介绍与定义介绍组件(Component)是Vue.js 最强大的功能之一，它是html、css、js等的一个…

阅读更多...

bootstrap搭建一个简单的官网案例附代码

bootstrap搭建一个简单的官网案例附代码

bootstrap搭建一个简单的官网案例附代码效果常用属性完整代码效果大概的效果如下主要都是用bootstrap的代码实现的网站是照着 b站视频做的查看视频教程建议自己先看一遍文档再跟着视频写，不然可能看不懂 bootstarp中文文档 logo是从别人的站上扒的有点不太协…

阅读更多...

推荐文章

最新文章