大白话 ChatGPT 技术原理

大白话 ChatGPT 技术原理

news2026/2/14 12:03:34

▼最近直播超级多，预约保你有收获

近期直播：《Agent 企业级应用案例实战》

—1—

ChatGPT 大模型如何完成训练的？

ChatGPT 大模型训练分为以下3个步骤：

第一步、Pretraining 预训练。

给大模型海量的文本进行训练，99% 的计算量花费在这个阶段，输出的大模型叫做 base model，能做的事情就是像成语接龙一样不断的完成一段话,，也就是续写。

第二步、Supervised Fine-tuning 有监督微调。

人工介入，给出高质量的文本问答例子（Q&A）。经过问答式训练的 Model 叫做 SFT model，就可以正常回答人的问题了。

第三步、 Reinforcement Learning from Human Feedback 人类反馈的强化学习。

人工先介入，通过对同一个Prompt 生成答案的排序来训练一个 Reward Model 奖励模型。再用 Reward Model 去反馈给 SFT Model，通过评价生成结果的好坏，让大模型更倾向于生成人们喜好的结果。最终生成的 Model 叫做 RLHF model。

—2—

春节领取《AI 大模型技术知识图谱》

最近很多同学在后台留言：“玄姐，AI 大模型技术的知识图谱有没？”、“AI 大模型技术有学习路线吗？”

我们倾心整理了 AI 大模型技术的知识图谱《最全 AI 大模型技术知识图谱》和学习路线《最佳 AI 大模型技术学习路线》快来领取吧！

AI 大模型技术体系的确是相对比较复杂的，如何构建一条清晰的学习路径对每一个 IT 同学都是非常重要的，我们梳理了下 AI 大模型的知识图谱，主要包括12项核心技能：大模型内核架构、大模型开发 API、开发框架、向量数据库、AI 编程、AI Agent、缓存、算力、RAG、大模型微调、大模型预训练、LLMOps 等12项核心技能。

为了帮助每一个程序员掌握以上12项核心技能，我们准备了一系列免费直播干货，扫码一键免费全部预约领取！

END

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1446093.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

申请SSL证书怎么进行域名验证？域名验证的三种方式

申请SSL证书怎么进行域名验证？域名验证的三种方式

SSL证书是用于加密和保护Web服务器和浏览器之间通信的数字证书，在申请SSL证书时，为了防止域名被冒用，对于申请SSL证书的域名，要求先验证这个域名的所有权。而目前可用的域名验证SSL证书方式有三种：分别是DNS验证、邮箱…

阅读更多...

【Java程序设计】【C00264】基于Springboot的原创歌曲分享平台（有论文）

【Java程序设计】【C00264】基于Springboot的原创歌曲分享平台（有论文）

基于Springboot的原创歌曲分享平台（有论文） 项目简介项目获取开发环境项目技术运行截图项目简介这是一个基于Springboot的原创歌曲分享平台本系统分为平台功能模块、管理员功能模块以及用户功能模块。平台功能模块：在平台首页可以查看首…

阅读更多...

利用Windows10漏洞破解密码(保姆级教学)

利用Windows10漏洞破解密码(保姆级教学)

前言: 本篇博客只是技术分享并非非法传播知识,实验内容均是在虚拟机中进行,并非真实环境正文: 一.windows10电脑密码破解 1)开启windows10虚拟机,停留在这个页面 2）按5次Shift键,出现这个粘滞键,如果没有出现的,则说明漏洞已经修复 3)重新启动,在这个页面的时候…

阅读更多...

【Java程序设计】【C00257】基于Springboot的校园二手书交易平台（有论文）

【Java程序设计】【C00257】基于Springboot的校园二手书交易平台（有论文）

基于Springboot的校园二手书交易平台（有论文） 项目简介项目获取开发环境项目技术运行截图项目简介这是一个基于Springboot的乐校园二手书交易管理系统本系统分为系统功能模块、管理员功能模块、卖家用户功能模块以及用户功能模块。系统功能模块&…

阅读更多...

CentOS 7.9安装Tesla M4驱动、CUDA和cuDNN

CentOS 7.9安装Tesla M4驱动、CUDA和cuDNN

正文共：1333 字 21 图，预估阅读时间：2 分钟上次我们在Windows上尝试用Tesla M4配置深度学习环境（TensorFlow识别GPU难道就这么难吗？还是我的GPU有问题？），但是失败了。考虑到Windows…

阅读更多...

【思科ssh】思科模拟器配置ssh登录

【思科ssh】思科模拟器配置ssh登录

配置路由器的名称为R1 配置路由器的域名为aaa.com 使用rsa来加密传输数据，密钥位数为2048 配置登录用户名为cj，密码为123456 只允许ssh登录，不能以其他方式登录本地验证

阅读更多...

HarmonyOS 鸿蒙 ArkTS ArkUI 页面之间切换转换动画设置

HarmonyOS 鸿蒙 ArkTS ArkUI 页面之间切换转换动画设置

第一步：导入 import promptAction from ohos.promptAction 第二步：在build下方写入 pageTransition(){PageTransitionEnter({ duration: 1200 }).slide(SlideEffect.Right)PageTransitionExit({ delay: 100 }).translate({ x: 100.0, y: 100.0 }).opac…

阅读更多...

Vue核心基础4：绑定样式、条件渲染、列表渲染

Vue核心基础4：绑定样式、条件渲染、列表渲染

1 绑定样式【代码】 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>绑定样式</title><s…

阅读更多...

机器学习9-随机森林

机器学习9-随机森林

随机森林（Random Forest）是一种集成学习方法，用于改善单一决策树的性能，通过在数据集上构建多个决策树并组合它们的预测结果。它属于一种被称为“集成学习”或“集成学习器”的机器学习范畴。以下是随机森林的主要特点和原理&…

阅读更多...

3分钟部署完成Docker Registry及可视化管理工具Docker-UI

3分钟部署完成Docker Registry及可视化管理工具Docker-UI

安装docker-registry 由于镜像文件会非常占用空间，因此需要选择一个磁盘充裕的位置来存放镜像数据。这里设置为：-v /data/registry:/var/lib/registry，其中/data/registry是宿主机存放数据的位置。 docker run -d -p 5000:5000 --restart…

阅读更多...

【EAI 019】Eureka: Human-Level Reward Design via Coding LLM

【EAI 019】Eureka: Human-Level Reward Design via Coding LLM

论文标题：Eureka: Human-Level Reward Design via Coding Large Language Models 论文作者：Yecheng Jason Ma, William Liang, Guanzhi Wang, De-An Huang, Osbert Bastani, Dinesh Jayaraman, Yuke Zhu, Linxi Fan, Anima Anandkumar 作者单位&#xff…

阅读更多...

《Linux 简易速速上手小册》第10章: 性能监控与优化（2024 最新版）

《Linux 简易速速上手小册》第10章: 性能监控与优化（2024 最新版）

文章目录 10.1 理解系统负载10.1.1 重点基础知识10.1.2 重点案例：服务器响应变慢10.1.3 拓展案例 1：多核 CPU 系统的负载解读10.1.4 拓展案例 2：分析具体时间段的系统负载 10.2 优化性能10.2.1 重点基础知识10.2.2 重点案例：优化 …

阅读更多...

【JVM篇】ThreadLocal中为什么要使用弱引用

【JVM篇】ThreadLocal中为什么要使用弱引用

文章目录 🍔ThreadLocal中为什么要使用弱引用⭐总结 🍔ThreadLocal中为什么要使用弱引用 ThreadLocal可以在线程中存放线程的本地变量，保证数据的线程安全 ThreadLocal是这样子保存对象的： 在每个线程中，存放了一个…

阅读更多...

MATLAB Coder从入门到放弃

MATLAB Coder从入门到放弃

一、MATLAB Coder入门 1 MATLAB Coder是什么从 MATLAB 代码生成 C 和 C 代码 MATLAB Coder™ 可从 MATLAB 代码生成适用于各种硬件平台（从桌面计算机系统到嵌入式硬件）的 C 和 C 代码。它支持大多数 MATLAB 语言和广泛的工具箱。您可以将生成的代码作…

阅读更多...

无人机概述及系统组成，无人机系统的构成

无人机概述及系统组成，无人机系统的构成

无人机的定义无人驾驶航空器，是一架由遥控站管理（包括远程操纵或自主飞行）的航空器，也称遥控驾驶航空器，以下简称无人机。无人机系统的定义无人机系统，也称无人驾驶航空器系统，是指一架无人…

阅读更多...

第 384 场 LeetCode 周赛题解

第 384 场 LeetCode 周赛题解

A 修改矩阵模拟 class Solution { public:vector<vector<int>> modifiedMatrix(vector<vector<int>> &matrix) {int m matrix.size(), n matrix[0].size();vector<int> mx(n, INT32_MIN);for (int i 0; i < m; i)for (int j 0; j &l…

阅读更多...

Java学习-常用API-新增时间

Java学习-常用API-新增时间

1.学习JDK8新增时间的原因？ 2.JDK8新增了那些时间？ 代替calendar的 localDate localTime localDateTime 常用APi及代码示例： ZoneIdZonedDateTime 常用方法代码示例： 代替Date的 Instant常见方法及其代码示例： 注…

阅读更多...

[CUDA 学习笔记] Reduce 算子优化

[CUDA 学习笔记] Reduce 算子优化

Reduce 算子优化注: 本文主要是对文章【BBuf的CUDA笔记】三，reduce优化入门学习笔记 - 知乎的学习整理 Reduce 又称之为归约, 即根据数组中的每个元素得到一个输出值, 常见的包括求和(sum)、取最大值(max)、取最小值(min)等. 前言本文同样按照英伟达官方 PP…

阅读更多...

MOCO动量编码

MOCO动量编码

参考，推荐阅读李沐论文精读系列三：MoCo、对比学习综述（MoCov1/v2/v3、SimCLR v1/v2、DINO等）_moco 对比学习-CSDN博客背景 1. MOCO CVPR 2020 2. 对比学习：无监督学习的一种，重点学习同类实例中的共同…

阅读更多...

人脸追踪案例及机器学习认识

人脸追踪案例及机器学习认识

1.人脸追踪机器人初制用程序控制舵机运动的方法与机械臂项目完全相同。由于摄像头的安装方式为上下倒转安装，我们在编写程序读取图像时需使用 flip 函数将图像上下翻转。现在，只需要使用哈尔特征检测得到人脸在图像中的位置，再指示舵机运…

阅读更多...

推荐文章

最新文章