总结与提升

news2024/12/15 9:40:19

今天学习了ai,对今天学习的内容进行总结。

本文参考chat gpt-4的训练文献。

模型架构基础

  • Transformer 架构:ChatGPT 采用了 Transformer 架构,这是一种基于自注意力机制的深度学习模型架构。它能够并行计算文本中的长期依赖关系,有效捕捉输入文本的语义信息,从而更好地理解和生成自然语言文本。在 Transformer 架构中,包含了多个堆叠的编码器和解码器层,编码器负责将输入文本编码为一个固定维度的向量表示,解码器则根据编码器的输出和之前生成的文本,逐步生成下一个单词或字符.
  • 大规模参数:模型具有海量的参数,如 GPT-3 拥有 1.75 万亿个参数,这些大规模的参数使得模型能够学习到丰富的语言知识和语义模式,从而具备强大的语言生成能力,可以适应各种不同的自然语言处理任务,并在多个任务上达到了颠覆性的效果,如生成新闻、回答问题、翻译等.

预训练数据

  • 数据来源广泛:预训练数据来源多样,主要包括维基百科、书籍、期刊、Reddit 链接、Common Crawl 等。其中,维基百科提供了丰富的多语言、多领域且被严格引用的说明性文字;书籍则有助于训练模型的故事讲述和反应能力;期刊论文为模型提供了更有条理、理性和细致的语言表达范例;Reddit 链接中的热门内容反映了当下的流行趋势和大众关注点;Common Crawl 包含了海量的不同语言和领域的网页文本。此外,还有如 GitHub 代码数据集、Stack Exchange 对话论坛和视频字幕数据集等其他类型的数据.
  • 海量数据规模:预训练数据量达到了 45TB,如此大规模的数据为模型提供了丰富的语言样本,使其能够学习到各种语言表达方式、语义理解和知识体系,从而在面对不同的输入文本时,能够更准确地生成符合语义和逻辑的回复2.

训练方法

  • 无监督预训练:首先使用大量的无监督数据进行预训练,让模型自动从海量文本中学习语言的语法、语义、逻辑等知识和模式,如学习单词之间的共现关系、句子的结构模式、文本的语义连贯性等,初步构建起对自然语言的理解和生成能力.
  • 监督调优:在预训练的基础上,使用监督学习的方式,利用带有标签的文本数据集对模型进行进一步训练。这些标签为模型提供了明确的文本正确性和上下文信息指导,帮助模型更加准确地理解和生成符合要求的文本,使其生成的文本更加准确、连贯,能够更好地适应各种具体的自然语言处理任务,如问答、翻译等.
  • 人类反馈强化学习(RLHF):这是 ChatGPT 训练的独特之处,通过引入人类反馈来优化模型。具体包括以下几个步骤 :
    • 训练回报模型:在监督学习之后,使用强化学习中的回报模型来训练。该回报模型作为一种奖励机制,当 ChatGPT 生成合理、有条理和通顺的文本时,会给出正面的奖励值;而当生成不合理、有误导性或无意义的文本时,则给出负面的奖励值。这样可以引导模型朝着生成更符合人类期望的高质量文本的方向进行调整和优化。
    • 使用 PPO 模型微调 SFT 模型:ChatGPT 使用近端策略优化(PPO)模型来调整其回报模型,以改善模型的生成效果。同时,还采用了自我微调(SFT)技术,让模型能够根据当前的任务和数据集自主学习和调整,进一步提高模型在多个任务和数据集上的性能表现。

训练优化与改进

  • 模型微调:针对特定的任务或领域,在预训练好的模型基础上进行微调,使其更适应具体的应用场景和需求。微调时需要选择合适的预训练模型,并准备与任务相对应的数据集,然后根据任务需求构建模型,对预训练模型进行调整和初始化,通过反向传播算法更新模型参数,以最小化损失函数,提高模型在特定任务上的生成能力和语义理解能力.
  • 模型压缩:为了提高模型的运行效率和存储效率,采用模型压缩技术,如剪枝、量化、蒸馏等。剪枝通过删除一些不重要的神经元和连接来减少模型的大小和计算量;量化则是将模型中的浮点数参数转换为低精度的整数或定点数参数,以减少存储空间和计算量;蒸馏是将一个较大的教师模型的知识传递给一个较小的学生模型,从而得到一个性能较好且规模较小的模型.
  • 加速训练与推理:采用分布式训练、梯度累积、动态学习率调整等方法来加快模型的训练速度,缩短训练时间。在推理阶段,通过模型优化、硬件加速、网络剪枝和量化等技巧来提高模型的推理速度,从而提升模型的运行效率,更好地满足实际应用中的实时性要求.

下面来说一下实操:

数据收集与预处理

  • 数据收集
    • 对于文本相关的任务,可以收集新闻文章、小说、论文、社交媒体文本等。例如,训练一个新闻生成模型,就需要大量的新闻报道作为数据来源.
    • 对于图像任务,收集各种相关的图片,如训练一个动物分类模型,就需要收集不同种类动物的图片.
    • 还可以利用公开数据集,如 MNIST 数据集用于手写数字识别、CIFAR-10 数据集用于图像分类等常见的基准数据集.
  • 数据预处理 :
    • 对文本数据进行清洗,去除噪声、重复内容、特殊符号等,然后进行分词、词向量化等操作,将文本转化为模型能够处理的格式。
    • 对于图像数据,进行裁剪、缩放、归一化等操作,使图像数据具有统一的尺寸和格式,便于模型训练。

选择合适的模型架构

  • 根据任务类型和数据特点选择模型架构:
    • 卷积神经网络(CNN):适用于处理图像数据,能够自动提取图像的特征,如在图像分类、目标检测等任务中表现出色1.
    • 循环神经网络(RNN)及其变体:如长短期记忆网络(LSTM)和门控循环单元(GRU),适合处理序列数据,如文本生成、语音识别等自然语言处理任务.
    • Transformer 架构:在自然语言处理领域广泛应用,能够有效捕捉文本中的长距离依赖关系,如 GPT、BERT 等模型都是基于 Transformer 架构构建的,适用于文本生成、机器翻译等多种任务.

模型训练

  • 准备训练环境
    • 安装必要的软件和库,如 Python、TensorFlow、PyTorch 等深度学习框架及其相关依赖库.
    • 配置合适的硬件环境,对于小规模的模型训练,普通的高性能个人电脑可能就足够,但对于大规模复杂模型,可能需要使用云计算服务或专用的 GPU 服务器来加速训练.
  • 确定超参数
    • 设置学习率,学习率决定了模型参数更新的步长,过大或过小的学习率都可能影响训练效果,通常需要通过试验来选择合适的学习率值.
    • 确定批次大小,即每次训练时使用的数据样本数量,批次大小会影响训练的速度和模型的收敛情况.
    • 设定训练的轮数,即模型对整个数据集进行训练的次数,一般来说,训练轮数越多,模型越有可能收敛到更好的性能,但也可能导致过拟合.
  • 开始训练
    • 将预处理后的数据输入到选定的模型中,使用选定的优化算法,如随机梯度下降(SGD)、Adagrad、Adadelta、Adam 等,对模型的参数进行更新,以最小化损失函数的值.
    • 在训练过程中,监控模型的训练损失、准确率等指标的变化情况,根据这些指标的变化趋势来调整训练策略,如调整学习率、提前停止训练等,防止过拟合和欠拟合的发生.

模型评估与优化

  • 模型评估
    • 使用测试数据集对训练好的模型进行评估,计算各种评估指标,如准确率、精确率、召回率、F1 值、均方误差等,以客观地评价模型的性能和泛化能力.
    • 除了定量评估指标外,还可以通过人工观察和分析模型生成的结果来进行定性评估,如查看生成的文本是否通顺、合理,图像是否符合预期等。
  • 模型优化 :
    • 如果模型存在过拟合问题,可以采用正则化技术,如 L1 正则化、L2 正则化、Dropout 等,来减少模型的复杂度,防止模型对训练数据过度拟合。
    • 若模型性能不理想,可以尝试调整模型的结构,如增加或减少层数、神经元数量等,或者更换不同的模型架构。
    • 还可以收集更多的数据或对数据进行增强,以增加数据的多样性,提高模型的泛化能力。

模型部署与应用

  • 将训练好且经过评估和优化的模型部署到实际的生产环境中,使其能够为具体的应用提供服务.
  • 根据应用的需求,开发相应的接口或应用程序,将模型集成到整个系统中,实现 AI 模型的实际应用价值,如将图像分类模型集成到图像识别系统中,将文本生成模型应用于智能写作助手等

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2259864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【USB-HID】“自动化键盘“

这里写目录标题 【USB-HID】"自动化键盘"1. 前言2. 框架3. 实现3.1 模拟键盘按键输入 【USB-HID】“自动化键盘” 1. 前言 最近从朋友那了解了一种"自动化键盘",能够通过上位机录制按键脚本,然后执行脚本,实现物理键盘…

使用ECK 快速部署 Elasticsearch 集群 + Kibana

部署 ECK [2.12] 安装说明 ElasticCloudonKubernetes(ECK)是一个 Elasticsearch Operator,但远不止于此。ECK 使用 Kubernetes Operator 模式构建而成,需要安装在您的 Kubernetes 集群内; 借助 Elastic Cloud on Kubernetes (ECK)&#xff0…

ruoyi Cannot find module ‘@/views/system/user/index‘

Cannot find module /views/system/user/index 删除node_module 后打包成功

从开始实现扩散概率模型 PyTorch 实现

目录 一、说明 二、从头开始实施 三、线性噪声调度器 四、时间嵌入 五、下层DownBlock类块 六、中间midBlock类块 七、UpBlock上层类块 八、UNet 架构 九、训练 十、采样 十一、配置(Default.yaml) 十二、数据集 (MNIST) keyword: Diffusion…

航空航天总线协议分析ARINC429

ARINC429是商用飞机和运输机运用最广泛的总线之一,ARINC是美国航空无线电公司(Aeronautical Radio INC.)的缩写,ARINC429总线协议是美国航空电子工程委员会于1977年7月提出发表并获批准使用,它的规范全称是数字式信息传输系统(Digital Inform…

Unity UGUI图片循环列表插件

效果展示: 下载链接:https://gf.bilibili.com/item/detail/1111843026 概述: LoopListView2 是一个与 UGUI ScrollRect 相同的游戏对象的组件。它可以帮助 UGUI ScrollRect 以高效率和节省内存的方式支持任意数量的项目。 对于具有10,000个…

【经验分享】私有云运维的知识点

最近忙于备考没关注,有次点进某小黄鱼发现首页出现了我的笔记还被人收费了 虽然我也卖了一些资源,但我以交流、交换为主,笔记都是免费给别人看的 由于当时刚刚接触写的并不成熟,为了避免更多人花没必要的钱,所以决定公…

解决MAC装win系统投屏失败问题(AMD显卡)

一、问题描述 电脑接上HDMI线后,电脑上能显示有外部显示器接入,但是外接显示器无投屏画面 二、已测试的方法 1 更改电脑分辨,结果无效 2 删除BootCamp,结果无效 3更新电脑系统,结果无效 4 在设备管理器中&#…

huggingface NLP -Transformers库

1 特点 1.1 易于使用:下载、加载和使用最先进的NLP模型进行推理只需两行代码即可完成。 1.2 灵活:所有型号的核心都是简单的PyTorch nn.Module 或者 TensorFlow tf.kears.Model,可以像它们各自的机器学习(ML)框架中的…

1. 机器学习基本知识(2)——机器学习分类

1.4 机器学习分类 1.4.1 训练监督 1. 监督学习:已对训练数据完成标记 分类:根据数据及其分类信息来进行训练,使模型能够对新的数据进行分类 回归:给出一组特征值来预测目标数值 2. 无监督学习:没有对训练数据进行任…

[C#]使用winform部署ddddocr的onnx模型进行验证码识别文字识别文字检测

【算法介绍】 ddddocr是一个强大的Python OCR(光学字符识别)库,特别适用于验证码识别。它利用深度学习技术,如卷积神经网络(CNN)和循环神经网络(RNN),对图像中的文字进行…

day10 电商系统后台API——接口测试(使用postman)

【没有所谓的运气🍬,只有绝对的努力✊】 目录 实战项目简介: 1、用户管理(8个) 1.1 登录 1.2 获取用户数据列表 1.3 创建用户 1.4 修改用户状态 1.5 根据id查询用户 1.6 修改用户信息 1.7 删除单个用户 1.8 …

云服务器搭建lamp的wordpress

Ubuntu系统搭建过程目录 一、检查环境1.1 检查是否安装Apache1.2 检查是否安装Mysql1.3 检查是否安装PHP 二、安装Apache截图 三、安装Mysql3.1 安全安装配置3.2 修改权限和密码3.3 重启MySQL服务 四、安装PHP4.1 测试截图 五、下载并安装wordpress以及配置5.1 下载并解压移动5…

C#速成(GID+图形编程)

常用类 类说明Brush填充图形形状,画刷GraphicsGDI绘图画面,无法继承Pen定义绘制的对象直线等(颜色,粗细)Font定义文本格式(字体,字号) 常用结构 结构说明Color颜色Point在平面中定义点Rectan…

babeltrace与CTF相关学习笔记-4

babeltrace与CTF相关学习笔记-4 写在前面metadata_string 重头开始定位,操作meta的位置bt_ctf_trace_get_metadata_string stream部分内存的问题 写在前面 正在并行做几件事。 在编译过程中,突然想到,还是再详细研究一下之前的例程。 一是详…

多旋翼无人机 :桨叶设计—跷跷板结构

多旋翼无人机 :桨叶设计——跷跷板结构 前言跷跷板结构 前言 2024年11月,大疆发布了最新的农业无人机T70和T100。其中T70不同于以往的机型,在桨夹处采用了翘翘板结构,大疆将其命名为“挥舞桨叶”。 T70 无人机如下 放大其中螺旋…

低通滤波器,高通滤波器,公式

1 低通滤波器 :输出的是电容的电压 1 低通滤波器可以把低频信号上面的高频信号给滤掉 2 100hz正常通过 3 经过低通滤波器后,波形光滑,绿色波形。一致 4 电容充电速度跟不上输入信号的速度(因为加了电阻,限制了电流&…

如何打造个人知识体系?

第一,每个人的基本情况不同。比如我有一个类别跟「设计」相关,这是自己的个人爱好,但不一定适合其他人。再比如我还有一个类别跟「广告文案」相关,因为里面很多表达可以借用到演讲或写作中,这也不适合所有人。 第二&am…

5G中的ATG Band

Air to Ground Networks for NR是R18 NR引入的。ATG很多部分和NTN类似中的内容类似。比较明显不同的是,NTN的RF内容有TS 38.101-5单独去讲,而ATG则会和地面网络共用某些band,这部分在38.101-1中有描述。 所以会存在ATG与地面网络之间的相邻信…

《自动驾驶技术的深度思考:安全与伦理的挑战》

内容概要 在当今这个自动驾驶技术飞速发展的时代,我们生活的节奏恰似一场疾驰的赛车,然而,赛道上并非总是平坦。在这场技术革命中,安全与伦理问题像是潜伏在阴影中的幽灵,轮番考验着我们的道德底线与法律界限。 随着…