【GPT LLM】跟着论文学习gpt

news2026/2/13 7:28:57

GPT1开山之作：Improving language understanding by generative pre-training

在这里插入图片描述
本文提出了gpt1，即使用无标签的数据对模型先进行训练，让模型学习能够适应各个任务的通用表示；后使用小部分 task-aware的数据对模型进行微调，可以在各个task上实现更强大的功能。

设计框架

分为两块，pre-train和fine-tune，使用transformer模型的解码器部分。

第一阶段：Unsupervised pre-training

预测连续的k个词的下一个词的概率，本质就是最大似然估计，让模型下一个输出的单词的最大概率的输出是真实样本的下一个单词的 $u_i$ 。后面的元素不会看，只看前k个元素，这就和transformer的解码器极为相似。
在这里插入图片描述

第二阶段：Supervised fine-tuning

训练下游的task的数据集拥有以下形式的数据：假设每句话中有m个单词，输入序列 ${x^1,x^2,...,x^m\}$ 和一个标签 $y$ （忧下游任务决定）。
在这个阶段，作者定义了两个优化函数，L1保证句子的连贯性，L2保证下游任务的准确率。
在这里插入图片描述

其完整的内部结构如下：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/656626.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

csdn编辑

csdn编辑

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

阅读更多...

【tensorflow】连续输入+离散输入的神经网络模型训练代码

【tensorflow】连续输入+离散输入的神经网络模型训练代码

【tensorflow】连续输入离散输入的神经网络模型训练代码离散输入的转化问题构造词典创建离散数据、转化字典索引、创建连续数据创建离散输入连续输入模型训练输出全部代码 - 复制即用查看本系列三种模型写法： 【tensorflow】连续输入的线性回归模型训…

阅读更多...

基于知识图谱的电影推荐系统——Neo4jPython

基于知识图谱的电影推荐系统——Neo4jPython

文章目录 1. 数据解下载与配置2. 将处理好的数据导入数据库中3. 执行项目 1. 数据解下载与配置选择TMDB电影数据集，Netflix Prize 数据集下载。也可直接从这里下载：链接: https://pan.baidu.com/s/1l6wjwcUzy5G_dIlVDbCkpw 提取码: pkq6 。执行prep…

阅读更多...

【AI】金融FinGPT模型

【AI】金融FinGPT模型

金融FinGPT模型开源，对标BloombergGPT，训练参数可从61.7亿减少为367万，可预测股价继Bloomberg提出了500亿参数的BloombergGPT，GPT在金融领域的应用受到了广泛关注，但BloombergGPT是一个非开源的模型，而且…

阅读更多...

【ESP32之旅】U8g2 在线仿真和UI调试

【ESP32之旅】U8g2 在线仿真和UI调试

前言几乎每个玩屏幕的电子DIYer都知道万能的屏幕驱动中间件u8g2库，这个库提供了强大的驱动适配和ui设计能力。但是官方没有一个好用的ui设计和仿真软件，在设计UI布局的时候对单片机频繁的烧录调试浪费了大量的时间。最近在论坛看到有一个第三方维护的在…

阅读更多...

nginx映射后，公网通过域名无法访问到静态资源

nginx映射后，公网通过域名无法访问到静态资源

今天发生一件奇怪的事情，首先是阿里云的数字DV证书中pgj.bw580.com和acc.bw580.com无缘无故的消失了， 接着查看https://pgj.bw580.com/css/chunk-ceb11154.aefc15d8.css，在跳板机中可以访问到该资源，但是通过外网能够访问。通过防…

阅读更多...

MySQL 中各种锁的详细介绍

MySQL 中各种锁的详细介绍

❤ 作者主页：欢迎来到我的技术博客😎 ❀ 个人介绍：大家好，本人热衷于Java后端开发，欢迎来交流学习哦！(￣▽￣)~* 🍊 如果文章对您有帮助，记得关注、点赞、收藏、…

阅读更多...

P109认识和改造世界

P109认识和改造世界

认识世界的根本目的在于改造世界认识和改造世界之间的辩证关系感觉只喜欢考必然和自由的辩证关系人类创造历史的两个基本活动 ： 认识和改造世界所以认识和改造世界的基础是实践认识改造和三大界之间的联系改造客观世界和改造主观世界之间的关系认识世界…

阅读更多...

台电x80HD 安装linux系统，可调电压电源供电，外网访问、3D打印klipper固件

台电x80HD 安装linux系统，可调电压电源供电，外网访问、3D打印klipper固件

一、系统安装参照https://blog.csdn.net/gangtieren/article/details/102975027安装安装过程遇到的问题： 1、试了 linux mint 21 、ubuntu20.04 、ubuntu22.04 都没有直接安装成功，u盘选择安装进入系统后一直黑屏，只有ubuntu18.04 选择后稍…

阅读更多...

基于Eclipse+Java+Swing+Mysql实现学生成绩管理系统

基于Eclipse+Java+Swing+Mysql实现学生成绩管理系统

基于EclipseJavaSwingMysql实现学生成绩管理系统一、系统介绍二、功能展示1.登陆2.成绩浏览3.班级添加4.班级维护5.学生添加6、学生维护三、数据库四、其它1.其他系统实现五.获取源码一、系统介绍学生：登陆、成绩浏览管理员：登陆、班级添加、班级维…

阅读更多...

多分支merge忽略文件合并

多分支merge忽略文件合并

该文章已同步收录到我的博客网站，欢迎浏览我的博客网站，xhang’s blog 1. .gitattributes 文件的作用 .gitattributes 文件是 Git 版本控制系统中的一个配置文件，它用于指定 Git 如何处理文件的二进制数据，以及如何标识文件的类…

阅读更多...

字节月薪23k软件测试工程师：必备的6大技能（建议收藏）

字节月薪23k软件测试工程师：必备的6大技能（建议收藏）

软件测试随着软件开发行业的日益发展，岗位需求量和行业薪资都不断增长，想要入行的人也是越来越多，但不知道从哪里下手，今天，就给大家分享一下，软件测试行业都有哪些必会的方法和技术知识点，作…

阅读更多...

夏天到了，给数据中心泼点“冷水”

夏天到了，给数据中心泼点“冷水”

气温上升，还有什么能比“工作没了”，更能让人一瞬间心里拔凉拔凉的呢？ 这个“薪尽自然凉”的故事，就发生在数据中心。前不久，某电商平台正在购物高峰期，结果IDC冷冻系统故障，机房设备温度快速升…

阅读更多...

智能电动汽车充电桩系统及硬件电路研究安科瑞许敏

智能电动汽车充电桩系统及硬件电路研究安科瑞许敏

摘要：随着充电桩技术的发展，以及人们对电动汽车快速充电的需求，很多厂商开始对智能充电桩进行研究。以电动汽车智能充电桩的发展现状为背景，进行了智能电动汽车充电桩系统硬件电路的研究。关键词：充电桩&#xff1b…

阅读更多...

文件转换工具类—基于jodconverter和pdfbox实现的可以自定义各类文件转换和水印

文件转换工具类—基于jodconverter和pdfbox实现的可以自定义各类文件转换和水印

源码获取：原文地址概览需要依赖 <dependency><groupId>org.jodconverter</groupId><artifactId>jodconverter-local</artifactId><version>4.4.6</version> </dependency> <dependency><groupId>or…

阅读更多...

【MyBatis学习】占位符,sql注入问题,like模糊匹配等可能出现一定的问题,赶快与我一同去了解,避免入坑吧 ! ! !

【MyBatis学习】占位符,sql注入问题,like模糊匹配等可能出现一定的问题,赶快与我一同去了解,避免入坑吧 ! ! !

前言: 大家好,我是良辰丫,今天还是我们的mybatis的学习,主要内容有两个占位符,sql注入问题,like模糊匹配,以及多表查询等,不断提升我们的编程能力,加油哈! ! !💌💌💌 🧑个人主页：良辰针不戳 📖所属专栏&…

阅读更多...

MP地面站下载和回放日志

MP地面站下载和回放日志

参考 https://ardupilot.org/dev/docs/common-downloading-and-analyzing-data-logs-in-mission-planner.html#common-downloading-and-analyzing-data-logs-in-mission-planner 下载日志首先连接上飞控然后在下图页面下载日志： 点击下图下载日志下载的日志会…

阅读更多...

在CentOS 7上安装Python 3.9

在CentOS 7上安装Python 3.9

前言这是我在这个网站整理的笔记，关注我，接下来还会持续更新。作者：RodmaChen 在CentOS 7上安装Python 3.9 一. 更新系统软件包二. 安装必要的软件包和依赖项三. 下载Python 3.9四. 解压和编译源代码五. 安装Python 3.9六. 验证安装一. 更…

阅读更多...

SpringCloud Alibaba-Seata分布式事务

SpringCloud Alibaba-Seata分布式事务

SpringCloud Alibaba-Seata 1 常用事务解决方案模型1.1 DTP模型1.2 2PC1.3 3PC1.4 TCC 2 Seata2.1 Seata术语2.1 Seata AT模式2.1.1 AT模式及工作流程2.1.2 Seata-Server安装2.1.3 集成springcloud-alibaba 4.2 Seata TCC模式 3 Seata注册中心3.1 服务端注册中心配置3.2 客户端…

阅读更多...

全国主要城市建筑轮廓（含层高）矢量数据分享及最新AI提取建筑分布方法介绍

全国主要城市建筑轮廓（含层高）矢量数据分享及最新AI提取建筑分布方法介绍

今天要给大家带来的数据就是全国主要大中型城市的城市建筑轮廓矢量数据！！同时给大家一个傻瓜式的建筑物提取软件，以及其使用方法！！ 第一部分：数据一、数据基本情况建筑轮廓数据实际上就是建筑的边界矢量…

阅读更多...

推荐文章

最新文章