ChatGPT基础(一) GPT的前世今生

news2024/11/28 16:35:25

文章目录

      • GPT模型简史
      • GPT系列模型
      • ChatGPT的应用

最近ChatGPT3.5可以免注册使用了,出来刨一波坟 说一说ChatGPT的来源和应用。

在这里插入图片描述

GPT模型简史

Generative pre-trained transformers(GPT)生成式预训练转换模型是大语言模型的一种(Large Language Model–>LLM)。它是用于自然语言处理的人工神经网络,可以在未经标记的语料上进行训练并能在基础的信息上生成出全新的内容。

GPT的前身可以追溯到2015年由Ian Goodfellow等人在论文《Generative Adversarial Nets》中首次提出,该模型使用生成对抗网络(GAN)学习生成数据,从而能够生成高质量的图像和文本。2018年,OpenAI基于GAN模型的思想发布了一款新的自然语言处理模型——GPT-1。

在这里插入图片描述

GPT系列模型

GPT模型是由OpenAI发布的一系列模型的总称。

在这里插入图片描述

GPT-1: 2018年11月OpenAI发布了GPT-1,是以4.5GB的文本资料作为训练数据得到的模型,该模型有接近1.2亿个参数。GPT-1是一个单向的语言模型它在预测下一个单词时,只考虑了前面的单词,效果一般。

GPT-2: 为了改进GPT-1的性能,OpenAI在2019年2月发布了GPT-2,新模型基于40GB的文本资料训练得到,有15亿个参数 是当时最大的语言模型之一。与GPT-1相比,GPT-2的文本处理能力有了显著提升,它可以生成更加自然和流畅的语言。

GPT-3: 在GPT-2的基础上,OpenAI 2020年又开发了一款更加强大的自然语言处理模型——GPT-3。GPT-3以570GB的资料作为语料训练得到,有1750亿个参数。

GPT-3.5: 在GPT-3的基础上,2022年3月OpenAI发布了GPT3.5模型,该模型同样也有1750亿个参数,并且基于GPT3.5推出了对应的聊天机器人ChatGPT,自此OpenAI一战封神,将人工智能推上了巅峰。

GPT-4.0: 2023年3月OpenAI推出了GPT-4.0,该模型据说有1.7万亿个参数,可以同时处理文字和图像号称地表最强大模型,只不过收费了价格还不便宜。

ChatGPT的应用

基于GPT-3.5的思想,OpenAI开发了一个针对对话场景的自然语言处理机器人——ChatGPT。具有强大的对话生成能力,它可以生成自然流畅的对话。它还可以进行问题回答、图像描述、翻译、文本分类、知识图谱等多种自然语言处理任务。ChatGPT已经成为一个非常受欢迎的自然语言处理模型,被广泛应用于智能客服、智能问答、聊天机器人等领域。

1.智能问答: 可以智能回答各个领域的知识问题,答案质量好 响应快。

2.文本翻译: 可以进行文本和内容的翻译。

3.摘要总结: 可以总结提取大段文章和内容的核心要点,梳理内容脉络.。

4.文本生成: 可以根据关键字和内容提示,生成新的文章,用来写小作文很不错 例如生成诗歌、新闻报道、小说等。

5.信息检索: 可以快速帮你梳理和查找对应领域的知识点和内容。

6.聊天机器人: 可以作为聊天机器人使用,与您进行简单的对话并提供有用的信息和资源。

7.情感分析: 可以分析文本的情感,并判断其中是否包含正面、负面或中性情感。

8.图像描述: 可以根据输入的图像生成文字描述,不过得用GPT4.0,GPT3.5目前不支持图像的处理。

9.搜索引擎优化: 如果有网站或者博客,它可以提供有关搜索引擎优化的建议和技巧.

10.知识图谱:它可以提供有关特定主题的知识图谱,并且可以回答与知识图谱相关的问题。

11.辅助编程: 可以回答各种编程相关的问题,并且可以为编程者提供建议和帮助。

注: 知识图谱是一种强大的知识表示和组织方式,通过将信息以图形结构的形式表示出来,使得计算机能够更好地理解和利用这些知识,从而实现各种智能应用.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1576843.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

带你了解CST的Frontend License Released【官方教程】

什么是Frontend License Released? 了解内部功能,有效使用License! File>Release Frontend License 使用CST的过程中,应该见过右图的提示。这是长期没有在CST中进行Modeling、仿真分析设置等Pre-Processing操作,或者从结果…

【代码】C语言|保留小数点后n位并四舍五入,便于处理运算和存储不善的浮点数

前言 有个人跟我说浮点数运算起来非常麻烦,总是算着算着丢失精度,导致计算结果取int的时候取不准。毕竟系统也没有自动根据这个数的精度四舍五入的功能。 比如int(2.999999999999999)2,但是float(2.999999999999999)3.000000。 我觉得这个问…

GD32零基础教程第三节(模块化编程封装LED模块)

文章目录 前言一、模块化编程概念二、创建HardWare文件夹管理硬件模块文件三、编写led.c和led.h文件总结 前言 模块化编程是将一个大型系统分解为更小、更易管理的模块或组件的过程。每个模块都有明确定义的接口和功能,可以独立开发、测试和维护。那么本篇文章将带…

相位导数方差计算-matlab

%% 下面计算 相位导数方差% 假设 phase_map 是你的相位图二维矩阵 % K 是窗口的大小 k 3; % 请使用实际的窗口大小替换% 计算 x 和 y 方向的偏导 [dx, dy] gradient(wrappedPhase); Ksq k^2; % 计算 K^2half_k floor(k / 2);% 初始化结果矩阵 result zeros(size(wrappedPh…

蓝桥杯刷题--RDay6

特殊日期 3.特殊日期 - 蓝桥云课 (lanqiao.cn)https://www.lanqiao.cn/problems/2408/learning/?first_category_id1&page1&second_category_id3&tags2023 对于一个日期,我们可以计算出年份的各个数位上的数字之和,也可以分别计算月…

【Django开发】前后端分离美多商城项目第6篇:用户部分,1. 业务说明【附代码文档】

美多商城项目4.0文档完整教程(附代码资料)主要内容讲述:美多商城,项目准备1.B2B--企业对企业,2.C2C--个人对个人,3.B2C--企业对个人,4.C2B--个人对企业,5.O2O--线上到线下,6.F2C--工厂到个人。项目准备,配置1. 修改set…

单例模式--理解

单例模式 单例模式是指在内存中只会创建且仅创建一次对象的设计模式。在程序中多次使用同一个对象且作用相同时,为了防止频繁地创建对象使得内存飙升,单例模式可以让程序仅在内存中创建一个对象,让所有需要调用的地方都共享这一单例对象。 单…

基于单片机室内温湿度监测系统仿真设计

**单片机设计介绍,基于单片机室内温湿度监测系统仿真设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机室内温湿度监测系统仿真设计的沟通概要主要涉及以下几个方面: 一、项目背景与目标 首…

借助 Aspose.Words,在 C# 中将图片转换为 Word

Microsoft Word 提供了多种用于生成具有增强的格式化功能的文本文档的工具。除了文本格式之外,我们还可以将各种图形元素和图像合并到Word文档中。在某些情况下,我们可能需要将图片或照片插入DOC或DOCX格式的Word文档中。在本文中,我们将学习…

【redis数据同步】redis-shake数据同步全量+增量

redis-shake数据同步 redis-shake是基于redis-port基础上进行改进的一款产品。它支持解析、恢复、备份、同步四个功能。以下主要介绍同步sync。 恢复restore:将RDB文件恢复到目的redis数据库。备份dump:将源redis的全量数据通过RDB文件备份起来。解析de…

个推助力小米汽车APP实现智能用户触达,打造智能出行新体验

4月3日,小米SU7首批交付仪式在北京亦庄的小米汽车工厂总装车间举行,全国28城交付中心也同步开启首批交付。随着小米SU7系列汽车的正式发售和交付,小米汽车APP迎来了用户体量的爆发式增长。 小米汽车APP是小米汽车官方推出的手机应用&#xff…

Echarts基础-安装语法高亮插件less-rem转换动态适配大小

Echarts基础-安装语法高亮插件&less-rem转换动态适配大小 基础介绍插件安装教程安装less 插件安装cssrem 插件引入flexibel.js文件 基础介绍 Echarts是一个功能强大的JavaScript开源可视化库,专门用于创建各种图表和数据可视化。 以下是关于Echarts的一些基础介…

区块链技术与数字身份:解析Web3的身份验证系统

在数字化时代,随着个人数据的日益增多和网络安全的日益关注,传统的身份验证系统面临着越来越多的挑战和限制。在这种背景下,区块链技术的出现为解决这一问题提供了全新的思路和解决方案。Web3作为一个去中心化的互联网模式,其身份…

Elasticsearch快速上手

基本概念 索引(Index) 索引是文档的容器,就像关系数据库中,要存储行记录必须先创建数据库和表一样。 类型(Type) ES6 及之前的版本还存在”类型“的概念,一个索引下可以存储多个类型的文档&am…

电脑怎么录屏带声音?这么操作就对了!

随着数字化时代的快速发展,电脑录屏带声音的需求逐渐增多。无论是为了制作教学视频、游戏解说,还是为了记录会议内容,一个稳定、易用的录屏工具都是必不可少的,可是电脑怎么录屏带声音呢?本文将介绍两种电脑录屏方法&a…

五一假期来临,各地景区云旅游、慢直播方案设计与平台搭建

一、行业背景 经文化和旅游部数据中心测算,今年清明节假期3天全国国内旅游出游1.19亿人次,按可比口径较2019年同期增长11.5%;国内游客出游花费539.5亿元,较2019年同期增长12.7%。踏青赏花和户外徒步成为假期的热门出游主题。随着…

C++模仿qq界面

#include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {//设置窗口的大小this->resize(645,497);//设置窗口名字this->setWindowTitle("QQ");//设置窗口图标this->setWindowIcon(QIcon("C:\\zhouzhouMyfile\\qt_proj…

Java知识体系最强总结(2024版)

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

LLM - 大语言模型(LLM) 的 应用技术

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/137503579 大语言模型(LLM) 的应用技术范围非常广泛,即: LangChain:开发框架,专为大型语言模型设计,以提高开发人工智能应用的效率,允许开发者将语言模…

基于springboot实现墙绘产品展示交易平台管理系统项目【项目源码+论文说明】

基于springboot实现墙绘产品展示交易平台系统演示 摘要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本墙绘产品展示交易平台就是在这样的大环境下诞生&#xff…