从GPT-3到CHAT-GPT(CHAT-GPT如何申请)

news2024/9/23 17:14:36

回顾2020年7月

2020年7月份有一个重大新闻,人工智能科研公司OpenAI,推出了它的新一代语言模型 GPT-3(Generative Pretrained Transformer 3),这个事情在社交媒体影响甚广,甚至有一篇文章《一个新型 AI 震惊硅谷:它像一个高智商的人,颠覆对 AI 的认知》,这个标题并不算夸张,文章写的也很好,你可以找来读读

关于GPT-3的发展历史,我在OpenAI Playground 提交了请求,如下是她自己对自己的描述

给我写一篇关于GPT-3发展历史的文章

GPT-3是一种自然语言处理(NLP)技术,它是一种自然语言生成技术,可以根据给定的输入生成文本输出。它的发展历史可以追溯到2012年,当时OpenAI团队推出了第一代GPT(Generative Pre-trained Transformer)。

GPT-1是一种强大的多层网络,它可以像人类一样理解和利用自然语言,可以根据已给定的输入来生成自然语言文本。GPT-1的模型具有灵活性,它可以根据输入语句的上下文和语境,生成出更有意义的文本内容。GPT-1也支持自动化任务,例如文本转换、文本摘要和文本翻译等。

此后,OpenAI又推出了GPT-2,它是一种比GPT-1更先进的自然语言生成技术。GPT-2模型使用一种更大的数据集,模型的参数也比GPT-1更多。GPT-2模型的精度比GPT-1更高,它可以根据更细致的上下文和语境,生成出更有意义的文本内容。

最近,OpenAI又推出了GPT-3模型,GPT-3是一个大规模的自然语言处理(NLP)模型。GPT-3可以根据输入语句的上下文和语境,生成出更有意义的文本内容。GPT-3模型可以使用更大的数据集,模型的参数也比GPT-2更多,可以根据更细致的上下文和语境,生成出更有意义的文本内容。

总的来说,GPT-3是一种极具前瞻性的自然语言处理(NLP)技术,它的出现大大提高了自然语言处理的精度和效率。GPT-3可以用于各种自然语言处理(NLP)的应用,包括文本理解、自动问答、文本生成等。GPT-3的发展将继续推动自然语言处理(NLP)技术的发展,为我们提供更加智能的自然语言处理(NLP)解决方案。

GPT-3 能写情书、会写诗、写产品说明文档、写剧本。它会翻译,会回答问题,会完形填空,会做阅读理解题,要命的是可以陪你聊天 ,并且让你感觉不到她是AI

2010年以后的语言模型几乎全都是基于深度神经网络(DNN)的,衡量一个神经网络的大小可以看它有多少个“参数”。网络的每一个神经元结构点上都有若干个可调参数,参数描写了这个网络。2012 年,在 ImageNet 竞赛中获得冠军的一个能识别手写阿拉伯数字的简单神经网络,它有 1 万多个参数。代表当时图形识别技术最先进水平的 AlexNet,有 6200 万个参数1

GPT-3 的上一代,OpenAI 的 GPT-2,有 15 亿个参数。Nvidia 公司的一个语言模型 Megatron,有 80 亿个参数。微软的“图灵 NLG”,有 170 亿个参数。而GPT-3,有 1750 亿个参数。而下一代GPT-4的参数量将是GPT-4参数量的500倍2

硅谷创业圈有个概念叫“十倍思维”,就是说你的新产品得比别人好十倍,拿出来才有意思,我感觉现在OpenAI弄的神经网络就很有十倍思维的味道

2020年的GPT-3,还只是极客圈里广泛传播,OpenAI 的CEO说,GPT-3 这个热度其实是个 hype。那时候的GPT-3远没有如今的江湖地位和江湖声誉,很多开发者甚至都不太知道,但是我们团队一直在使用AI代码补全插件Tabnine,其基于GPT-2

在这里插入图片描述

GPT-3的近况

最近,ChatGPT 🔥了,这是OpenAI时隔了2年半,推出的一个在线对话应用,之前GPT-3一直都是内测,需要申请账号(关键是不好申请,中签率堪比北京车牌摇号)现在OpenAI不但开放了普通用户注册,而且还升级了应用模型,ChatGPT这个对话应用,每个人都可以上手(中国和俄罗斯可能有一定的门槛)

从此之后,每个人都可以和AI对话,借助AI来提高生产力,就我本人这几天的使用体验来看,十分惊喜,有一种如沐春风,如获至宝的感觉,可以说GPT-3是一位得力的助手

如何注册?

首先你要去OpenAI网站(https://beta.openai.com/ )注册一个账号,每个新注册用户自动获得18美元的试用额度,这个额度可以用挺长时间,快一个星期了,我只用了不到0.2🔪

在这里插入图片描述

注册的时候需要手机号,BUT目前不支持中国大陆的手机号,如果想玩的话,你需要一个境外的手机号,或者使用境外的接码平台3 (链接中的接码平台是付费的,可以用支付宝充1美元,甚至这个接码平台内嵌了一个CHATGPT的教程),再或者你可以在电商平台买一个 OpenAI 账号,又或者你有朋友在国外,让他们买好票,你上车就行

在这里插入图片描述

怎么玩

注册好账号,你可以有2个选择:

🅰️ 去 Playground (https://beta.openai.com/playground ) 开练

🅱️ 去CHATGPT(https://chat.openai.com/chat)开聊

注册好账号,你可以有2个选择:

🅰️ 去 Playground (https://beta.openai.com/playground ) 开练

🅱️ 去CHATGPT(https://chat.openai.com/chat)开聊

无论哪个选择,你要做的就是在页面中输入你想让AI干的事儿。我们使用🅰️来一个测试,我输入:「写一封情书」,绿色的是她给的答复

在这里插入图片描述

可见,GPT-3是支持中文的,但是使用中文的响应时间明显慢于英文,大概率她是将中文翻译成英文,在得到结果之后再把英文结果翻译为中文展示。最后就GPT-3这个文笔,那对象还不得马上来么

在Playground页面的右侧可以选择

  • 模型(Model)
  • 温度(Temperature)
  • 最大输出长度(Maximum length)

现在默认的模型就是11月刚刚升级的、基于GPT-3的 text-davinci-003,也是最好的一个。「温度」代表AI输出的自由度,也就是有多大的随机性:如果你想让它更有创造性,可以调高这个参数;如果你发现有时候她话没说完,就"没声了",就需要把最大输出长度设置大一点

接着,我们使用🅱️ 做一个测试,问一个我同事关心的问题

在这里插入图片描述

就我的使用体验来看,ChatGPT输出的答案不如 Playground 的那个 text-davinci-003 模型好,但是它的UI更友好。另外网上有一个 Chrome 浏览器的插件4,可以在谷歌的搜索结果页插入 ChatGPT 的回答(下图),让用户比较谁回答得更好

在这里插入图片描述

最后

2022年可能将是 AI 应用的元年(虽然已经多次AI元年了),人工智能对人类社会的重大改造,或许就从今年开始了,望你工作中有AI给你打辅助,生活中有AI陪你唠家常

更多精彩内容欢迎关注公众号 stackoverflow


  1. https://www.learnopencv.com/number-of-parameters-and-tensor-sizes-in-convolutional-neural-network/ ↩︎

  2. https://towardsdatascience.com/gpt-4-will-have-100-trillion-parameters-500x-the-size-of-gpt-3-582b98d82253 ↩︎

  3. https://sms-activate.org/cn/ ↩︎

  4. https://github.com/wong2/chat-gpt-google-extension ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/79245.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态代理详解

目录 一、动态代理_代理模式简介 二、动态代理_JDK动态代理 dynamic 三、动态代理_CGLib动态代理 四、JDK和CGLib动态代理的区别 一、动态代理_代理模式简介 代理模式是23种设计模式之一。设计模式是前人总结的,在软件开发过程遇到常用问题的解决方案&#xff0…

微服务框架 SpringCloud微服务架构 微服务保护 30 初识Sentinel 30.4 引入cloud-demo

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 微服务保护 文章目录微服务框架微服务保护30 初识Sentinel30.4 引入cloud-demo30.4.1 引入cloud-demo30.4.2 微服务整合Sentinel30 初识Sent…

尝试使用CubeMX做stm32开发之十三:Clock Configuration(时钟树配置)

参考《STM32中文参考手册_V10》,研究CubeMX中有关时钟树配置。 一、系统时钟配置 三种不同的时钟源可被用于驱动系统时钟(SYSCLK): HSI振荡器时钟HSE振荡器时钟PLL时钟 时钟源选择对应时钟配置寄存器(RCC_CFGR&…

Android -- 每日一问:修改 SharedPreferences 后两种提交方式有什么区别?

知识点 SharedPreferences 类是一个接口类,真正的实现类是 SharedPreferencesImpl 。修改 SharedPreferences 需要获取它的 Editor,在对Editor进行put操作后,最后通过 commit 或者 apply 提交修改到内存和文件。当然有了两种都可以提交的方法…

Java进程线程介绍创建和执行销毁并理解线程安全和线程池 Native Method

目录1.进程和线程2.多线程的核心3.操作系统的多任务--以非常小的时间间隔交替执行4.native 修饰的方法5.Thread创建线程的两种方式1.普遍采用实现Runnable接口的方式2.继承Thread方式6.自定义线程用 new Thread(Runnable target) 启动源码分析6.1-new Thread(myThread)6.2对实例…

mysql8.0.21安装配置方法图文教程

记录了mysql 8.0.21 的安装配置方法,分享给大家。 一、下载 1、下载安装包 mysql下载路径 2、解压压缩包 3、在此目录下新建my.ini配置文件 [mysqld] # 设置 3306 端口 port3306 # 设置 mysql 的安装目录 basedirD:\mysql-8.0.21-winx64 # 设置 mysql 数据…

破案了!不会讲笑话不会作诗的chatGPT!

热出圈的chatGPT, 必须亲手试试热出圈的chatGPT, 必须亲手试试1 猜猜我是谁2 问网传图片李白风格注释代码3 写个程序看看4 帮我猜猜世界杯(发了发了,偷笑脸)5 知道李白吗?6 那你会写诗吗?6 那你讲脑经急转弯吗&#xf…

linux服务器安装docker(学习中)

linux服务器安装docker1、docker官网寻找官方文档1.1、卸载之前的docker1.2、安装yum工具类1.3、配置docker下载源的地址1.4、安装最新稳定版的docker1.5、启动docker1.6、docker镜像下载加速2、docker-卷-映射和挂载2.1、nginx1、docker官网寻找官方文档 然后根据官网文档进行…

高性能零售IT系统的建设08-9年来在互联网零售O2O行业抗黑产、薅羊毛实战记录及打法

前言 2012年左右转入互联网应用,由于本身在学校时就涉足过远程医疗影像中的DICOM安全领域这块,因此也是机缘巧合我进入互联网第一年就遇上了一次亿级的DDOS攻击以及千万级CC攻击短信系统的对抗。那时在公司一战成名,直接从team leader升到了主…

adb remount原理

1, 输入"fastboot flashing unlock" in adb ,waiting for the device 2, 输入"fastboot flashing unlock_critical"in adb ,waiting for the device 3, 输入"fastboot reboot" reboot the stb, press any key entering the boot mode 4, after…

tensorflow入门(三)tensorflow下神经网络参数的设置

参考 Tensorflow入门 - 云社区 - 腾讯云 神经网络中的参数是神经网络实现分类或回归问题中重要的部分。在tensorflow中,变量(tf.Variable)的作用就是保存和更新神经网络中的参数的。在tensorflow中,变量(tf.Variable)的作用就是保存和更新神经网络的参…

Educational Codeforces Round 123 (Rated for Div. 2) D. Cross Coloring

Problem - D - Codeforces 翻译: 有一张纸,可以用大小为𝑛𝑚:𝑛行和𝑚列的单元格表示。所有的细胞最初都是白色的。 𝑞操作已应用到工作表。他们的𝑖-th可以描述如下: &#x1d4…

前端工程化项目的思考

这是一篇个人使用前端工程开发项目的思考,希望可以帮助到你。完全是一篇综合概念应该是很多东西,我也不清楚会有多少字,估计会对刚刚开始的人看起来比较迷,但也是没有办法的事情 1.前端脚本语言开发的作者我想应该也想不到js会发展…

Spark

1 Spark作业提交流程 2 Spark提交作业参数 1)在提交任务时的几个重要参数 executor-cores —— 每个executor使用的内核数,默认为1,官方建议2-5个 num-executors —— 启动executors的数量,默认为2 executor-memory —— executor…

【OpenCV学习】第9课:形态学操作的应用-提取水平线丶垂直线

仅自学做笔记用,后续有错误会更改 理论 图像在进行形态学操作的时候, 可以通过自定义的结构元素实现结构元素对输入图像的一些对象敏感丶对另外一些对象不敏感, 这样就会让敏感的对象改变而不敏感的对象保留输出。 通过使用两个最基本的形态学操作 - 膨…

华为云服务-运维篇-弹性负载均衡

文章目录一、什么是负载均衡二、我们为什么需要负载均衡1、生活中需要它的类似场景2、生活场景中协调者(负载均衡)作用3、协调者(负载均衡)引入后的变化三、华为云平台-如何做负载均衡弹性负载均衡-ELB四、总结一、什么是负载均衡 负载均衡构建在原有网…

【数据挖掘】薪酬分段对应工作经验/学历画柱状图【招聘网站的职位招聘数据预处理】

文章目录一.需求背景1.1 需求分析二.数据处理(对给定职位,汇总薪酬分段对应工作经验要求数据,画柱状图;)2.1 事前准备2,1 处理开始三.数据处理(对给定职位,汇总薪酬分段对应学历要求数据,画柱状图;)四.附源…

吉林大学 超星慕课 高级语言程序设计 实验08 结构化程序设计(2022级)

本人能力有限,发出只为帮助有需要的人。 建议同学们自己写完后再进行讨论。 其中的代码均没能在oj上进行测试,因此可能有误,请谅解。 除此以外部分题目设计深度优先搜索,因此可以分别用递归和堆栈实现,堆栈方法为了…

JavaScript进阶教程——异步编程、封装Ajax

异步编程 什么是同步与异步: 同步:一件事没做完,只能等待,完成之后再去做另一件事 异步: 两件事可以同时进行 前端开发中最常见的两种异步情况: ajax: 向后台请求数据计时器: setInterval se…

Python学习基础笔记四十一——sys模块

sys模块是与Python解释器交互的一个接口。 sys.argv 命令行参数List,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0),错误退出sys.exit(1) sys.version 获取Python解释程序的版本信息 sys.path 返…