当我们在谈论ChatGPT时,我们在谈论什么?

news2024/11/27 2:23:09

当我们在谈论ChatGPT时,我们在谈论什么?

文章目录

  • 当我们在谈论ChatGPT时,我们在谈论什么?
    • 一、介绍
    • GPT-4相比GPT-3.5有何不同呢
      • 1.交谈能力
      • 2.多语言翻译精确度
      • 3.视觉输入
    • 二、应用领域
      • 1.小镇做题家 (学术研究)
      • 2.Cosplay,假如你是_,你会?(场景设定)
      • 3.内容生成
      • 4.聊天助手
      • 5.编程小能手
    • 三、如何使用
    • 局限性

一、介绍

北京时间2023年3月15日凌晨,OpenAI公司推出了其GPT最新版本GPT-4, 这是其努力扩展深度学习的最新里程碑。

在此之前,ChatGPT被大家所熟知,它本身并不是OpenAI语言模型的一个版本,而是一个聊天界面,适用于任何支持它的模型。

过去几个月,ChatGPT一直是基于GPT-3.5,而现在它将基于GPT-4进行交互。

据OpenAI称,该公司花了六个月的时间使用内部对抗性测试程序和 ChatGPT的训练经验“迭代调整”GPT-4,从而在真实性、可控性等方面取得了最好的效果。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),拥有了图像处理能力,就意味着机器有了"眼睛",不仅可以简单地要求它描述图片中的内容,还可以深度理解图里的意思并做出反应。
虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。

在发布当日颇受关注,热度飙升,百度搜索指数如下图:

GPT-4相比GPT-3.5有何不同呢

官方从以下几个方面进行基准测试对比结果如下:

1.交谈能力

在非正式的交谈中,GPT-3.5和GPT-4的差别并不明显。差异体现在当复杂任务达到某个阈值的时候,GPT-4将更可靠,更有创造性,并能比GPT-3.5更善于处理细致入微的引导。
以下是关于《奥林匹克竞赛》和《AP自由回答问题》的情况对比结果

2.多语言翻译精确度

许多现存的机器学习测试基准都是用英语写的。为了测试在其他语言中的能力,我们翻译了MMLU测试基准,一组14,000个多选题,横跨了57个专业,翻译为了多种语言,使用的是Azure 翻译工具(见附录)。在26种语言的24种中,GPT-4都胜出了一些模型的英语语言性能,这些模型包括GPT-3.5和其他的LLMs(Chinchilla,PaLM),甚至在语料稀少的语言上也是如此,这些语言有拉脱维亚语,威尔士语,和斯瓦希里语等

3.视觉输入

图像处理和强大的理解能力,允许用户指定任何视觉或语言任务,它输出的是文本(自然语言的形式)
官方给出了7个示例,其中列举4个如下:

  • 1.给出一篇论文,解释其中章节含义并总结论文
  • 2.识别图中冷笑话
  • 3.根据给出的图文数据进行推理得出答案
  • 4.识别图片不合理的地方,如图:

注: 图像输入仍然在研究使用,暂未对公众开放

二、应用领域

1.小镇做题家 (学术研究)

GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

2.Cosplay,假如你是_,你会?(场景设定)

3.内容生成

4.聊天助手

5.编程小能手

等等… AI深刻改变了多种岗位职能,如技术支持,销售,内容编辑,以及编程。虽然它现在还不能替代人类,但已足够强大,我们可以在工作中使用AI辅助提效。

三、如何使用

前提:需要魔法

    1. 访问官网
    1. 注册账号(需手机号验证码,目前暂不支持国内手机号)
    1. 升级计划(免费版暂不支持gpt4)
    • 1.点击左下角

    • 2.升级到plus

    • 3.绑定信用卡付费(不支持国内卡)

局限性

虽然GPT-4模型很强, 但仍有有着于早期GPT模型相似的局限性。最重要的是,它仍然不是完全可靠(它“颠倒”事实,并有逻辑错误)。
即给出一个看似正确,实际错误的答案,经过训练迭代,GPT-4在跑分上高出40%于GPT-3.5。因此我们可以持续期待GPT更新的版本,更强的能力!

参考官网

Github地址体验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/471381.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

优思学院|质量大师的那些名言(三)【质量是一种习惯】

格言是一种简洁明了、简练有力的表达方式,通常蕴含着深刻的哲理和智慧,能够为我们提供指导和启示。 在《质量大师的那些名言》系列中,优思学院将透过这些名言,用最简单、直接、深刻的方式教授质量和六西格玛管理。 概述 在现代商…

ChatGPT 目前到底能帮助我们程序员做什么?

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞&#x1…

异常中断处理

异常或中断是用户程序中最基本的一种执行流程或形态。这部分主要对ARM架构下的异常中断做详细说明。 ARM一共有7种类型的异常,按优先级从高到低的排列如下: 复位异常(Reset)、数据异常(Data Abort)、快速…

工业和信息化部发布《关于电信设备进网许可制度若干改革举措的通告》

按照《国务院办公厅关于深化电子电器行业管理制度改革的意见》(国办发〔2022〕31号)要求,工业和信息化部发布《关于电信设备进网许可制度若干改革举措的通告》(工信部信管函〔2023〕14号),集中公布动态调整…

2023,你了解Kafka吗?深入详解

- 消息队列的核心价值 - 解耦合。 异步处理 例如电商平台,秒杀活动。一般流程会分为:1: 风险控制、2:库存锁定、3:生成订单、4:短信通知、5:更新数据。 通过消息系统将秒杀活动业务拆分开&#x…

**MySQL关联查询七种方式详解与应用实例**,你的掌握了吗

当我们需要从多个表中查询数据时,就需要使用关联查询了。MySQL支持七种不同类型的关联查询:内连接、左连接、右连接、全外连接、交叉连接、自连接和自然连接。本文将讲解这七种关联查询的SQL语句、示例以及应用场景。 一、 前言 关联查询是数据库操作中…

Leetcode 37 解数独

Leetcode解数独 题目描述题解1(按Board行列回溯:较直接) 题目描述 编写一个程序,通过填充空格来解决数独问题。 数独的解法需 遵循如下规则: 数字 1-9 在每一行只能出现一次数字 1-9 在每一列只能出现一次数字 1-9 在每一个以粗实线分隔的…

postgresql|数据库|批量执行SQL脚本文件的shell脚本

前言: 对于数据库的维护而言,肯定是有SQL脚本的执行,例如,某个项目需要更新,那么,可能会有很多的SQL脚本需要执行,SQL脚本可能会包含有建表,插入数据,索引建立&#xff…

Vue项目的性能优化

前言 Vue 框架通过数据双向绑定和虚拟 DOM 技术,帮我们处理了前端开发中最脏最累的 DOM 操作部分, 我们不再需要去考虑如何操作 DOM 以及如何最高效地操作 DOM;但 Vue 项目中仍然存在项目首屏优化、Webpack 编译配置优化等问题,所…

Towards Principled Disentanglement for Domain Generalization

本文用大量的理论论述了基于解纠缠约束优化的域泛化问题。 这篇文章认为以往的文章在解决域泛化问题时所用的方法都是non-trivial的,也就是说没有作严格的证明,是不可解释的,而本文用到大量的定理和推论证明了方法的有效性。 动机 因为域泛…

客户管理系统的作用有哪些?

阅读本文您将了解:1.客户管理系统的作用;2.客户管理系统软件怎么用;3.客户管理的注意事项。 一、客户管理系统的作用 客户是企业的重要财富,因此客户管理是企业发展过程中至关重要的一部分,那么客户管理怎么做&#…

把字符串转换成整数

题目&#xff1a;把字符串转换成整数 思路&#xff1a; 如果对于一般规则的数字“字符串”转化为数字都很容易&#xff0c;比如&#xff1a; 对于“123456”可以利用如下代码进行转化&#xff1a; string str"123456"; int ans 0; for (int i0; i<str.size(); …

Elesticesearch

1. 概述 应用场景&#xff1a; 给你一个巨大的文档数据&#xff0c;文档中存储着许多非结构化的数据&#xff0c;如下&#xff1a; {“id” : “1”, “name” : “佛山张学友”, “age” : “15”}, {“name” : “广州周润发”, “height” : “182”}, …中间有10000万行……

ABAP 二分法查找与SORT排序

需求场景 需要对内表排序&#xff0c;按降序排列&#xff0c;获取第一行&#xff1b;二分法查找需要的数据 我按照降序排列后&#xff0c;获取到了第一行&#xff0c;但是通过二分法查找没有获取到 二分法查找 二分查找&#xff0c;对排序数组通过二分区间排除的方法进行快速…

最好用的六款虚拟机软件,赶紧收藏

在日常工作和学习中,我们常常需要在一台电脑上运行多个操作系统,以便进行软件测试、开发、学习以及实验等任务。虚拟机软件就是一种崭新的技术,它可以在一台电脑上运行多个操作系统,为用户提供了更高效、安全、稳定和智能化的工作和学习环境。今天我为大家介绍6款优秀的虚拟…

k8s安装监控工具metrics-server

我们需要监控cpu和内存的使用率.以便提供硬件资源的申请采购建议. 也方便我们知道运行负荷, 而不是糊里糊涂出了问题再去解决或者工具自动解决了而我们不知道, 话说回来集群的好处就是低成本的达到高性能, 性能不去监控就有点太不专业了. 但, k8s居然不自带监控工具 https://ku…

了解hiberfil.sys文件:计算机休眠模式的背后

简介: hiberfil.sys是Windows操作系统中的一个文件&#xff0c;它通常存储在计算机的根目录下&#xff0c;用于保存休眠模式下的内存映像。当您将计算机置于休眠模式时&#xff0c;Windows会将所有正在运行的程序和数据保存到hiberfil.sys文件中&#xff0c;然后关闭计算…

SAP MRP例外信息解释

SAP中MRP的例外信息&#xff0c;一共分为八类&#xff0c;下面是所有例外信息的解释 第一类&#xff1a; 69&#xff1a;BOM组件可能是递归的&#xff0c;即自己的子集中包括了自己。 02&#xff1a;订单创建日期在过去&#xff0c;可能是没有及时处理&#xff0c;这个建议表…

【Python爬虫实战】汽车城最好的十款车,第一名竟是这款车...Python教你一键采集二手车数据信息实现数据可视化展示哦~(附视频教程)

前言 驾考不易&#xff0c;天天早起去练车&#xff0c;无论烈日还是下雨&#xff0c;通通都在室外进行&#xff0c;但想要拿证&#xff0c;一定要坚 持不懈的去练车。 所有文章完整的素材源码都在&#x1f447;&#x1f447; 粉丝白嫖源码福利&#xff0c;请移步至CSDN社区或…

【Docker】2、Docker 基本操作【镜像操作】

目录 一、镜像相关命令(1) 镜像名称格式(2) 常见镜像命令 二、从 DockerHub 拉取镜像案例三、镜像导出和导入案例四、拉取 Redis 镜像练习 一、镜像相关命令 (1) 镜像名称格式 &#x1f50b; 镜像名称一般由两部分组成&#xff1a;[repository]:[tag] &#x1f50b; 若没有指…