时隔一年的测评:gpt3.5发展到什么程度了?

news2025/1/18 8:54:57

名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

目录

      • 一、简要介绍
        • 1、chatgpt是什么?
        • 2、主要特点
        • 3、工作原理
        • 4、应用限制
        • 5、使用方法
      • 二、分类问题测试
        • 1、基础问答(5个)
        • 2、数学题解答(5个)
        • 3、逻辑推理(5个)
        • 4、创造性写作(3个)
        • 5、代码编写(3个)
        • 6、对话理解与情感交流(2个)
        • 7、翻译任务(1个)
        • 8、策略规划(1个)
      • 三、测试感受

★观前提示以下内容仅为测试内容,不代表未来新版本如何测试体验,只讲述体验,本篇文章不做对比。

在人工智能领域,OpenAI的GPT(Generative Pre-trained Transformer)系列模型已经成为了一个名扬四海的名称。ChatGPT-3.5,作为这一系列的一个里程碑,不仅在技术界引起了广泛的关注,也在普通用户中掀起了一股学习和探索的热潮,这就不禁引发了一系列思考:
在这里插入图片描述

一、简要介绍

1、chatgpt是什么?

在这里插入图片描述
ChatGPTOpenAI开发的大语言模型,属于GPT(Generative Pre-trained Transformer)系列的一部分。它通过深度学习技术和大量数据训练,能够理解和生成自然语言文本。ChatGPT可以应用于多种场景,包括但不限于客户服务、教育辅导、内容创作等。

2、主要特点
  • 理解和生成文本:ChatGPT能够根据输入的文本理解上下文,并生成连贯、相关的回答。
  • 多样化应用:它可以用于问答系统、文本摘要、文章写作、编程代码辅助、语言翻译等多个领域。
  • 自然语言处理:ChatGPT在自然语言处理(NLP)方面表现出色,能够处理复杂的语言特征,包括语法、句式结构等。
  • 持续学习:虽然ChatGPT在部署后的学习能力有限,OpenAI定期更新模型,以包含新的数据和改进算法,使其性能持续提升。
3、工作原理

ChatGPT的工作原理基于Transformer架构,这是一种深度学习模型,特别适用于处理序列化的数据,如文本。

模型通过“注意力机制”来理解文本中的每个词与其他词之间的关系,这使得ChatGPT能够生成连贯且相关性强的文本。

4、应用限制

尽管ChatGPT在多个领域表现出色,但它也有一些限制,例如:

  • 信息时效性:ChatGPT的知识是到训练数据截止日期为止的,对于之后发生的事件或信息可能不了解。
  • 误解与错误:尽管准确率较高,ChatGPT仍可能产生误解或错误信息,特别是在处理复杂问题或缺乏明确上下文时。
  • 创造性限制:虽然能够生成新颖的文本,但ChatGPT的创造性受到训练数据的限制,它的“创意”来自于已经存在的信息组合。
5、使用方法

官网注册使用即可:chatgpt官网

在这里插入图片描述

了解了以上内容之后,咱们一起去测试体验一下:

二、分类问题测试

测试采用多类问题提问,以检验其多方面的功能。

1、基础问答(5个)
  • Q1: 澳大利亚的首都是哪座城市?(✔)

在这里插入图片描述

  • Q2: 地球与太阳之间的距离是多少?(✔)
    在这里插入图片描述
  • Q3: 水的沸点是多少度?(✔)
    在这里插入图片描述
  • Q4: 比萨斜塔在哪个国家?(✔)
    在这里插入图片描述
  • Q5: 世界上最长的河流是哪一条?(✔)
    在这里插入图片描述

从回答来看,5个问题均正确✔,相比刚发布时gpt3.0出现常识性错误,正确率高了不少。

2、数学题解答(5个)
  • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)
    在这里插入图片描述

  • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)

在这里插入图片描述

  • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述
  • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x36x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述

这题虽然解对了,其实用到了一些高等数学的知识,这里要注意,高中数学涉及的并没有那么广泛。

  • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)

在这里插入图片描述

3、逻辑推理(5个)
  • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)

在这里插入图片描述

  • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
    在这里插入图片描述
  • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✖)

在这里插入图片描述

正确答案:500kg。1000kg蘑菇含水量99%,就是水重990kg,固体蘑菇10kg。降到含水量98%就是固体蘑菇只占2%,然后用10除以2%就能得出蘑菇重量是500kg。所以答案是晒干了500kg水。

  • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

在这里插入图片描述

正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

  • Q5: 72、36、24、18、( )(✖)
    在这里插入图片描述

正确答案:14.4

4、创造性写作(3个)
  • Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
    在这里插入图片描述

写的有模有样,这一年进步了不少。

  • Q2: 编写一首关于秋天落叶的五言律诗。

在这里插入图片描述

押上了居然,就是意境表达的有些冗杂。

  • Q3: 写一个关于人工智能与人关系的短篇小说。
    在这里插入图片描述

现在小说的前后逻辑性也更连贯了,牛!

5、代码编写(3个)
  • Q1: 用Python编写一个函数,用于判断一个数是否为质数。
    在这里插入图片描述
    gpt所写代码如下:
def is_prime(number):
    if number <= 1:
        return False
    if number <= 3:
        return True
    if number % 2 == 0 or number % 3 == 0:
        return False
    i = 5
    while i * i <= number:
        if number % i == 0 or number % (i + 2) == 0:
            return False
        i += 6
    return True

# 测试
print(is_prime(5))  # 输出: True
print(is_prime(10)) # 输出: False
print(is_prime(17)) # 输出: True

在这里插入图片描述

  • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。
    在这里插入图片描述
    gpt所写代码如下:
def is_palindrome(s):
    # 去除字符串中的非字母字符并转换为小写
    s = ''.join(c.lower() for c in s if c.isalnum())
    # 检查字符串是否等于其反转
    return s == s[::-1]

# 测试
print(is_palindrome("A man, a plan, a canal, Panama"))  # 输出: True
print(is_palindrome("racecar"))                        # 输出: True
print(is_palindrome("hello"))                          # 输出: False

在这里插入图片描述

测试了下,成功运行并得到正确反馈。

  • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
    在这里插入图片描述
class TreeNode:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

def dfs(root):
    if root is None:
        return []
    stack = [root]
    result = []
    while stack:
        node = stack.pop()
        result.append(node.value)
        if node.right:
            stack.append(node.right)
        if node.left:
            stack.append(node.left)
    return result

# 测试
# 构造二叉树
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)
root.right.left = TreeNode(6)
root.right.right = TreeNode(7)

print(dfs(root))  # 输出: [1, 2, 4, 5, 3, 6, 7]

在这里插入图片描述

6、对话理解与情感交流(2个)
  • Q1: 我今天心情不好,能给我讲个笑话吗?
    在这里插入图片描述

虽然挺冷的,但是我确实笑了。

  • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

在这里插入图片描述

给的方法还不错,现在语言逻辑相比一年前也更好了。

7、翻译任务(1个)
  • Q: 将这段文字翻译成英语:“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的“丝绸之路”。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
    正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。”(六级翻译原题

在这里插入图片描述

  • Q: 再将这段英语翻译成中文

在这里插入图片描述

可以看出,文本翻译的效果还是不错的。

8、策略规划(1个)
  • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?
    在这里插入图片描述

这计划竟然有些合理?整体不错

本次测评就到这里,接下来总结一下感受。

三、测试感受

gpt3.5相比于一年前,能力明显地得到了提升,但是要想替代很多岗位目前还是很难的,我们要有危机感,但不能杞人忧天,提升自身能力才是重点。

放大了来说,GPT是自然语言处理领域的一个重要进展,通过模仿人类的对话方式,它在提供信息、协助文本创作等方面展现了巨大潜力。然而,gpt也有它的局限性,使用时要注意,以免造成不可挽回的损失。

关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1475799.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

6.5 共享数据

本节介绍Android的四大组件之一ContentProvider的基本概念和常见用法&#xff1a;首先说明如何使用内容提供器封装内部数据的外部访问接口&#xff0c;然后阐述如何使用内容解析器通过外部接口操作内部数据&#xff0c;最后叙述如何利用内容解析器读写联系人信息&#xff0c;以…

国考省考行测:图形推理,数量规律,多面体截面图,视图

国考省考行测&#xff1a;图形推理&#xff0c;数量规律 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能&#xff0c;附带行测和申论&#xff0c;而常规国考省考最重要的还是申论和行测&#xff0c;所以大家认真准备吧&#xff0c;我讲一起屡屡申论和…

JavaWeb——005 请求响应 分层解耦(Postman、三层架构、IOC、DI、注解)

SpringBootWeb请求响应 这里写目录标题 SpringBootWeb请求响应前言1. 请求1.1 Postman1.1.1 介绍1.1.2 安装 1.2 简单参数1.2.1 原始方式1.2.2 SpringBoot方式1.2.3 参数名不一致 1.3 实体参数1.3.1 简单实体对象1.3.2 复杂实体对象 1.4 数组集合参数1.4.1 数组1.4.2 集合 1.5 …

基于HT32的智能家居demo(蓝牙上位机)

参加合泰杯作品的部分展示&#xff0c;基于HT32的智能家居&#xff0c;这里展示灯光的相关控制&#xff0c;是用蓝牙进行的数据透传&#xff0c;参考了一些资料&#xff0c;美化封装了一下之前的上位机界面。 成果展示 点击主界面的蓝牙设置&#xff0c;进行连接&#xff0c;下…

数据结构--二叉排序树(Binary Search Tree,简称BST)

这里写自定义目录标题 二叉排序树二叉排序树与排序数组没有排序数组&#xff0c;链式存储链表的对比二叉排序树概念对于搜索操作&#xff0c;对于插入操作&#xff0c;对于删除操作&#xff0c; 分析删除节点代码运行结果 二叉排序树 二叉排序树与排序数组没有排序数组&#x…

spring boot整合cache使用memcached

之前讲了 spring boot 整合 cache 做 simple redis Ehcache 三种工具的缓存 上文 windows系统下载安装 memcached 我们装了memcached 但spring boot没有将它的整合纳入进来 那么 我们就要自己来处理客户端 java历史上 有过三种客户端 那么 我们用肯定是用最好的 Xmemcached …

算法 -【从前序与中序遍历序列构造二叉树】

从前序与中序遍历序列构造二叉树 题目示例1示例2 分析代码 题目 给定两个整数数组 preorder 和 inorder &#xff0c;其中 preorder 是二叉树的先序遍历&#xff0c; inorder 是同一棵树的中序遍历&#xff0c;请构造二叉树并返回其根节点。 示例1 输入: preorder [3,9,20,1…

东方博宜 1261. 韩信点兵

东方博宜 1261. 韩信点兵 #include<iostream> using namespace std ; int main() {bool m true ;int i 1 ;while (m){ if(i%51 && i%65 && i%74 && i%1110 )break ;i ;} cout << i ;return 0 ; }

去中心化时代,品牌如何赢得确定性增长

去中心化时代下&#xff0c;品牌面临众多挑战。在如今复杂的环境下&#xff0c;有很多不确定的因素&#xff0c;流量、资本等等&#xff0c;这些都是品牌发展过程中的不确定因素&#xff0c;越是复杂的环境下&#xff0c;品牌越要保证自己核心优势&#xff0c;找到并放大我们的…

2月28日做题总结(C/C++真题)

今天是2月28日&#xff0c;做题第三天。道阻且长&#xff0c;行则将至&#xff1b;行而不辍&#xff0c;则未来可期&#xff01; 第一题 static char a[2]{1,2,3};说法是否正确&#xff1f; A---正确 B---错误 正确答案&#xff1a;B 解析&#xff1a;数组定义时&#xf…

网络编程课后模拟面试

思维导图&#xff1a; 面试题目&#xff1a; 1、 什么是回调函数 答&#xff1a;回调函数是一种作为参数传递给其他函数的函数。当特定事件发生或条件满足时&#xff0c;调用包含回调函数的函数来执行特定的操作。回调函数允许在不阻塞程序执行的情况下&#xff0c;异步地处理…

Flask入门一(介绍、Flask安装、Flask运行方式及使用、虚拟环境、调试模式、配置文件、路由系统)

文章目录 一、Flask介绍二、Flask创建和运行1.安装2.快速使用3.Flask小知识4.flask的运行方式 三、Werkzeug介绍四、Jinja2介绍五、Click CLI 介绍六、Flask安装介绍watchdog使用python--dotenv使用&#xff08;操作环境变量&#xff09; 七、虚拟环境介绍Mac/linux创建虚拟环境…

liunx操作系统 进程的基本概念

进程的基本概念 计算机结构体系冯诺依曼 操作系统的管理进程进程的特性标识符系统的调用 创建新的进程 进程的状态进程队列进程的状态在liunx查看进程状态、 计算机结构体系 冯诺依曼 在没有存储器之前&#xff0c;所有的信息都是直接进入CPU&#xff0c;这样效率很差&#xf…

【Go语言】Go语言中的切片

Go语言中的切片 1.切片的定义 Go语言中&#xff0c;切片是一个新的数据类型数据类型&#xff0c;与数组最大的区别在于&#xff0c;切片的类型中只有数据元素的类型&#xff0c;而没有长度&#xff1a; var slice []string []string{"a", "b", "c…

LabVIEW磁阻自动优化测量系统

LabVIEW磁阻自动优化测量系统 介绍了一种基于LabVIEW开发的磁阻自动优化测量系统&#xff0c;通过自动优化测试分辨率和高度模块化设计&#xff0c;大幅提升磁阻测试的效率和准确性。系统采用功率电源、电磁铁、高分辨率特斯拉计、步进电机转动器、精密电流源与精准电压表等硬…

Zookeeper启动报错排查

前言&#xff1a;生产linux部署的zookeeper&#xff0c;执行启动脚本后&#xff0c;还是无法使用&#xff0c;故进行重启排查 在zookeeper的bin目录下执行 ./zkServer.sh start-foreground 可实时查看启动日志排查问题 根据上面的日志可以看出&#xff0c;是zoo.cfg配置文件里…

Vue3之属性传值的四种情况

文章目录 Vue3之属性传值的四种情况一、引言二、父组件向子组件传值三、子组件向父组件传值四、祖先组件向后代组件传值五、兄弟组件之间传值 Vue3之属性传值的四种情况 一、引言 在vue3中&#xff0c;组件与组件之间是可以传递属性的&#xff0c;包括三种类型&#xff1a; …

【vue】什么是虚拟Dom,怎么实现虚拟DOM,虚拟DOM一定更快吗

什么是虚拟Dom 虚拟 DOM 基于虚拟节点 VNode&#xff0c;VNode 本质上是一个对象&#xff0c;VDOM 就是VNode 组成的 废话&#xff0c;js 中所有的东西都是对象 虚拟DOM 为什么快&#xff0c;做了哪些优化 批量更新 多个DOM合并更新减少浏览器的重排和重绘局部更新 通过新VDO…

2024年腾讯云优惠券领取、使用、常见问题解答

随着云计算技术的日益普及&#xff0c;越来越多的个人和企业选择将业务迁移到云端。腾讯云作为国内领先的云计算服务提供商&#xff0c;经常推出各种优惠活动吸引用户上云&#xff0c;其中就包括发放腾讯云优惠券&#xff0c;本文将为大家详细介绍2024年腾讯云优惠券的领取、使…

【前端入门】设计模式+单多页+React

设计模式是一种解决特定问题的经验总结&#xff0c;它提供了经过验证的解决方案&#xff0c;可以在软件开发过程中使用。设计模式可以帮助前端开发人员更有效地组织和管理代码&#xff0c;并提供一种共享的语言和框架&#xff0c;以便与其他开发人员进行交流。 以下是一些常见…