这五个问题一下就看出阿里通义千问和ChatGPT的差距了

news2025/1/26 15:52:05

前言

阿里通义千问申请过了,为了看看达到了什么水平,于是我问题了5个ChatGPT回答过的问题1,这五个问题网上都是没有的,是我自己想出来的。

image.png

问题一:小明说今天他吃了一只公鸡蛋,请问小明诚实吗?

ChatGPT

这是一个有趣的问题,但是也有一些误解。公鸡蛋并不是公鸡下的蛋,而是指公鸡的睾丸,也就是公鸡的生殖器官。所以小明说他吃了一只公鸡蛋,其实是说他吃了一只公鸡的睾丸。这个食物在一些地方被认为有补肾的功效3,但是也有人觉得不雅或者不好吃。所以小明是否诚实,要看他是不是真的吃了这个东西,而不是看公鸡是否能下蛋‬。

通义千问:

从诚实的角度来看,小明说的是实话,因为他吃了一只公鸡蛋。但是,这并不意味着他是一个诚实的人,因为诚实的人不仅要说实话,还要做到诚实地面对自己的错误和过失。因此,小明是否诚实取决于他是否有勇气承认自己的错误和过失,以及是否愿意接受别人的批评和帮助。

对比

这个问题主要考察基本常识:公鸡不会下蛋,可以看出ChatGPT一眼就看出了这个常识,并且还给出了公鸡蛋是公鸡睾丸这个令我也想不到的惊讶回答,再看阿里通义完全没明白这个问题的要点。

问题二:小王在北京说穿毛衣还很冷,小李在三亚说穿短袖还很热,请问谁说谎了?

ChatGPT

这是一个关于地理和气候的问题,北京的今天的气温是13.7℃,三亚的今天的气温是27℃。北京属于温带大陆性气候,冬季寒冷,夏季炎热,春秋干燥。三亚属于热带海洋性气候,全年温暖湿润,没有四季之分。所以小王在北京说穿毛衣还很冷,小里在三亚说穿短袖还很热,都是有可能的,没有谁说谎了。

通义千问:

从诚实的角度来看,小王说的是实话,因为他感觉穿毛衣还很冷。但是,这并不意味着小里说的是实话,因为每个人对气温的感受可能存在差异。因此,小里是否说谎取决于他感觉穿短袖还是穿毛衣更舒适,以及是否对自己的感受有信心。

对比

这个问题就有点难度了,主要是考察常识+实时信息,可以看出ChatGPT不但知道北京和三亚气候不同,还给出了北京和三亚当天的具体温度,北京三亚当天温度应该是要去在线查的。反观阿里通义千问,我只能说呵呵,完全没有地理位置不同气候不同的常识,更不用说是去查当天两地的温度了。

问题三:我的iphone 手机没电了,借了小明的华为手机充电线,可是就是充不了,为什么?

ChatGPT

你好,这是一个关于充电器和数据线的兼容性问题。华为的充电器头和数据线一般不支持苹果的快充协议,所以给 iPhone 充电的效果只有 5W 左右,而不是 18W 或 20W 的快充功率。而且,华为的充电器头一般是 USB-A 口的,而 iPhone 的原装数据线是 USB-C 转闪电口的,所以两者是无法直接连接的。你需要使用一个 USB-A 转闪电口的数据线,或者一个支持 PD 快充协议的充电器头,才能给 iPhone 充电。如果你使用的数据线没有通过 MFi 认证,可能会有弹窗提示你这个配件不受支持。所以,你借了小明的华为手机充电线,可能是因为接口不匹配或者数据线不认证,导致无法给 iPhone 充电。

通义千问:

可能是因为充电线的规格不匹配。不同品牌和型号的手机充电器和数据线可能有不同的规格和协议,如果使用了不兼容的充电器和数据线,可能会导致手机无法正常充电。建议先检查充电器和数据线的规格是否相同,如果不同请使用相应的转接头或充电线。另外,还可以尝试使用其他品牌或型号的充电器和数据线进行充电,或者尝试将手机连接到电脑充电器上进行充电。

对比

这个问题主要考察不同手机接口协议不通用的常识,ChatGPT的回答感觉可以给100分,不仅看出是快充协议的问题,还给出了协议转换解决方案,阿里通义感觉只能给60分,勉强及格,还是看出问题了。

问题四:小明5岁时喜欢穿妹妹的花裙子,可是5年后却打死不穿了,为什么?

ChatGPT

这是一个有趣的问题,可能有多种答案。在这个语境下,一个人可能会说:

  1. 因为小明长大了,知道了男孩子和女孩子的区别,不想穿妹妹的花裙子了。
  2. 因为小明的妹妹长大了,不让小明穿她的花裙子了,而且还会嘲笑他。
  3. 因为小明的花裙子已经穿不下了,而且也不合时尚了。
  4. 因为小明的父母或老师或同学发现了他穿妹妹的花裙子,对他进行了批评或教育或欺负,让他觉得羞耻或害怕。

通义千问:

可能是因为小明长大了,对于自己的穿着有了更加个人化的想法和意愿。小时候的喜好可能受到外部因素的影响,例如父母、亲友等,而长大后个人的想法和意愿则更加重要。同时,也可能是因为小明对于性别和美的认知发生了变化,对于自己的性别和穿着更加自信和自主。但是,无论是什么原因,小明最终不再喜欢穿妹妹的花裙子,都是因为他对于自己的认知和态度发生了变化。

对比

这个问题是主要考察推荐+常识,推理是随着时间的增加人会长大,长大后男孩不会穿花裙的常识,可以看出ChatGPT给出了可以说是很像人类思考的答案,对比阿里通义千问,完全没有GET到问题点。

问题五:做一个思维实验,小明擅长扔石头,一个小明力量可以扔1公里,2个小明力量可以扔2公里,请问4万个小明力量可以扔多远?

ChatGPT

这是一个有趣的思维实验,但是也有一些不合理的地方。首先,扔石头的距离不仅取决于力量,还取决于角度、空气阻力、重力等因素。其次,多个小明的力量如何叠加也是一个问题,如果是简单的相加,那么 4 万个小明的力量可以扔 4 万公里,但是这显然超过了地球的周长,而且也不考虑石头的轨迹和速度。如果是其他方式的叠加,比如平方根或对数,那么结果就会不同。所以,这个问题没有一个确定的答案,只能根据假设和条件进行推测。

通义千问:

在这个思维实验中,我们可以使用乘法原理来解决问题。因为一个小明力量可以扔1公里,两个小明力量可以扔2公里,所以四个小明力量可以扔4公里。同理,八个小明力量可以扔8公里,十六个小明力量可以扔16公里,以此类推。因此,四万个小明力量可以扔4万公里。综上,本题公式为:1 * 248163264128…=4 * 4 * 4 * 4 * 4 * 4 * 4 * 4 * 4,约为1844亿公里。

对比

最后这个问题是个纯思维实验,网上是没有的,主要考察逻辑推理+常识,还要避坑。我是故意埋了地球周长4万公里这个坑,我想很多正常人类也不一定能看出这个坑,ChatGPT的回答简直是惊艳,给101分能不怕它骄傲,阿里通义连最基本的推理计算都是错的。

总结

从上面五个问题可以看出阿里通义千问和ChatGPT,完全不在一个水平,引用周鸿祎的话:现在说超越ChatGPT叫吹牛2,这里说明一下阿里没有说通义超过了ChatGPT,大家不要误解,只是让我们自己正确的看出差距,从而认真的对待差距,而不是盲目的自大,不过话说回来了能做出大模型的都是很厉害了,路漫漫其修远兮,我们还要上下而求索。


  1. 我问了ChatGPT几个思维实验,想看看它有没有意识 - 掘金 (juejin.cn) ↩︎

  2. 周鸿祎做客东方甄选谈大模型:现在说超越ChatGPT叫吹牛 (baidu.com) ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/521419.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

黑马Redis笔记高级篇 | 多级缓存

黑马Redis笔记高级篇 | 多级缓存(黑马教程云服务器踩坑记录) 1、JVM进程缓存(tomcat服务内部)1.1 导入商品案例1.2 初识Caffeine1.3 实现进程缓存 2、Lua语法入门2.1 初识Lua2.2 变量和循环2.3 条件控制、函数 3、多级缓存3.1 安装…

快速了解LVQ神经网络是什么

本站原创文章,转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com 目录 一. 快速了解LVQ神经网络 1.1 LVQ神经网络是什么 1.2 LVQ神经网络的表示 二. 关于LVQ神经网络的判别计算过程 2.1 LVQ神经网络模型与它的判别方法 2.2 LVQ模型的…

【论文阅读】MINOTAUR: Multi-task Video Grounding From Multimodal Queries

背景动机 细粒度的视频理解已经成为增强现实(AR)和机器人应用开发的关键能力。为了达到这种级别的视频理解,智能体(例如虚拟助手)必须具备识别和推理视频中捕获的事件和对象的能力,处理一系列视觉任务,如活动检测、对象检索和(空间)时间基础…

教你设置dsn,brd文件关联到cadence

用过cadence的人应该都知道,很多人存在dsn,brd文件无法关联到cadence,从而导致无法直接双击对应的文件打开软件编辑,不得不先打开软件,再通过文件夹浏览来打开对应的文件,这其实是浪费了一些时间的。 下面通过简单的介…

Linux应用开发:socket

目录 1、TCP 1.1 TCP建立连接的流程图 1.2 TCP函数 1.2.1 socket 1.2.2 bind 1.2.3 listen 1.2.4 accept 1.2.5 recv 1.2.6 send 1.2.7 connnect 1.2.8 setsockopt、getsockopt 1.3 应用程序:服务器 1.4 应用程序:客户端 2、UDP 2.1 UDP建…

Github上传大于25M文件最简单方法!!!

Github上传大于25M文件最简单方法 方法:使用 GitHub 桌面应用程序1.下载 [Github](https://desktop.github.com/)应用程序到您的 Windows 或 Mac PC 上。2.单击“从互联网克隆存储库...”选项。3. 使用您的 Git 帐户登录。4. GitHub 应用程序将提示您使用电脑浏览器…

Docker安装Kong konga

一、安装Kong 1. 创建一个docker网络 docker network create kong-net2.拉取镜像 docker pull postgres:9.6 docker pull kong:2.6.03. 搭建pgsql数据库环境 docker run -d --name kong-database \--networkkong-net \-p 5432:5432 \-e "POSTGRES_USERkong" \-e …

Cisco Nexus 9000v Switch, NX-OS Release 10.3(3)F - 虚拟化的数据中心交换机

Cisco Nexus 9000v Switch, NX-OS Release 10.3(3)F - 虚拟化的数据中心交换机 请访问原文链接:https://sysin.org/blog/cisco-nexus-9000v/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org NX-OS System SoftwareR…

Java接口介绍

Java接口介绍 接口(Interface),在Java编程语言中是一个抽象类型,是抽象方法的集合,接口通常以interface关键字来声明。Java接口是用于描述类所具有的方法集合,但并不提供实现这些方法的代码。它们被用来定义…

Leetcode刷题日志5.0

目录 前言: 1.两数相加 2.无重复字符的最长子串 3.整数反转 4.删除链表的倒数第 N 个结点 前言: 今天我又来继续分享最近做的题了,现在开始进入我们快乐的刷题时间吧!(编程语言Python3.0,难度&#xf…

C++模板详解(函数模板、类模板)

hello,这里是bangbang,今天来讲下模板 目录 1. 泛型编程 2. 函数模板 2.1 函数模板概念 2.2 函数模板格式 2.3 函数模板的实例化 2.4 模板参数的匹配原则 3. 类模板 3.1 类模板定义格式 3.2 类模板实例化 4. 非类型模板参数 5. 模板特化 5.1 模板特化概念 5.2…

计算机视觉——day 90 基于级联卷积神经网络和对抗学习的显著目标检测

基于级联卷积神经网络和对抗学习的显著目标检测 I. INTRODUCTIONII. 网路架构A. 基于级联卷积神经网络的生成器G全局显著性估计器 E局部显著性精炼器 R B.鉴别器 DIv. 实验A. 数据集和评价标准B. 实验结果 V. 结论 I. INTRODUCTION 显著目标检测在过去的几年中受到了广泛的关注…

AcWing算法提高课-1.3.7货币系统

宣传一下算法提高课整理 <— CSDN个人主页&#xff1a;更好的阅读体验 <— 本题链接&#xff08;AcWing&#xff09; 点这里 题目描述 在网友的国度中共有  n n n 种不同面额的货币&#xff0c;第  i i i 种货币的面额为  a [ i ] a[i] a[i]&#xff0c;你可以假…

Linux知识点 -- Linux环境基础开发工具使用

Linux知识点 – Linux环境基础开发工具使用 文章目录 Linux知识点 -- Linux环境基础开发工具使用一、Linux编辑器 - vim1.vim的打开与关闭2.vim的三种模式3.命令模式常见命令4.底行模式命令5.设置vim的table键为4个字符 二、Linux编辑器 - gcc / g1.介绍2.gcc / g的使用3.gcc /…

docker笔记详解

Docker 官方文档地址:https://www.docker.com/get-started 中文参考手册:https://docker_practice.gitee.io/zh-cn/ 1.什么是 Docker 1.1 官方定义 最新官网首页 # 1.官方介绍 - We have a complete container solution for you - no matter who you are and where you are …

Linux | 将SpringBoot+Vue项目部署到服务器上

知识目录 一、写在前面二、后端部署2.1 项目打包2.2 项目运行 三、通过Shell脚本自动部署项目3.1 安装Git和Maven3.2 编写Shell脚本3.2 执行脚本 四、前端部署4.1 安装NGINX4.2 node.js安装4.3 npm打包项目4.4 运行项目 四、总结撒花 一、写在前面 大家好&#xff0c;我是初心…

MyBatis配置

配置结构 属性&#xff08;properties&#xff09; 属性不仅可以在内部直接修改&#xff0c;还可以在外部引入&#xff0c;外部引入需要在配置文件引入属性的文件&#xff0c; db.properties放在资源目录下面&#xff0c;然后在configuration标签下面导入外部配置的propertie…

Kali linux ssh Permission denied, please try again解决

新装的kali 没有ssh 装上ssh后root用户禁止登录所以要修改ssh配置&#xff0c;下面就这个过程解决全部演示。 默认情况下 SSH 不允许以 root 用户登录&#xff0c;因此将会出现下面的错误提示信息&#xff1a; Permission denied, please try again.kali linux 默认没有ssh,因此…

股票量价关系基础知识5

图解各阶段量价关系&#xff1a;价涨量增 价涨量增是指股价上涨的同时成交量也放大。它是最常见的多头进攻模式&#xff0c;说明价量配合良好&#xff0c;反映投资者买卖情绪高涨。成交量放大说明有资金流入&#xff0c;做多力量增强&#xff0c;后市看涨。 注意&#xff1a;1…

yolov5 用自己的数据集进行训练

在训练之前先要按照一定目录格式准备数据&#xff1a; VOC标签格式转yolo格式并划分训练集和测试集_爱钓鱼的歪猴的博客-CSDN博客 目录 1、修改数据配置文件 2、修改模型配置文件 3、训练 1、修改数据配置文件 coco.yaml 拷贝data/scripts/coco.yaml文件&#xff0c; pa…