不同AI分析错误代码的差异:谁更胜一筹?谁才是最强者?结果出乎意料!

news2024/11/25 22:53:56

先祝大家新春快乐,我已经提前三天上班了~~为了年后新框架能上线运行,这几天没人打扰,能安静地冲一下代码,嘎嘎嘎。

准备

错误代码:

...
foreach($arr_config['path'] as $value_path)
{
	if(file_exists($value_path))
	{
		require_once $value_path.'.php';
	}
}
...

现在是一目了然错在哪里,但开发的时候因为脑子绕在前一个错误的里面没出来,所以一直没看出来错哪里了。。。尤其一开始我的脑子有点混乱,感觉AI尽在说车轱辘话:我当然知道是路径的错,但我不相信是路径的错。。。

测试下来大多AI都找到出错方向了,只是没切中我的痛点。给出代码的解决方案都不尽如人意,只有讯飞星火碰巧第一次就答对。

想看结果的点击右侧目录跳到最后去,中间过程太长了,慢慢看。

如果是文字方面的趣味比较,可以看看这篇《不同的AI修改同一篇文章标题》

在这里插入图片描述

国外AI

Chatgpt3.5

chatgpt找到错误原因了

第一次对话

在这里插入图片描述

第二次对话

我说他回答错了是不对的。给出的方案挺全面,针对后缀特别写了方案。
在这里插入图片描述

第三次对话

并没有给出代码解决方案。
在这里插入图片描述

Gemini(谷歌)

写得真够多的,但回答错误,好处是它提示到我错哪里了。。。,就是那个 .

虽然谷歌的方案最扯淡,但是我隐隐觉得这货有智能,它似乎在找突破口,尤其当我再次问他的时候,它回答问题时又再次提到这个 .

第一次对话

看似错大谱了,但好像它在思考。
在这里插入图片描述
在这里插入图片描述

第二次对话

在这里插入图片描述
在这里插入图片描述

第三次对话

这家伙纠结于 . 让我感觉以外。
给了一次错误的代码解决方案,再给了三次正确的代码解决方案。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Claude

这个AI是我平时用的最多的~~

第一次对话

完全找错方向,有点胡说八道的味道了。
很大可能是因为之前我一直在问他一个循环内错误的情况,所以它结合了上下文来回答这次提问导致出错。
在这里插入图片描述

第二次对话

在这里插入图片描述

第三次对话

语句精炼,且给出的方案也正确。
在这里插入图片描述

在这里插入图片描述

国产AI

文心一言3.5

目前用下来,百度AI是国产顶流。我经常会拿百度和国外的三个AI联合使用。

它提到了 file_exists()require_once() 处理的路径可能不同,而其它AI并没有明显的将两者结合对比。

第一次对话

在这里插入图片描述

第二次对话

还给出了else的语句
在这里插入图片描述

第三次对话

再次询问后没有给出代码方面解决方案。

在这里插入图片描述

在这里插入图片描述

讯飞星火

和chatgpt一样,从 file_exists() 作为突破口,而且给出了正确的解决方案!

告诉它切入点后它竟然给了错误的答案。。。

再次询问时它又是从原来的切入点找了,给出的解决方案也是错的。

总结就是讯飞没有上下文概念。每次询问就是新的询问,并不会结合上文,所以你最好期盼它能一击命中。

第一次对话

一击命中,但之后的连续错误说明只是运气好~~
在这里插入图片描述

第二次对话

唯一一个提示了错误的位置,还是给出了错误的代码解决方案。

在这里插入图片描述

第三次对话

继续错

在这里插入图片描述

豆包

今天刚开始用,它有各种角色包,我用它查了一次历史相关的问题,回答还是蛮专业的。

第一次对话

跳开路径判断直接调用,这招坏坏的哦。
在这里插入图片描述

第二次对话

给出了正确的代码解决方案。
在这里插入图片描述

第三次对话

又回到最初~~还是用了第一次的方案,说明没有懂第二次对话的意思。
在这里插入图片描述

在这里插入图片描述

综合分析

列表

  • 分类规则
    R1 表示第一次询问后AI能否找到正确的出错原因(首次询问);
    S1 表示第一次询问后AI能否给出正确的解决方案;
    R2 表示第二次询问后AI能否分析正确的出错原因(告知要点);
    S2 表示第二次询问后AI能否给出正确的解决方案;
    R3 表示第三次询问后AI能否找到正确的出错原因(重新再问);
    S3 表示第三次询问后AI能否给出正确地解决方案;

  • 积分规则
    R系
    1 表示原因表述正确,切中要点;
    0 表示原因表述方向对了,但没切中要点;
    -1 表示原因表述错误。
    S系
    1 表示解决方案表述正确,并给出了正确代码;
    0 表示解决方案表述正确,但没有给出代码;
    -1 表示解决方案表述正确,但代码错误;
    -2 表示解决方案表述错误,代码也错误;

名称R1S1R2S2R3S3得分备注
Chatgpt 3.50011103中规中矩,没有惊喜
Gemini-1-21110.50.5S3给了4个方案,其中有1个错的
Claude-1-211111可能因前文误导,R1S1错误,有点可惜
文心一言 3.50011103国产顶流,还是可以的
讯飞星火111-10-11唯一S1就完全正确
豆包01110-12S1、S2的代码能解决问题,但并非我要

结论

得分只是根据这一次表现所做,平时都是联合着一起用的,并不代表在代码方面的平均水平,所以我在总结一下个人感受:

  • Chatgpt 3.5 中规中矩吧,我对它信任度较高,但最近的表现感觉变懒了;
  • Gemini 话最多,但在代码方面的感觉比较差,整体感觉和别的AI不太一样,不知道是智商高、个性强还是没调教好;
  • Claude 是我用最多的,感觉它在代码方面最强,第一次的丢分很大可能是它结合之前的问题在回答;
  • 文心一言 3.5 是国产顶流,没得说,可以和三个国外拼一拼;
  • 讯飞星火 因为没有上下文概念,用的最少;
  • 豆包 我今天才用,后面多测试了再说,但是它角色多,今天问了一个历史方面的,表现还是不错的。

尽管分数不尽如人意,但我个人目前代码分析首推的还是Claude,其次是Chatgpt文心一言豆包 有待观察。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1451405.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

制作怎么自己搭建一个网站

制作怎么自己搭建一个网站 一.领取一个免费域名和SSL证书,和CDN 1.打开网站链接:https://www.rainyun.com/ycpcp_ 首先创建一个CDN,这里以我加速域名“cdntest.biliwind.com 1”为例 这里就要填写 cdntest.biliwind.com 1 ,而…

Java 和 JavaScript 的奇妙协同:语法结构的对比与探索(上)

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

FuckIt.py库让你的代码从此远离bug

今天给你推荐的这个库叫 “FuckIt.py”,名字一看就是很黄很暴力的那种,作者是这样介绍它的: FuckIt.py uses state-of-the-art technology to make sure your Python code runs whether it has any right to or not. Some code has an error…

无心剑中译莎士比亚《劝君缔结连理枝》

莎士比亚十四行诗第8首 Sonnet 8 - 劝君缔结连理枝 Music to hear, why hear’st thou music sadly? Sweets with sweets war not, joy delights in joy. Why lovest thou that which thou receivest not gladly, Or else receivest with pleasure thine annoy? If the tru…

BUGKU-WEB bp

题目描述 题目截图如下: 进入场景看看: 解题思路 提示说:弱密码top1000?z???(爆破?)先看看源码有没有提示 相关工具 Burp Suit 爆破top1000字典,点击下载 解题步骤 随便测试账号密码admin、admin 得到提…

scIMC:scRNA-seq插补方法基准

在scRNA-seq中一个主要的挑战即为“dropout”事件,它扭曲了基因表达,显著影响了单细胞转录组的下游分析。为了解决这个问题,已经做了很多努力,并开发了几种基于模型和基于深度学习的scRNA-seq插补方法。但是,目前还缺乏…

彻底理解无刷电机

前言 现在很多设备都是搭载的无刷电机而不是有刷电机了,为啥?性能好啊! 引入 同性相斥异性相吸 可以看出,只要改变磁铁的极性,电机就能转起来 那 怎么改变磁铁极性呢? 右手螺旋定则可以根据电流的流向…

ch3-homework-基于InternLM和LangChain搭建自己的知识库

ch3-homework-基于InternLM和LangChain搭建自己的知识库 复现课程知识库助手搭建过程先看结果环境配置语料开源词向量模型Sentence Transformer知识库搭建InternLM 接入 LangChain构建检索问答链,并基于Gradio框架部署 基础作业: 复现课程知识库助手搭建…

【Day42】代码随想录之动态规划0-1背包_416. 分割等和子集

文章目录 动态规划理论基础动规五部曲:出现结果不正确: 416. 分割等和子集 动态规划理论基础 动规五部曲: 确定dp数组 下标及dp[i] 的含义。递推公式:比如斐波那契数列 dp[i] dp[i-1] dp[i-2]。初始化dp数组。确定遍历顺序&am…

Android---Jetpack Compose学习006

1. 点击 clickable 修饰符允许应用检测对已应用该修饰符的元素的点击。 示例:点击控件,使得内容发生改变 class MainActivity : ComponentActivity() {override fun onCreate(savedInstanceState: Bundle?) {super.onCreate(savedInstanceState)setCo…

C++数据结构与算法——双指针法

C第二阶段——数据结构和算法,之前学过一点点数据结构,当时是基于Python来学习的,现在基于C查漏补缺,尤其是树的部分。这一部分计划一个月,主要利用代码随想录来学习,刷题使用力扣网站,不定时更…

0901多元函数的基本概念-多元函数微分法及其应用

文章目录 1 平面点集1.1 坐标平面1.2 平面点集1.3 邻域1.4 电与点集的关系1.5 聚点1.6 点集所属点的特征定义的平面点集 2 多元函数的概念2.1 定义2.2 值域2.3推广2.4 自然定义域2.5 二元函数的图形 3 多元函数的极限4 多元函数的连续性4.1 连续函数定义4.2 间断点定义4.3 多元…

【教程】C++语言基础学习笔记(八)——函数

写在前面: 如果文章对你有帮助,记得点赞关注加收藏一波,利于以后需要的时候复习,多谢支持! 【C语言基础学习】系列文章 第一章 《项目与程序结构》 第二章 《数据类型》 第三章 《运算符》 第四章 《流程控制》 第五章…

2024】前端,该卷什么呢?_2024-02-16

2024已来,过去的 2023 可以说是具有里程碑意义的一年,ChatGPT 的炸裂式发展,很多大佬都亲自入场整活儿,你不得不说,人工智能时代的未来已来,大势所趋,不可阻挡。随着生成式AI的迅猛发展&#xf…

Spring AMQP(3.1.1)设置ConfirmCallback和ReturnsCallback

文章目录 一、起因二、代码1. 定义exchange和queue2. RabbitTemplate3. EnhancedCorrelationData4. 发送消息 环境如下 VersionSpringBoot3.2.1spring-amqp3.1.1RabbitMq3-management 一、起因 老版本的spring-amqp在CorrelationData上设置ConfirmCallback。但是今天却突然发…

RCS系统之:浅谈系统设计与开发

这是我在开发RCS系统中的一些个人感悟与心得,写出来与大家一起分享下。是想到什么写到什么,如果有什么不对的,欢迎大家一起探讨。 有些人喜欢把WMS系统下面的系统统称为RCS系统。 但我不是这么想的,我这里把WMS/ERP系统与AGV之间…

[office] Excel 数据库函数条件区域怎样设置 #笔记#笔记

Excel 数据库函数条件区域怎样设置 以下面的数据表格为例,对于条件区域的设置,有几方面需要注意的内容,下面就一起看看如何对Excel 数据库函数条件区域设置的吧。希望会大家有所帮助 以下面的数据表格为例,对于条件区域的设置&am…

Java:如何判断一个链表是否为回文结构?(画图+代码 详解)

一、判断思想 我们设计一个时间复杂度为O(n),额外空间复杂度为O(1)的算法,我们在不创建额外空间的基础上来判断是否为回文结构。 思想: 1、使用快慢指针法,找到链表的中间节点。 2、翻转中间节点的后半部分。 3、分别从头节点和尾节点向中间遍…

网课:数独挑战——牛客(题解与疑问)

涉及知识点:打表 题目描述 数独是一种填数字游戏,英文名叫 Sudoku,起源于瑞士,上世纪 70 年代由美国一家数学逻辑游戏杂志首先发表,名为 Number Place,后在日本流行,1984 年将 Sudoku 命名为…

《合成孔径雷达成像算法与实现》Figure6.13

clc clear close all参数设置 距离向参数设置 R_eta_c 20e3; % 景中心斜距 Tr 2.5e-6; % 发射脉冲时宽 Kr 20e12; % 距离向调频率 alpha_os_r 1.2; % 距离过采样率 Nrg 320; % 距离线采样数 距离向…