ChatGPT、Claude 和 Gemini 在数据分析方面的比较(第 2 部分)

news2024/12/27 0:40:23

       欢迎来到雲闪世界。欢迎回到我的系列文章的第二部分,ChatGPT、Claude 和 Gemini 在数据分析方面的比较!在本系列中,我旨在比较这些 AI 工具在各种数据科学和分析任务中的表现,以帮助其他数据爱好者和专业人士根据自己的需求选择最佳的 AI 助手。如果您错过了第一篇文章(利用 OCR 和强大的 GPT-4o 迷你模型对收据进行信息提取),我比较了它们在编写和优化 SQL 查询方面的表现 — 请务必查看! 虽然 2024 年奥运会已经结束,但我们的 AI 竞赛才刚刚开始。到目前为止,Claude 3.5 Sonnet 已经领先!但它能保持自己的地位吗,还是 ChatGPT 和 Gemini 会赶上来?🏆 在第二篇文章中,我们将重点介绍他们独立进行探索性数据分析 (EDA) 的能力。作为一名数据科学家,想象一下拥有一个 AI 工具的便利性,它可以立即为新数据集提供数据洞察和建议,以指导高级分析和建模。让我们看看哪种模型可以提供最佳的 EDA。

添加图片注释,不超过 140 字(可选)

什么是 EDA 探索性数据分析 (EDA) 是检查和分析数据集以了解其主要特征的过程,通常使用视觉技术。它涉及数据清理、汇总统计数据以及识别数据中的模式、趋势和关系。目标是发现指导进一步分析或建模的见解,确保在进行更复杂的任务之前彻底了解数据。EDA 的关键组成部分包括:

  1. 数据检查:了解数据集的结构(例如,行数、列数、数据类型)并预览样本数据。

  2. 数据清理:纠正数据类型、处理缺失值和验证数据(例如,确保在必要时值是唯一的)。

  3. 单变量分析:使用可视化对单列执行描述性统计(例如平均值、中位数、分位数)。

  4. 双变量和多变量分析:探索成对或多组变量之间的关系。

  5. 见解和建议:产生见解和可行的建议,以提供进一步的分析或建模。

评估标准 我们将在“自动驾驶”模式下评估这三种工具,仅提供一个提示来进行 EDA,看看它们能走多远。评估将基于五个关键方面: 1.完整性(5分): EDA报告是否涵盖了数据检查、数据清理、单变量分析、多变量分析和洞察等五个基本方面? 2. 准确性(4 分):报告中的统计计算、可视化以及得出的见解或结论有多准确? 3. 可视化质量(4 分):可视化是否清晰、可解释且与报告相关? 4. 洞察力(4 分):报告是否根据已识别的模式、趋势或关系产生洞察力? 5. 可重复性和文档(3 分):报告是否有详尽的文档记录,以便其他人可以重复该分析? 请参阅下表中的详细评分标准:

添加图片注释,不超过 140 字(可选)

问题设置 这是我们用于本次评估的数据集:来自 Kaggle 的客户性格分析数据集(CC0:公共领域许可证)。 这是我的提示:

 
 

您是一家连锁杂货店的数据科学家。 您有一个数据集,其中包含客户的人口统计信息、 购买数据和营销活动历史记录。您今天的目标是对该数据集 进行彻底的探索性数据分析 (EDA),并提供必要的数据清理、分析和可视化、清晰的见解和可行的建议。 您的 EDA 将用于更好地了解客户、根据客户行为影响产品策略,并为进一步的客户细分分析和建模提供信息。 以下是各列的说明: 1. 人员-ID:客户的唯一标识符 -Year_Birth:客户的出生年份 -Education:客户的教育程度 -Marital_Status:客户的婚姻状况 -Income:客户的家庭年收入 -Kidhome:客户家庭中的儿童数量 -Teenhome:客户家庭中的青少年数量 -Dt_Customer:客户在公司注册的日期 -Recency:自客户上次购买以来的天数 -Complain:如果客户在过去 2 年内投诉过,则为 1,否则为 0 2. 产品 -MntWines:过去 2 年在葡萄酒上的花费 -MntFruits:过去 2 年在水果上的花费 -MntMeatProducts:过去 2 年在肉类上的花费 -MntFishProducts:过去 2 年在鱼上的花费 -MntSweetProducts:过去 2 年在糖果上的花费-MntGoldProds:过去 2 年在黄金上花费的金额3. 促销 -NumDealsPurchases:使用折扣进行的购买次数-AcceptedCmp1:如果客户接受了第一个活动中的优惠,则为 1,否则为 0 -AcceptedCmp2:如果客户接受了第二个活动中的优惠,则为 1,否则为 0 -AcceptedCmp3:如果客户接受了第三个活动中的优惠,则为 1,否则为 0 -AcceptedCmp4:如果客户接受了第四个活动中的优惠,则为1,否则为 0 -AcceptedCmp5:如果客户接受了第五个活动中的优惠,则为 1,否则为 0 -Response:如果客户接受了上一个活动中的优惠,则为 1,否则为 0 4. 地点 -NumWebPurchases:通过公司网站进行的购买次数 -NumCatalogPurchases:使用目录进行的购买次数 -NumStorePurchases:直接在商店购买的商品 -NumWebVisitsMonth:上个月访问公司网站的次数

聊天GPT-4o 总得分:19/20 1. 完整性(5/5) ChatGPT 的 EDA 响应首先概述了其将采取的步骤,涵盖了 EDA 的所有五个关键组件。

  • 数据检查:使用 ChatGPT 进行数据分析的一个优点是,它可以通过直接在界面中扩展数据集来轻松预览数据集。

添加图片注释,不超过 140 字(可选)

  • 数据清理:ChatGPT 执行了必要的步骤,包括填充缺失值和更正数据类型。对于缺失值,它仔细评估了分布,income并决定用中位数收入来填补,从而提供了合理的推理。

添加图片注释,不超过 140 字(可选)

  • 单变量分析age:ChatGPT 分析了包括、、和在内income的主要特征的分布,并提供了研究结果的摘要。marital statuseducation

添加图片注释,不超过 140 字(可选)

  • 双变量和多变量分析:ChatGPT 探索了特征对之间的关​​系,例如收入与总支出之间的相关性,以及按产品类别划分的平均支出。它再次从这些分析中得出了关键见解。

添加图片注释,不超过 140 字(可选)

  • 见解和建议:ChatGPT 在每个可视化部分之后提供了关键见解,并得出了明确且可操作的建议。

添加图片注释,不超过 140 字(可选)

2. 准确度(4/4) 所有数据清理、可视化和分析步骤均由 Python 代码支持。在手动运行代码并将其结果与 Claude 和 Gemini 的结果进行比较后,ChatGPT 的输出是准确的。它的见解也与分析结果非常吻合。 3. 可视化(3/4) ChatGPT 创建的可视化图表标记清晰,图表类型恰当,并附有见解。您还可以轻松下载图表以用于文档和演示文稿。 我唯一的抱怨是,虽然一些简单的可视化是交互式的(允许您将鼠标悬停在它们上面以查看值),但大多数都不是。因此,我扣了一分,以表示有待改进 :)

添加图片注释,不超过 140 字(可选)

4. 洞察力(4/4) 如上面的截图所示,ChatGPT 提供了超过 4 条见解,并给出了具体、可操作的建议,在此获得了满分。 5. 可重复性和文档(3/3) ChatGPT 的报告结构直观,每个部分后面都附有代码片段,以确保可重复性。因此,此处授予全部荣誉。

添加图片注释,不超过 140 字(可选)

克劳德 3.5 十四行诗 总得分:16/20 1. 完整性(4/5) Claude 的报告比 ChatGPT 短得多,主要是因为它没有显示可视化,而只显示文本报告。但它仍然涵盖了 EDA 的大部分关键组件。

  • 数据检查:虽然可以点击上传的 CSV 文件,但预览只是文本格式,不太容易理解。Claude 也没有提供任何数据结构的文本描述。因此,我认为这一步并不完整。

添加图片注释,不超过 140 字(可选)

  • 数据清理:Claude 的报告以“数据质量和清理”部分开始,包括删除缺失值、创建新列和清理分类值等步骤。您可以在附加的代码片段中清楚地看到这些步骤。与选择用中位数估算缺失收入值的 ChatGPT 不同,Claude 只是删除了有缺失值的行。考虑到只有 24 行,我认为这两种方法都是合理的。

添加图片注释,不超过 140 字(可选)

  • 单变量分析:Claude 在其 Python 脚本中包含了单变量分析代码,并在其报告中混合了见解。

添加图片注释,不超过 140 字(可选)

  • 双变量和多变量分析:同样,在下面的屏幕截图中,您可以看到 Claude 从双变量分析和相应的代码中得出的发现。

添加图片注释,不超过 140 字(可选)

  • 见解和建议:列出见解之后,克劳德提供了一套全面的可行建议以及合理的后续步骤。

添加图片注释,不超过 140 字(可选)

2. 准确度(3/4) 我查看了 Claude 生成的 Python 脚本并手动运行了它。虽然大部分代码都是准确的,但由于包含非数字列,相关矩阵部分出现了错误。我与 Claude 分享了此错误的屏幕截图,它通过df.select_dtypes(include=[np.number])仅添加数字列过滤器来纠正此问题。 这个小错误导致扣一分。

添加图片注释,不超过 140 字(可选)

3. 可视化(2/4) 与 ChatGPT 和 Gemini 不同,Claude 并不直接显示可视化效果,而是提供 Python 脚本。这是因为它无法在 UI 中执行 Python 代码。但它确实支持运行 JavaScript 和其他一些编程语言。我要求它显示可视化效果,它编写了带有图表预览的 JavaScript 代码——但脚本中的硬编码数字与数据集不一致,导致混乱…… 我手动运行了 Python 脚本,虽然它们生成了准确的可视化效果(除了上面的相关矩阵错误),但与其他工具相比,整体体验不太友好。因此,我因为这个限制扣除了两分。

添加图片注释,不超过 140 字(可选)

4. 洞察力(4/4) 尽管缺乏可视化,Claude 的建议仍然富有洞察力且可操作,涵盖产品重点战略、活动优化、高价值客户保留和交叉销售机会等领域。洞察力和建议的质量获得了满分。 5. 可重复性和文档(3/3) Claude 的回复结构清晰,要点按照数据清理、见解、建议和后续步骤的顺序列出。底层 Python 代码可通过右侧的“Artifact”窗口访问。Artifact可轻松查看和迭代代码,将其与左侧的文本报告进行协调,甚至发布代码与他人共享。

添加图片注释,不超过 140 字(可选)

双子座高级版 总得分:19/20 1. 完整性(5/5) Gemini 提供了详尽的 EDA,全面覆盖了所有关键组件。

  • 数据检查:您可以在 Gemini 中打开 CSV 文件来仔细查看数据集(尽管不像 ChatGPT 那样具有交互性)。Gemini 还包含一段描述数据结构的段落。

添加图片注释,不超过 140 字(可选)

  • 数据清理:与 Claude 类似,Gemini 纠正了数据类型,计算了新列(例如age和enrollment period),并删除了缺少值的行。

添加图片注释,不超过 140 字(可选)

  • 单变量分析:Gemini 进行了详尽的单变量分析,并打印了 10 多个直方图和箱线图来探索单个变量。

添加图片注释,不超过 140 字(可选)

  • 双变量和多变量分析:Gemini 采取了非常彻底的方法,在多个网格中生成了超过 50 个可视化效果,探索了几乎所有可能的变量对。

添加图片注释,不超过 140 字(可选)

  • 见解和建议:在展示所有可视化效果之后,Gemini 提供了清晰的见解,然后提供了结构良好的建议。

添加图片注释,不超过 140 字(可选)

2. 准确度(4/4) Gemini 附带了清晰易懂的 Python 代码。查看并运行代码后,一切都正常。其洞察也与可视化相符,准确性获得满分。 3. 可视化(3/4) 与使用经典 Python 可视化包的 ChatGPT 和 Claude 不同matplotlib,seabornGemini 使用altairJSON 格式保存图表,并将其嵌入聊天机器人 UI。这使得图表具有高度交互性。 然而,如上图所示,其相似图表数量众多(超过 50 张),再加上标签重叠,使得数据难以有效解读。因此,我在可视化方面扣了一分。 4. 洞察力(4/4) Gemini 总结了主要发现,并在“产品策略”和“客户细分和营销”两个主要类别下提供了可行的建议。这些见解切实可行,与数据高度吻合,在洞察力方面获得了满分。

添加图片注释,不超过 140 字(可选)

5. 可重复性和文档(3/3) 尽管由于可视化数量众多,Gemini 的响应比其他模型更长,但其报告结构良好,并且附带的 Python 代码确保可以轻松重现分析。这为其重现性赢得了满分。 最终结果

添加图片注释,不超过 140 字(可选)

获胜者是......🥁 ChatGPT-4o和Gemini Advanced — — 我们打平了! 三个模型的最终得分非常接近,甚至排名第三的 Claude 3.5 Sonnet 也获得了 20 分中的 16 分,占总分的 80%。值得注意的是,我只用一个提示就进行了这次比赛!在数据专业人员的指导下,这些工具的功能可以得到显著增强。

  • ChatGPT-4o和Gemini Advanced:两种模型各只丢了一分。ChatGPT-4o 因其可视化的交互性有限而被扣分,而 Gemini Advanced 则因其可视化的混乱性质而丢了一分。

  • Claude 3.5 Sonnet:Claude 的主要缺点是无法运行 Python 代码并直接显示可视化效果,并且 Python 脚本中有一个小错误。但是,由于它能够运行 JavaScript 等其他编程语言,我们可能很快就会看到它支持 Python 可视化效果!

其他注意事项 选择 EDA 助手时,还需要考虑以下几点:

  • 选择性 EDA 与详尽性 EDA:有趣的是,ChatGPT 和 Claude 倾向于专注于他们认为重要的选定列,从而提供更易理解、更集中的报告;另一方面,Gemini 提供详尽的分析,生成各种图表。每种方法都有其优缺点:选择性分析更容易理解,而详尽分析提供全面的覆盖范围,这可能会让人不知所措。所以,你喜欢哪种风格取决于你。

  • 输出稳定性:我在每个工具中使用相同的数据集运行了相同的提示三次,这样我的评估就不会偏向于单次运行——考虑到 LLM 的性质,它们的响应每次都会发生变化。这也让我注意到它们不同的输出稳定性水平。Gemini 显示出最高的方差,每次运行的报告结构和内容都不同。它在三次运行中的一次生成了相关矩阵热图,在另一次运行中,它甚至进行了 K 均值聚类。与此同时,ChatGPT 和 Claude 更加一致,尽管他们在可视化和见解的选择上也有所不同。因此,如果您依赖 LLM 来生成见解,最好多次运行相同的提示以确保获得最佳输出(当然,您可以随时跟进并明确要求提供任何缺失的内容)……

  • 响应速度:在这三者中,ChatGPT-4o 是最快的——它几乎立即开始响应。Claude 稍慢一些,大约需要 10 到 20 秒才能启动。Gemini 的启动和完成时间最长,因为它生成的图表数量巨大,但仍低于 3 分钟。

结论 如果您正在寻找快速、清晰的 EDA 报告,ChatGPT-4o是您的不二之选。但如果您更喜欢对数据集进行详尽的探索,并且可以容忍不太精致的可视化,Gemini Advanced可能是您的更好选择。

感谢关注雲闪世界。(Aws解决方案架构师vs开发人员&GCP解决方案架构师vs开发人员)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2059053.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

告别图片堆成山, 图片转pdf工具:你的整理小能手来啦!

嘿,各位小伙伴!你们有没有觉得,现在拍照比吃饭还日常,手机、电脑里堆满了照片,找起来简直跟大海捞针似的?别急,我今儿个就来给你们支个招——图片转PDF大法,一键变成整整齐齐的PDF文…

【Java-异常】

异常:程序在运行期间产生的一些错误 Java通过API中Throwable类的众多子类描述各种不同的异常。Java异常都是对象,是Throwable子类的实例。 Throwable可以划分为两个大类: Error错误类:会导致JVM虚拟机宕机 Exception异常类&…

Java---二维数组

一.数组的维数 假象:一维数组 二维数组:数组中的元素是一维数组 二.五子棋游戏 import javax.swing.*;public class Array06 {static String[][] matrix new String[15][15];static String black "⚫";static String white "⚪"…

SQL进阶技巧:多维分析之如何还原任意维度组合下的维度列簇名称?【利用grouping_id逆向分析】

目 录 0 需求描述 1 数据准备 2 问题分析 3 小结 0 需求描述 现有用户访问日志表 visit_log ,每一行数据表示一条用户访问日志。 需求: (1)按照如下维度组合 (province), (province, city), (province, city, device_type) 计算用户访问量,要求一条SQL语句统计所所…

[000-01-018].第3节:Linux环境下ElasticSearch环境搭建

我的后端学习笔记大纲 我的ElasticSearch学习大纲 1.Linux系统搭建ES环境: 1.1.单机版: a.安装ES-7.8版本 1.下载ES: 2.上传与解压:将下载的tar包上传到服务器software目录下,然后解压缩:tar -zxvf elasticsearch-7…

logstash入门学习

1、入门示例 1.1、安装 Redhat 平台 rpm --import http://packages.elasticsearch.org/GPG-KEY-elasticsearch cat > /etc/yum.repos.d/logstash.repo <<EOF [logstash-5.0] namelogstash repository for 5.0.x packages baseurlhttp://packages.elasticsearch.org…

以太坊 Pectra 升级四个月倒计时,哪些更新值得期待?

撰文&#xff1a;Ignas&#xff0c;DeFi Research 编译&#xff1a;J1N&#xff0c;Techub News 现在市场有充分的理由看空以太坊。因为自 2023 年初的市场低点以来&#xff0c; SOL 的涨幅比以太坊高 6.8 倍&#xff0c; 过去两年内 ETH/BTC 交易对的跌幅为 47%。 现在是以太…

Maven高级使用指南

在开发大型项目时&#xff0c;Maven作为一个强大的构建和项目管理工具&#xff0c;能显著提升项目管理和构建的效率。然而&#xff0c;随着项目的扩大&#xff0c;维护和管理的复杂性也随之增加。本文将探讨一些高级的Maven用法和解决方案&#xff0c;以帮助你更好地管理大型项…

在ISIS中什么是IP从地址

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…

win11安装python及pycharm与webots联合仿真

1、查看Windows系统 是否已安装Python及版本 【冰糖Python】Windows系统 查看已安装的Python版本_怎么确定windows上成功安装python-CSDN博客 好&#xff0c;确认没装下面装python37 2、安装python3.7.9 参考教程Python 3.82安装教程&#xff08;Windows11、超详细版&#x…

Linux Shell 编程基础入门(一)

&#x1f600;前言 本篇博文是关于自动化工具Shell 编程的基本介绍&#xff0c;希望你能够喜欢 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我的动…

微服务:配置管理和配置热更新

参考&#xff1a;黑马程序员之微服务 &#x1f4a5; 该系列属于【SpringBoot基础】专栏&#xff0c;如您需查看其他SpringBoot相关文章&#xff0c;请您点击左边的连接 目录 一、引言 二、配置共享 1. 添加共享配置到nacos &#xff08;1&#xff09;jdbc的共享配置 shared…

点灯案例优化(三)宏定义特定位名称

前面利用位运算对代码进行二次优化以后&#xff0c;确实可读性更好&#xff0c;精确性更高了。但是吧&#xff0c;你乍一看这个代码 你可能一下都反应不过来这些的啥意思了&#xff0c;表达式右边上来就是一顿运算&#xff0c;可能刚开始大多数人都看不懂这写的什么&#xff0c…

用Python解决优化问题_模拟退火模板

一、模拟退火算法简介 模拟退火&#xff08;Simulated Annealing&#xff09;是一种启发式算法&#xff0c;用于在优化问题中找到一个好的解。启发式是指一种用于找到解决问题方法的原则或策略&#xff0c;它不保证找到最优解&#xff0c;但可以快速找到一个足够好的解。在许多…

资产全生命周期管理系统 固定资产全生命周期管理解决方案

什么是资产全生命周期管理系统 资产全生命周期管理系统是指对企业资产从采购、使用、维护、到报废的整个过程进行全方位管理的软件系统。通过这个系统&#xff0c;企业可以实现对资产的实时监控和管理&#xff0c;确保资产的利用率最大化。这个系统不仅能够跟踪资产的状态&…

C语言 数据存储

整形在内存中的存储&#xff08;之前的操作符讲过些许但不是很全&#xff0c;现在详细记录&#xff09; 对于一个整型变量来说&#xff0c;在内存中需要怎样存储&#xff1f; 之前了解到内存中存放的是补码&#xff08;正数的原反补都相同。回忆一下负数原码&#xff0c;反码…

IPD开发流程:项目风险画像

目录 1、内容简介 2、IPD 工具&#xff1a;项目风险画像 首先是独特性。 第二个是不确定性。 第三个是临时性。 第四个是跨职能性。 最后一个是变革性。 作者简介 1、内容简介 在 IPD 开发流程中&#xff0c; 经常会提到开发是一项投资行为、 产品/项目的商业价值等…

精细化管理和智慧化运营的智慧油站开源了

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒&#xff0c;省去繁琐重复的适配流程&#xff0c;实现芯片、算法、应用的全流程组合&#xff0c;从而大大减少企业级应用约95%的开发成本。用…

【数据分享】2018-2023年全国范围10米分辨率的耕地利用强度数据(免费获取)

耕地利用强度数据是评估农业生产力、规划土地使用、监测粮食安全与环境可持续性的关键&#xff0c;对政策制定和资源管理具有重要指导意义。然而&#xff0c;目前国家范围的耕地利用数据集在时空连续性、分辨率和精度方面存在局限性。 本次我们分享的是2018年至2023年分辨率为…

Rocky 8.10安装流程步骤详细教程

Rocky 8.10安装流程步骤详细教程 1. Rocky 8.10 安装2. 登录3. 配置修改3.1 打开命令行窗口3.2 网卡配置3.3 修改网卡名3.4 配置镜像源3.5 删除网卡多余内容3.5.1 删除virbr03.5.2 删除altname enp3s03.5.3 删除ipv63.5.4 修改ip地址(这步没有需要可以忽略) 3.6 升级openssh3.7…