GPT-4能否取代数据分析师?达摩院的初步实验为你解答~

news2024/11/26 15:42:52

22984623367c3f7bd83e8f75900406ef.png

深度学习自然语言处理 原创
作者 | 刘嘉玲

最近,数据分析师圈子大家在讨论GPT-4对他们的工作有什么影响:是替代还是辅助?个人认为GPT-4可以帮助我提高工作效率和质量。

要成为一名高级的数据分析师,需要经过长期的学习和实践,掌握数据分析的理论、技术和方法。这样的人才对雇主来说,也需要付出较高的合作成本。

达摩院的初步实验表明GPT-4的成本远低于雇用数据分析师的成本。假设每月工作21天,每天工作8小时,按照市场上的工资水平来算,GPT-4的使用成本只有初级数据分析师的0.71%和高级数据分析师的0.45%。79673d79d4694dabf4f98c05da9c63b2.png这个结果是从三位达摩院的研究者们设计的一个让GPT-4从数据获取、清洗、分析、可视化到报告的整个过程都自动完成的框架下得出的。

接下来,我们一起来看看他们的论文中,GPT-4是如何做到的吧!

5f1a3641b5cde1403e1a4f7f8157febb.png

论文:Is GPT-4 a Good Data Analyst?
地址:https://arxiv.org/abs/2305.15038
代码:https://github.com/DAMO-NLP-SG/GPT4-as-DataAnalyst

研究方法

为了使用GPT-4自动化整个数据分析过程,研究者们将端到端的框架分成了代码生成代码执行分析生成三个步骤,通过这个框架,可以对比GPT-4和人类分析师的表现。

3e7ea504e16f1d070f547d7fc1d810a2.png
图:GPT-4作为数据分析师的工作流程

此图中业务问题和数据库的必填信息如右上蓝色框所示。参考外部知识源的可选输入在左上角的红色虚线框中圈出。包括提取数据、数据可视化和分析在内的输出在底部的绿色框中圈出。

为了实现作业任务,我们需要进行以下步骤:

  • 输入问题,并将其转换为数据库可以识别的格式;

  • 调用GPT-4,根据问题生成相应的数据库查询代码;

  • 运行查询代码,从数据库中获取相关数据;

  • 对获取的数据进行处理和分析,生成能够反映问题答案的图表或图像。

实验设计

任务目标:需要回答一个与业务相关的问题,并从一个或多个相关的数据库表中提取所需数据。然后,需要生成可视化图形以便更好地理解数据,并提供一些分析和见解,以帮助人们更好地理解数据。

具体来说就是:给定一个与业务相关的问题(q)和一个或多个相关的数据库表(d)及其模式(s),提取所需的数据(D),生成一个图(G)可视化并提供一些分析结果(A)。fab773cadd6f14555c2a027c4b17671a.png

数据来源:研究者们选择了NvBench数据集从不同领域随机选择100个6种不同图表类型和4种不同难度级别的问题进行实验。再分别让GPT-4和2位高级分析师和1位初级分析师去做这个任务,以得到任务结果数据。

评估指标:针对俩种输出内容,设置了七种不同的维度进行效果评价。可视化图是根据信息正确性,图表类型正确性和美观这三个维度评价。分析文本则是根据数据正确性,与问题相关性,分析复杂度和表达流畅度四个维度评价。

在这些维度上同时聘请了6名专业数据注释者对任务的输出进行人工评估打分。

实现结果

令人惊讶的是,实验结果显示,GPT-4可以达到与人类相当的表现。这意味着,GPT-4不仅能理解和生成语言,还能进行复杂的数据分析任务。

e5b75e2f73f8630f9f718703ab55be07.png
表:GPT-4作为数据分析师的表现

根据上表,GPT-4生成的图表在信息准确度方面表现不佳,平均得分只有0.78;但在图表类型选择方面表现优异,正确率达到99%;图表的美观程度一般。GPT-4的分析结果在正确性方面较高,平均有94%的内容是正确的,而且与问题相关性较好;但分析的复杂度和流畅度都不高。

7dcb89ebd17e79a65e46ef976ed7a601.png
表:数据分析师和GPT‑4在几个随机示例上的比较

上表中,根据3位分析师的分析结果的各指标得分来看,我们可以对GPT-4的数据可视化和分析能力进行如下总结:

  • 在数据可视化方面,GPT-4的准确率比初级分析师高6%,与高级分析师相当,但在图表类型的选择上有一次失误,而且图表的美观度还有待提高。

  • 在数据分析方面,GPT-4的数据正确性处于初级和资深高级分析师之间,但在分析的复杂度和问题相关性上与高级分析师持平,甚至在文本的表达流畅度上超过了人类分析师,展现了大语言模型的优势。

个案研究

GPT-4的案例研究1

dacb0dff9242fced04fad3f4965f0e71.png
  • GPT-4能够根据问题生成相应的代码,从数据源中查询数据,并用饼图可视化不同飞机的胜率。

  • GPT-4能够从饼图中读取数据,比较不同飞机的胜率,并计算它们赢得的比赛数量。

  • GPT-4在分析数据时,不仅考虑比率,也考虑绝对数值,这是符合数据分析原则的。

  • GPT-4还具有提出问题的能力,能够根据分析结果,提出一些可能影响飞机胜率的因素,并探索它们之间的关系。这些问题反映了GPT-4的思维深度和广度,超过了我的期待。

GPT-4的案例研究2

48146e629d07f81ee51c79aac2a0d7ac.png
  • 案例2是一个关于身高体重关系的问题,要求描述两个变量之间的相关性。

  • GPT‑4在提取数据方面做得正确,但在进行一些细节的计算上,例如求平均身高和体重时,出现了数字错误。

  • 其他复杂计算的案例也有此问题,还有幻觉问题。

高级数据分析师案例研究3

749e03f1d6d305b15f30c1fe0deb33ea.png
  • 互联网分析师对于橄榄球数据的分析中能够发现数据中的一些异常现象,比如有些位置的得分高于或低于预期。

  • 人类分析师还能够解释这些现象的可能原因,比如运动员的个人能力,对手的防守,或者比赛的策略。

  • 人类分析师还能够提出一些改进的建议,比如怀疑数据的准确性,或者调整位置的安排。

总结

GPT-4还可以通过插件联网,搜索实时在线信息,结合背景知识进行数据分析和结论推断,越来越接近人类分析师的水平。但也有一些它无法完成的任务,例如理解数据的深层含义,考虑假设条件,提出有效的解决方案,与团队成员协作沟通等。

这篇论文为我们提供了一个新的视角,让我们重新思考人工智能的可能性和限制。虽然GPT-4在数据分析任务上的表现令人鼓舞,但我们还需要进行更多的研究,才能确定它是否真的可以取代数据分析师。


进NLP群—>加入NLP交流群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/587327.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无代码玩转GIS应用,我也在行【文末送书】

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通…

jQuery-图片跟随

<!DOCTYPE html > <html> <head> <meta http-equiv"Content-Type" content"text/html; charsetUTF-8"> <title>图片跟随 </title> <style type"text/css"> body { text-align: center; …

【配电网重构】基于改进二进制粒子群算法的配电网重构研究(Matlab代码实现

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

使用FPGA进行 AI 火灾定位-FirAI

部署在 FPGA 上加速的 AI 火灾侦查。助力消防人员快速应对火灾事故~ 绪论 问题&#xff1a;近年来&#xff0c;不断增加的城市人口、更复杂的人口密集建筑以及与大流行病相关的问题增加了火灾侦查的难度。因此&#xff0c;为了增强消防人员对火灾事件的快速反应&#xff0c;安装…

delmia机器人建模与装配

1 可以用catia中的模型或其他三维建模软件中的模型转化为step格式即可 2 在demlia中打开 3 打开单个零件保存为cgr格式 对机械臂所有零件都做同样的转化 4 新建装配设计&#xff0c;并导入带有坐标的零件 将转化后的零件都选中导入即是装配好的 5 将模式修改为device buildin…

用户行为数据采集:常见埋点方案优劣势对比及选型建议

数据采集是大数据的基石&#xff0c;用户在使用App、微信小程序等各种线上应用产生的行为&#xff0c;只有通过埋点才能进行采集。没有埋点&#xff0c;数据分析决策、数据化运营都是无源之水&#xff0c;巧妇难为无米之炊。但很多时候&#xff0c;“埋点”两个字却成了C端产品…

STM32——关于NVIC讲解及标准库应用(基础篇)

简介&#xff1a; NVIC是指STM32中的中断控制器&#xff08;Nested Vectored Interrupt Controller&#xff09;。中断是STM32中的重要机制&#xff0c;通过中断可以实现异步事件处理。NVIC提供了灵活、高效、可扩展的中断处理机制&#xff0c;支持多级优先级、多向中断、嵌套向…

深入理解网络协议

hi 大家好&#xff0c;之前带小伙伴&#xff0c;一起复习了一遍网络协议&#xff0c;对网络协议的核心知识进行梳理&#xff0c;希望大家早日掌握这些核心知识&#xff0c;打造自己坚实的基础&#xff0c;为自己目标慢慢积累&#xff0c;厚积薄发。 详细点击查看-> 极客星球…

傅一平:一文讲透ERP的下一代架构!

”5月22日&#xff0c;华为宣布仅用15小时便完成了全球88家子公司MetaERP系统的切换。这也意味着华为MetaERP系统研发取得胜利&#xff0c;成功摆脱外国供应商断供停服威胁&#xff0c;实现该系统的全栈自主可控。“ 自己最近对ERP下一代架构有了兴趣&#xff0c;原因有四个&am…

阿里拆成1+6+N,中台还搞不搞了?

&#x1f4e3;&#x1f4e3;&#x1f4e3;&#x1f4e3;&#x1f4e3;&#x1f4e3;&#x1f4e3; &#x1f38d;大家好&#xff0c;我是慕枫 &#x1f38d;前阿里巴巴高级工程师&#xff0c;InfoQ签约作者、阿里云专家博主&#xff0c;一直致力于用大白话讲解技术知识 &#x…

推荐 6 个上周 火火火 的开源项目

本期推荐开源项目目录&#xff1a; 1. ChatGPT 网页应用&#xff08;AI&#xff09; 2. AI 换脸&#xff08;AI&#xff09; 3. API 调用 Midjourney 进行 AI 画图&#xff08;AI&#xff09; 4. 如何使用 Open AI 的 API&#xff1f;&#xff08;AI&#xff09; 5. 中华古诗词…

写在2023年乐夏前

&#xff08;1&#xff09;白衬衣的少年 勇敢的你 站在这里 脸庞清瘦却骄傲 &#xff08;2&#xff09;来啊&#xff0c;一起摇摆啊 这首歌发表在2016年。那时候的他们已经功成名就&#xff0c;彭磊却还能写出这样的词。 纸醉金迷不应该是&#xff1a;防晒霜、付税单、玫瑰金、…

Python海龟有了新技能,这回画了个印度美女。Python海龟洪水填充命令fill的用法

Python海龟有了新技能&#xff0c;这回画了个印度美女。看官想一想&#xff0c;如果要填充圆环区域&#xff0c;该如何填充呢&#xff1f;Python的海龟模块本质是对凸多边形的填充&#xff0c;对于凹多边形的填充无法胜任。 真正的Python海龟绘图在这&#xff0c;视频里还有点…

AI绘画真的是太神奇!

最近会员群的同学一直研究AI绘画&#xff0c;AI技术真的太神奇了&#xff0c;以前是插画师的看家本领&#xff0c;现在通过AI技术一下子让平头老百姓也能有这样的技能&#xff01;好像路痴有了导航也能开车了。最近在研究如何利用AI做卡通头像&#xff0c;发现这个不仅好玩&…

深度图解 Redis Hash(散列表)实现原理

1. 是什么 Redis Hash&#xff08;散列表&#xff09;是一种 field-value pairs&#xff08;键值对&#xff09;集合类型&#xff0c;类似于 Python 中的字典、Java 中的 HashMap。一个 field 对应一个 value&#xff0c;你可以通过 field 在 O(1) 时间复杂度查 field 找关联的…

更换Mysql数据库-----基于Abo.io 的书籍管理Web应用程序

之前公司一直使用的是ASP.NET Boilerplate (ABP)&#xff0c;但是当解决方案变得很大时&#xff0c;项目启动就变得非常慢&#xff0c;虽然也想了一些办法&#xff0c;将一些基础模块做成Nuget包的形式&#xff0c;让整个解决方案去引用。但是整个项目还是很臃肿&#xff0c;各…

双轴高精度倾角传感器安装方式和485协议

倾角安装注意事项 在安装传感器时&#xff0c;不正确安装会导致测量角度误差偏大。安装时请注意以下两点&#xff1a; 1.“两面”指安装面与被测物体的安装面紧靠&#xff08;被测物体的安装面要尽可能水平&#xff09;&#xff0c;不能有夹角产生&#xff08;如A图中的角a&a…

【靶场】vulfocus搭建和场景编排

前言 Vulfocus 是一个漏洞集成平台&#xff0c;将漏洞环境 docker 镜像&#xff0c;放入即可使用&#xff0c;开箱即用&#xff0c;这里我们搭建在云服务器上&#xff0c;需要高一点的配置&#xff0c;搭建可以按需搭建本地和自己的服务器上&#xff0c;我们主要使用场景编排功…

【系统学习】Java基础1之多线程

前言 被公司换岗一年多了&#xff0c;从Linux C换到了java开发&#xff0c;奈何大环境不好&#xff0c;半吊子经验找不到好工作。 接触了spring cloud, spring boot k8s等许多新的知识。已经开发Java生态相关项目已一年半&#xff0c;但都止步于用的阶段&#xff0c;自知毫无竞…

小航编程题库蓝桥杯stem科技素养模拟练习试卷(初级第2套)(含题库教师学生账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统&#xff08;含题库答题软件账号&#xff09;_程序猿下山的博客-CSDN博客 25. 百度公司是一家于 2000 年创立的互联网公司&#xff0c;其业务范围十分广泛。以下选 项中&#xff0c;&#xff08; &#xff09;不…