【玩转TableAgent 数据智能分析】-- 数据分析不再是专业人士的专利

news2024/11/26 22:19:18

文章目录

    • 前言
    • 一、TableAgent介绍
      • TableAgent 数据分析智能体
      • 融合创新应用的新成果
        • Table Family
    • 二、注册TableAgent
      • 访问TableAgent
      • 注册
      • 用量
    • 三、 体验TableAgent
      • 样例数据集体验
        • 选择样例数据集
        • 样例数据集进行数据分析
          • 数据图
        • 样例数据集进行数据分析规定图表格式
          • 数据图
        • 自定义数据集体验
          • 准备数据
          • 数据概览
          • 数据分析方向
          • 导入数据
          • 简单数据分析
          • 复杂数据分析

前言

在数字化时代,数据分析的重要性已经变得无处不在,就像我们生活中必不可少的空气一样。它是数字化管理和智能决策的基础,但同时也是一项高度专业化的工作。对于那些只会使用Excel的人来说,面对描述性分析、诊断性分析和预测性分析可能会感到相当头疼。然而,九章云极DataCanvas公司自主研发的TableAgent数据分析智能体的出现,让大型模型对个人生产力的提升达到了新的高度。只需要知道如何提问,你就能成为一个顶级的数据分析师,深入洞察数据的奥秘。

2023年7月9日,OpenAI发布了一款震撼全球的Code Interpreter插件,让“人人都是数据分析师”的梦想成为现实。然而,早在6月28日,九章云极DataCanvas公司就已经提前发布了TableGPT。现在,Code Interpreter已经更名为Advanced Data Analysis,而TableGPT也进行了一系列的重大升级,以TableAgent的新名字重新上线,面向全社会开放公测。

一、TableAgent介绍

TableAgent 数据分析智能体

TableAgent是一款功能强大的企业级数据分析智能体,可以实现私有化部署。它具备出色的意图理解能力、分析建模能力和深刻的洞察力。通过充分理解用户的意图,TableAgent能够自主地运用统计科学、机器学习、因果推断等高级建模技术,从海量数据中挖掘出有价值的信息。这不仅为用户提供了精准的分析观点,还能为他们制定决策提供深刻的见解。此外,凭借自有的大型模型和自主研发的T+底层体系,TableAgent能够灵活适应各行各业以及不同专业领域的需求,实现在特定领域内个性化数据分析场景下的专业化微调。
TableAgent现已开放公测 : 点击即可访问

融合创新应用的新成果

九章云极DataCanvas公司自主研发的Alaya九章元识大模型,为TableAgent提供了关键性的技术支持。通过在Alaya基础大模型上进行微调,衍生出了Alaya-ZeroX模型组,这些模型各具特色,能够协同完成复杂的分析任务。不同规模的模型参数确保了生成质量和推理性能的同时满足。
此次TableAgent的发布还带来了一项重要功能,即专业化微调。由于不同行业和企业在数据分析领域有着各自独特的语言背景和分析模型需求,通用的分析工具往往难以满足这些专业化要求。而TableAgent则能为企业提供这种专业化的微调服务。

为了实现这一目标,TableAgent特别设计了一套名为T+(Table Family)的系统。该系统能够高效地进行定制化的微调工作,并且具备自我迭代的能力。这一系统性的支持使得数据分析各个环节的升级更加高效,用户在无需感知的情况下就能享受到不断升级的数据分析体验。

image.png

Table Family

二、注册TableAgent

访问TableAgent

点击链接 体验TableAgent, 如下图所示,点击立刻体验
image.png

注册

输入手机号``验证码 登录 TableAgent
image.png

用量

注册后可以免费使用5次,次数使用完了,可以认证申请增加次数(每天15次)

image.png

三、 体验TableAgent

样例数据集体验

TableAgent 提供了 样例数据集 可以使用样例数据集快速上手 TableAgent

image.png

接下来我们使用TableAgent提供的样例数据集进行数据分析的体验

选择样例数据集

我们选择全球大学排名信息的数据集

当数据集加载成功之后, 左侧的对话框内返回了关于该数据集的信息, 并且提供了问题的可选项以供用户参考, 同时在详情的折叠面板中有这关于数据集的csv 的数据展示 ,如下图所示
image.png

样例数据集进行数据分析

**提问:**画图分析中国的前10所大学最重要的3个指标,简单总结一下他们之间的比较分析。

数据图

效果图

image.png
image.png
image.png
分析:

  1. 根据我给出的问题,并没有指定数据图的格式, 这里TableAgent 自动选择的是柱状图进行展示, 可以说是比较人性化的, 更加直观
  2. x轴数据明显重叠了, 这一点还是有待优化的。
  3. 再给出数据图表的同时,也给出了数据分析的内容,这一点简直绝了。
  4. 在详情的折叠内容中, 也会给出分析的步骤,以及代码思路, 这一点对于研发人员也是非常的友好
样例数据集进行数据分析规定图表格式

通过1.2 的问题我们可以看到, 我们并没有指定图表格式, TableAgent 给我们择优选择了柱状图, 接下来我们规定一下输出的图表格式, TableAgent 是否可以理解并执行呢?

提问: 通过折线图分析中国的前10所大学最重要的3个指标,简单总结一下他们之间的比较分析。

数据图

效果图

image.png
image.png
image.png
分析:
此时我让TableAgent 用折线图进行数据分析, 通过效果图我们发现, TableAgent 返回的数据分析图与我们的预期相符,同时TableAgent 也给了我们相应的分析过程及结果,同时也给出了接下数据分析的方向。

总结:
针对柱状图和折线图以及TableAgent 给出的分析结论我们可以得到综合的结论

  1. 教育水平、研究声誉和师生比例:
  • 从柱状图中可以观察到,北京大学和清华大学在教育水平、研究声誉和师生比例等方面处于领先地位,而其他大学如中国科学技术大学、复旦大学和上海交通大学也表现出色。
  • 数据表中显示了这些大学在不同指标下的具体得分和排名,进一步印证了柱状图的结果。
  1. 学术声誉得分、就业率和国际学生比例:
  • 通过折线图和数据表,可以发现清华大学在学术声誉得分和国际学生比例方面表现较好,而北京大学在就业率上处于较高水平。
自定义数据集体验
准备数据

如下链接为我们准备的csv数据集

online_shopping_10_cats.csv

数据概览

10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店),共 6 万多条评论数据,正、负向评论各约 3 万条

数据分析方向

情感/观点/评论 倾向性分析

导入数据

如下图所示, 我们清楚原有数据集, 然后导入我们准备好的数据集,进行数据分析。

image.png

注意:由于我们准备的数据是10Mb , 但是TableAgent目前允许的最大的数据量是不可以超出5Mb的,因此我们需要对数据进行裁剪,使之在5Mb 以内。

删除"cat"列中包含"洗发水"、“热水器”、“蒙牛”、“衣服”、"计算机"和"酒店"的行


import pandas as pd

# 读入CSV文件到DataFrame中
df = pd.read_csv('online_shopping_10_cats.csv')

# 删除"cat"列中包含"衣服"、"计算机"和"酒店"的行
df = df[~df['cat'].isin(['洗发水', '热水器', '蒙牛', '衣服', '计算机', '酒店'])]

# 将结果保存到新的CSV文件中
df.to_csv('new_data.csv', index=False)

如图所示清理过后数据集大小正好符合要求, 直接导入即可

image.png

简单数据分析

首先我们进行简单的数据分析,
问题如下: 对书籍、平板、手机、水果、洗发水、热水器、蒙牛 这几个类别进行用户倾向性分析,数据集中cat代表类别,label为0代表负面评价为1为正向评价,review代表用户的评价

数据图:
image.png
image.png

分析:对于我们自己的数据集TableAgent不仅给出了图表分析,同时也给出了详细的分析结果,返回结果符合我们的预期

复杂数据分析

接下来我们将问题复杂化,看下TableAgent 是否依旧可以给出完美的分析结果
问题如下: : 对书籍、平板、手机、水果、洗发水、热水器、蒙牛 这几个类别进行用户倾向性分析,数据集中cat代表类别,label为0代表负面评价为1为正向评价,review代表用户的评价,分析数据集中 review列用户的正向评论和负向评论, 并将绘制成旭日图和散点图

数据图:
image.png
image.png
image.png
分析:从结果来看 并不符合我们的预期, 我们计划生成的是旭日图和散点图 , 但是实际上给出的结果却是柱状图, 当然这里不排除我们数据集本身的原因

五、常见问题
通过TableAgent提供的样例数据集和我么自己提供的数据集来看,存在以下问题:

  1. 用户如果导入的数据集低于5MB时, 需要自己对数据进行处理,删除多余的数据,这点显然不是很友好
  2. 过于复杂的图形(可能是数据集的原因), 理解的并不是很友好
  3. 给出的提问方向或者示例,有时并不符合数据集的内容

六、总结
TableAgent其实是九章云极之前发布的TableGPT升级后的产品形态,通过本次的体验能明显感觉到在性能方面有显著提升,以自然语言对话的方式实现结构化数据的分析工作,这对我这种数据建模的小白来说蛮友好的。它的另一个大亮点是支持企业私有化部署,做ToB企业的都知道现在企业对数据安全是多么地看重。不得不说给个大大的赞哦!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1291851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决:IndentationError:unindent does not match any outer indentation level

解决:IndentationError:unindent does not match any outer indentation level 文章目录 解决:IndentationError:unindent does not match any outer indentation level背景报错问题报错翻译报错位置代码报错原因解决方法今天的分享就到此结束了 背景 在…

Ui自动化概念 + Web自动化测试框架介绍!

1.UI自动化测试概念:我们先明确什么是UI UI,即(User Interface简称UI用户界面)是系统和用户之间进行交互和信息交换的媒介 UI自动化测试: Web自动化测试和移动自动化测试都属于UI自动化测试,UI自动化测试就是借助自动化工具对程序UI层进行自动化的测试 …

Mysql之数据处理增删改

Mysql之数据处理增删改查 插入数据INSERT INTO语句的使用INSERT 与子查询结合 更新数据(修改数据)UPDATE SET语句 删除数据DELETE FROM语句 Mysql8新特性:计算列 插入数据 INSERT INTO语句的使用 用 INSERT INTO 语句,向表中插入数据 方式一:…

网络安全威胁——DDoS攻击

DDoS攻击 1. 定义2. DDoS攻击类型2.1 网络层攻击2.2 传输层攻击2.3 应用层攻击 3.DDoS攻击态势特点 1. 定义 分布式拒绝服务(DDoS)攻击是一种常见的网络攻击形式。攻击者利用恶意程序对一个或多个目标发起攻击,企图通过大规模互联网流量耗尽…

活动预告 | 中国数据库联盟(ACDU)中国行第四站定档西安,邀您探讨数据库前沿技术

作为墨天轮社区与中国数据库联盟的品牌活动之一,【ACDU 中国行】已走过深圳、杭州、成都三大城市,在线下汇集数据库领域的行业知名人士,共同探讨数据库前沿技术及其应用,促进行业发展和创新,同时也为开发者们提供一个友…

什么是HTTPS加密协议?

文章目录 应用层协议什么是HTTP?认识URL工具 什么是HTTPS协议?什么是“加密”? 应用层 我们程序猿写的一个个解决我们实际问题,满足我们日常需求的网络程序,都是在应用层。 协议 协议是一种 “约定”。socket api的…

富时中国a50指数准确吗

富时中国A50指数简介 富时中国A50指数(FTSE China A50 Index)是富时罗素指数有限公司(FTSE Russell)编制的,旨在反映中国A股市场50家市值较大、流动性较好的公司的股价表现。它是国际上对中国A股市场投资者影响较大的…

springbootmybatisPlus

分页 1.加 Configuration public class MybatisPlusConfig {Beanpublic MybatisPlusInterceptor mybatisPlusInterceptor() {MybatisPlusInterceptor interceptor new MybatisPlusInterceptor();interceptor.addInnerInterceptor(new PaginationInnerInterceptor());return …

前端笔记(四)Flex 布局

标准流 标准流也叫文档流,指的是标签在页面中默认的派不规则,例如:块元素独占一行,行内元素可以一行显示多个。 但是很多的网页布局都是块元素在一行中显示的,这时候就需要浮动和 Flex 布局,浮动只需要了解…

【Java基础系列】JavaWeb入门

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

【LeetCode】2629. 复合函数

复合函数 题目题解 题目 请你编写一个函数,它接收一个函数数组 [f1, f2, f3,…, fn] ,并返回一个新的函数 fn ,它是函数数组的 复合函数 。 [f(x), g(x), h(x)] 的 复合函数 为 fn(x) f(g(h(x…

MYSQL练题笔记-高级查询和连接-最后一个能进入巴士的人

一、题目相关内容 1)相关的表和题目 2)帮助理解题目的示例,提供返回结果的格式 二、自己初步的理解 一群人要上巴士但是巴士有体重限制,那只能有限个人才能上去 最后输出这个最后一个上去还不超重的人的名字 我认为首先要缩小…

Java+Swing: 登录和重置按钮的点击事件 整理6

1. 在Login类中给按钮添加事件 // 按钮添加鼠标点击事件loginButton.addActionListener();resetButton.addActionListener(); 2. 创建一个事件处理的类, 该类实现了ActionListener package com.handler;/*** Author:xiexu* Date:2023/12/7 13…

K8S 删除命令空间时 一直卡住怎么办?

当使用完一个命名空间后,想删除了又删除不掉,这个时候查看命名空间的状态一直是Terminating。使用强制删除,也是还是不行。(找了好多办法都不行) [rootk8s-master kubernetes-yaml]# kubectl delete ns mem-example Er…

3DMAX UV贴图修改插件安装卸载方法

3DMAX UV贴图修改插件安装卸载方法 3dMax贴图修改插件PolyUnwrapper是为纹理艺术家设计的一整套专业工具,尤其适用于建筑和游戏行业。 它包含许多功能,将大大帮助您改进UV展开的工作流程。 【主要功能特点】 -多重缝合。一次缝合多个壳 -自定义打包算…

MTTS | 多语言多人的VITS语音合成项目实现

----------------------------------🗣️ 语音合成 VITS相关系列直达 🗣️ ------------------------------------- 🫧VITS :TTS | 保姆级端到端的语音合成VITS论文详解及项目实现(超详细图文代码) 🫧MB-iSTFT-VITS&am…

2024年江苏省职业院校技能大赛 信息安全管理与评估 第二阶段教师组 (样卷)

2024年江苏省职业院校技能大赛 信息安全管理与评估 第二阶段教师组 (样卷) 项目竞赛样题 本文件为信息安全管理与评估项目竞赛-第二阶段样题,内容包括:网络安全事件响应、数字取证调查、应用程序安全。 本次比赛时间为180分钟。 介绍 GeekSec专注技能竞…

Java聊天程序(一对一)简单版

我们首先要完成服务端,不然出错,运行也要先运行服务端,如果不先连接服务端,就不监听,那客户端不知道连接谁 服务端 import java.awt.BorderLayout; import java.awt.event.ActionEvent; import java.awt.event.Actio…

常见数据同步工具之实时同步

实时数据同步是现代数据处理中非常重要的一环。在常见的数据同步工具中,Flume、Flink CDC和DataX都是非常受欢迎的选择。它们各自有自己的工作原理、优势和劣势。 Flume主要用于日志传输,简单易用但对特定数据源可能有限;Flink CDC基于CDC技术…

jQuery ajax读取本地json文件 三级联动下拉框

步骤 1:创建本地JSON文件 {"departments": [{"name": "会计学院","code": "052"},{"name": "金融学院","code": "053"},{"name": "财税学院",&qu…