云布道师
阿里云数据可视化产品 DataV 借助“通义千问”大模型能力,推出“智能助手 DataV Copilot ”;通过代码自动生成、智能样式设计、“对话式”业务模版创建等功能,全面提速数据可视化应用开发效率。
一、DataV AI 探索之路:从机器学习到通义千
DataV 数据可视化 AI 的第一步尝试
DataV 团队一直积极探索通过 AI 能力降低可视化应用的开发成本; 2019 年初,DataV 团队发起了 LADV 项目 :一个基于机器学习的可视化生成系统,通过机器学习可视化案例的风格而自动生成数据可视化应用。
通过 LADV ,我们设计了一种新的可视化创建流程。如上图所示,LADV 改变了传统的设计流程,新的流程支持通过手绘草稿/图片进行原型设计及前端还原。
通过图表布局数据训练了可以识别图表位置及类型的识别模型,这也是物体识别模型首次应用于数据图表领域。同时,LADV 不仅仅能够识别图表的类型及位置,还可以将可视化界面的颜色进行提取。从而将原案例风格中更多的维度迁移到机器生成的数据可视化界面中。
LADV 的困境:很有趣,有点用,但是不多
LADV 项目是利用AI技术探索可视化应用的一个有趣实验,但是受 2019 年时间点AI 发展阶段的制约,LADV 项目在实际应用中存在很多问题与困境:
○ 缺乏用户角色定位,无法满足真正业务需求:LADV 的自动生成是针对整个流程,没有明确服务具体的用户角色,“有点用,但是不多”;针对常见的用户角色,LADV 生成结果对设计师来说效果不够美观、对项目经理缺乏业务表达;
○ 缺乏业务输入,无法对接真实场景:LADV 是基于图表的类型及位置的识别来创建,所有看板内容都是基于默认数据,与实际业务场景相去甚远,还需要再次编辑业务说明内容,如各类图表标题、样例数据等。
○ 缺乏对 AIGC 生成结果调试的可能性:缺乏 AIGC 生成过程控制,对生成结果控制力非常有限,导致应用价值受限
大模型技术的新机遇:AI 成为实际工作的提效工具
最近两年大模型技术飞跃式的进步,启发了很多 AI 解决问题的新思路;因此我们发起了 DataV Copilot 项目。经过之前的探索,DataV Copilot 的目标也更加明确:摆脱“新奇噱头”的诱惑,聚焦不同用户角色的实际工作场景,首先解决用户“重复性、技术含量低”的高性价比痛点问题,使得用户能够把更多的精力放在创新性工作上;因为创新性也是衡量可视化应用是否成功的关键因素之一。
二、可视化应用开发的一些普遍问题
为了更好的让 DataV Copilot 解决实际问题,成为真正的生产力工具,我们梳理了当前可视化应用开发的通用流程,分析当前流程中普遍存在的问题,并希望能解决一些“高性价比”痛点。
可视化应用开发的通用流程中常规合作角色包括需求方、项目经理、设计师、程序员等几类;其中项目经理、设计师、程序员三个角色之间存在紧密合作关系,工作流程上互相依赖。
可视化应用开发中痛点问题非常多,按解决价值“性价比”的多寡衡量,我们分场景分角色梳理出以下几个普遍问题场景:
○ 问题场景一:甲方需求频繁变更导致成本变高,例如项目POC制作(没有收入但是投入不小);
○ 问题场景二:需要角色技能互补导致的环节block,比如设计师制作原型需要程序员配合mock数据;
○ 问题场景三:大量低难度长耗时数据加工环节,比如简单数据处理/陈旧API匹配组件格式;
以上问题场景都存在“发生频率高、投入耗时长、技术难度低、产出结果明确且收敛”等共性,是可视化应用开发流程中值得解决的“高性价比”痛点问题。
三、借助“通义千问”,DataV Copilot 可以解决哪些问题?
通过对可视化应用开发现有流程中普遍存在问题的分析,DataV 借助“通义千问”大模型能力,推出了智能助手 DataV Copilot ;希望通过解决/优化常见的痛点,提升整体的开发效率。
与之前希望通过AI能力“一键自动”开发可视化应用的理想化愿景不同,DataV Copilot 面向明确的用户角色,解决明确的应用场景中的重复简单工作提效问题。DataV Copilot 不会替代用户工作,但可以帮助用户提升工作效率、拓展能力边界。
场景一:设计师不再“跪求”程序员造数据
设计师在搭建可视化应用原型的时候,为了追求真实效果,经常需要一些场景样例数据,从不同时间段的图表 mock 数据,到二三维地理场景的空间数据等等;
通过写代码 mock 数据超出了一般设计师的技能领域;经常“跪求”开发写这些简单代码也需要付出大量协调成本,很多时候还不能得到开发的及时响应,成了设计师工作流程中的一个“痛点”。
针对设计师的困境,DataV Copilot 提供了对话式数据生成能力;设计师可以针对具体组件,自助生成 mock 数据,不再依赖开发写代码 mock 数据。
以地理可视化应用开发为例,设计师可以通过一条对话,让 DataV Copilot 生成湖南省内 20 个随机点位数据,并且自动匹配可视化组件需要的格式。
以往开发 mock 数据的流程,需要先获取湖南省边界数据,再 mock 边界内数据,再处理匹配组件数据;DataV Copilot 生成 mock 数据的效率提升是非常显著的。
场景二:程序员告别“搬砖”,从低难度、耗时数据处理工作中解脱
● 接口数据格式自动匹配
在实际可视化应用项目交付中,存在大量数据接入工作;尤其是政务类项目,几百上千个图表司空见惯,数据格式的处理匹配成了一件必要但是非常耗时的“搬砖”工作。
DataV Copilot 为 DataV 图表增加了默认格式智能推荐能力,历史系统的 API 格式不匹配 DataV 图表,只需要“一键点击”就可以自动前端处理匹配,不用数据开发再修改 API 匹配格式。
● 自动生成数据处理脚本
在可视化应用开发中,经常遇到图表需要接入的数据源需要处理。后端处理数据流程较长,且容易对生产系统造成影响;前端处理往往数据开发同学又不熟悉前端 JS 语言。针对这种情况,DataV Copilot 提供了对话式数据处理脚本生成能力,让数据开发同学轻松在前端处理数据。
场景三:项目经理的更快、更低成本产出项目原型
项目 POC 是大型可视化项目交付中非常常见的需求环节,有时候甚至是项目成交的关键因素。但是从执行流程看,项目未正式立项情况下,POC 不能获得充足的研发、设计资源支持是项目经理面临的常见挑战。
● 对话式 AIGC ,理解 POC 的业务需求
为了帮助项目经理快速、低成本制作 POC ,DataV Copilot 提供了对话式项目生成功能;与以往的现有模版生成项目、手绘图纸生成项目不同,DataV Copilot 接受业务内容“对话式”输入,在对各项业务需求/指标理解的情况下,动态输出符合输入需求的可视化应用 POC。
例如,项目经理需要快速为电商客户制作销售数据监控大屏,可以向 DataV Copilot 输入以下需求描述:“请给我制作一个数据看板,需要展示产品的全球销售分析情况,包括各个国家的销量情况、产品类别每日销售额、月度销售增长率、季度净收益、产品毛利率、客户留存率等数据指标”;
DataV Copilot 根据需求的描述,例如空间的表述、数据指标的表述,分析并推荐适合的可视化形式。
● 加强 AIGC 结果调整能力,提高结果可用性
为了提升 POC 项目生成的实用性,DataV Copilot 强化了可视化应用生成结果的调整能力,这也是目前 AIGC 应用普遍的一个问题;只有提供充分的生成结果调整能力,AIGC 才能满足用户的初始意图。
DataV Copilot 在可视化应用生成结果基础上,提供“视觉风格”、“布局版式”两种快速调整功能,帮助项目经理快速调整最基础的要素。
提供常用数据看板布局选择,快速变换合适布局:
调整至合适的风格和布局后,选择快速生成可视化应用 POC:
● 保留 AIGC 生成结果调整能力,提高结果可用性
DataV Copilot 生成结果可以继续进入传统工作流进行手动修改,项目经理在有设计资源支持的情况下,进一步提升 POC 效果。
通过引入通义大模型的能力,DataV Copilot 帮助项目经理、设计师、程序员等用户角色解决了实际工作中几个“发生频率高、投入耗时长、技术难度低”的普遍问题,实现了可视化项目交付效率的提升。
四、通义千问×DataV:更多的可能性
作为一个云原生的应用构建平台,DataV 将以开放的姿态拥抱大模型的更多能力。
工作流程提效,将更多“重复性体力活”交给“通义”大模型
当前可视化应用开发中还是有很多低技术含量高投入低重复性工作,这是 DataV Copilot 后续持续发力的重点领域,持续帮助不同用户角色在实际工作中提效;
借助“通义”AIGC 能力,拓展用户角色的能力边界
当前通义大模型在文字、图片、三维模型、视频等领域的 AIGC 能力演进飞速,DataV Copilot 后续将整合更多 AIGC 工具,为可视化设计师解锁更多技能包,扩展能力边界;
更好的大模型与人交互迭代能力,确保 AIGC 结果的实际可用性
DataV Copilot 始终关注 AIGC 结果的实际可用性,将提供更多中间过程的交互迭代能力,提升产出结果的实际应用价值;
商品详情页
商品公众号