BI 软件能对付多少数据分析任务?

news2024/10/12 20:26:56

其实没多少!
从早期喊的多维分析到近年来喊敏捷 BI,BI 厂商一直在强调自助能力,宣称可以由业务人员自己随心所欲地分析数据,而用户也常常有强烈的需求,双方一拍即合,很容易形成购买行为。
不过,就大多数缺乏 BI 应用经验的用户所期望的工作内容而言,自助分析的目标就可以说远远达不到!从经验上看,最好情况也就能解决 30% 左右的问题而已,而大多数 BI 产品连这个数也达不到,只能处理 10% 左右的需求。

数据分析的根本在于数据,或者说是在于计算,而不是界面。新一代敏捷 BI 产品在界面美观度和操作方便度上有了不小的进步,但数据运算能力还是没能超出多维分析的范围。
多维分析是指针对某个事先准备好的数据集(称为立方体 CUBE),以一定的条件过滤后(称为切片)按指定维度查看某些统计值,比如某年中某产品按地区和月份汇总的销售量和销售额,用 SQL 写出来都是这么一种样子:

SELECT Di,...,SUM(Mi),COUNT(Mi),... FROM T GROUP BY Di,... WHERE Di=... AND Di IN (...) ...

BI 软件的作用在于让用户改变过滤条件和查看维度时特别方便,可以从当前已经看到的状态走到目标状态,就是所谓的旋转、钻取、切片等动作,这对于交互分析很有意义。但是,无论怎样的方便流畅,能做的运算也还是这么一句 GROUP BY+WHERE,并没有更多。

BI 产品有时还能支持一些简单的跨行组运算,比如计算比上期、排名、占比等,显然这些运算的结果对于商业分析也有着重要的意义。跨行组运算和常规汇总不同,常规汇总只有给定一组维度就可以统计了,而跨行组运算还要多一个范围层次,但市面上大多数 BI 软件并没有关注这个,会武断地把范围层约定为全集。这样如果想看看某地区销售额在省内的排名,就只能先把数据切片限定在省内,然后一个个省来看,否则就只能看到在全国范围内的排名了,这很不方便。考察 BI 软件时要特别注意这一点,是不是支持给跨行组运算设定范围层,厂商当然都会说能支持跨行组运算,但支持程度弱的时候就会导致有些分析任务做不了。
做到多维分析这一步,其实只能解决 10% 左右的自助需求,这是 BI 产品最常见的自助能力。

多维分析的主要问题在于有个建模过程,也就是要事先准备数据集,分析的数据也要限定在数据集中。但实际应用中会经常超出这个范围,可能会涉及到以前没想到的数据项,或者和另一个数据集做一个关联运算,这都会导致再建模。而建模需要求助于技术人员,这样业务人员的自助就无从谈起了。
为解决这个局限性,有些 BI 产品开始提供关联查询能力。一般是在多维分析前面增加一步,能够基于多个数据集关联计算出新的数据集再来做多维分析,或者在多维分析过程中支持多个立方体间的某些关联运算。这相当于允许业务用户一定程度可以自己建模。
不过,实现关联查询并不容易,其根源是关系数据库对关联运算(JOIN)的定义过于简单造成的,导致数据集之间的关联关系看起来过于繁琐,超出许多业务人员的理解能力。这个困境在 BI 产品的界面协助下能有一些改善,好的 BI 产品能够让业务人员自动处理表间唯一的关联关系。但面向不唯一的情况(企业应用中很常见)仍然很困难,我们之后会再仔细讲这个话题。要从根本上解决这个问题,就要改变数据库层的数据组织模型。而几乎所有的 BI 产品都不会重新定义数据库的数据模型,其关联查询能力就会受限。
一个可用于检验 BI 产品关联能力的通俗例子:查询女经理的男员工。这个很简单的查询需求中涉及到同一数据集的多次关联,大多数 BI 产品都处理不了(除非事先建模)。
有了关联查询能力后,BI 产品能解决的自助需求占比能提高到 20%-30%,具体程度要看产品提供的关联能力的强弱。

剩下更多的需求,就都会涉及到有多步骤的过程计算,这完全超出绝大多数 BI 产品的设计目标了,但却是用户特别希望解决的问题,做到这一步,才能叫业务人员随心所欲地分析数据。
一个简单办法是使用 BI 产品导出基本数据,由业务人员自己用 Excel 等桌面工具去做,Excel 足够灵活方便,可以相对随心所欲地完成多步骤运算,从这个意义讲呢,Excel 才是最重要的 BI 工具。
不过,Excel 面对较复杂的数据计算以及要反复执行的运算也会无能为力,而且数据量大了也撑不住,在许多应用场景无法胜任。Excel 这些缺失,都可以用 esProc SPL 来配合补充,不过说来话长,之后再讲。

针对于用户最普遍的自助数据分析需求,BI 产品的能力实际上是相当弱的。经常的情况是:BI 厂商说的是多维分析,而用户想的是那些需要过程计算才能解决的问题,这个错位就会导致期望高而失望大的局面。用户要清楚自己的自助需求:是否做到多维分析就够了?有多少关联查询需求?业务人员是否会提出大量需要过程计算的问题?这样才能设定合理的期望值,知道 BI 产品对自己的作用在哪里,不被产品的花哨界面和流畅操作迷惑,避免事后的遗憾。
BI 界以前有个词叫 shelfware,就是用来描述这种中看不中用的产品。厂家人员开玩笑说卖的不是 software,而是买来就被扔进柜子不再动的 shelfware。在演示阶段让用户产生极大的期望以为真能让业务人员自己分析,实际用起来完全不是那回事,结果都被当作报表工具在用,而这些 BI 软件做报表的能力还很差。这是购买 BI 产品的一个大坑!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2208700.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Skyeye 云智能制造 v3.14.8 发布,ERP 商城 + AI

Skyeye 云智能制造,采用 Springboot winUI 的低代码平台、移动端采用 UNI-APP。包含 30 多个应用模块、50 多种电子流程,CRM、PM、ERP、MES、ADM、EHR、笔记、知识库、项目、门店、商城、财务、多班次考勤、薪资、招聘、云售后、论坛、公告、问卷、报表…

(JAVA)2-3树思想与红黑树的实现与基本原理

1. 平衡树 ​ 学习过二叉查找树,发现它的查询效率比单纯的链表和数组的查询效率要高很多。 ​ 大部分情况下确实是这样的,但不幸的是,在最坏情况下,二叉查找树的性能还是很糟糕。 ​ 例如我们一次往二叉树中插入9,8,7,6,5,4,3,…

【LeetCode】动态规划—714. 买卖股票的最佳时机含手续费(附完整Python/C++代码)

动态规划—714. 买卖股票的最佳时机含手续费 题目描述前言基本思路1. 问题定义2. 理解问题和递推关系状态定义:状态转移公式:初始条件: 3. 解决方法动态规划方法伪代码: 4. 进一步优化5. 小总结 Python代码Python代码解释总结&…

出海电商新怎样用海外云手机引流?

随着互联网行业的迅猛发展,出海电商、海外社交媒体营销以及游戏产业等领域对技术工具的需求不断增加。在这种趋势下,海外云手机作为一种新型解决方案,正在受到广泛关注。 特别是在出海电商中,平台如亚马逊、速卖通、eBay等通过结合…

Mysql(八) --- 视图

文章目录 前言1.什么是视图?2.创建视图3. 使用视图4. 修改数据4.1.注意事项 5. 删除视图6.视图的优点 前言 前面我们学习了索引,这次我们来学习视图 1.什么是视图? 视图是一个虚拟的表,它是基于一个或多个基本表或其他视图的查询…

8款宝藏手机app,适配安卓和苹果手机

好用的手机APP太多,差点挑花了眼!今天来分享4款苹果手机和4款安卓手机上的宝藏软件,看看你喜欢哪一款~ IOS系统APP 1.搜图神器 一款拥有海量图片资源的图片搜索神器,它聚合海内外知名搜索引擎,想要图片直接搜索就行…

用java来编写web界面

一、ssm框架整体目录架构 二、编写后端代码 1、编写实体层代码 实体层代码就是你的对象 entity package com.cv.entity;public class Apple {private Integer id;private String name;private Integer quantity;private Integer price;private Integer categoryId;public…

【JavaScript】LeetCode:61-65

文章目录 61 课程表62 实现Trie(前缀树)63 全排列64 子集65 电话号码的字母组合 61 课程表 Map BFS拓扑排序:将有向无环图转为线性顺序。遍历prerequisites:1. 数组记录每个节点的入度,2. 哈希表记录依赖关系。n 6&a…

Vulnhub靶场案例渗透[7]- DC7

文章目录 1. 靶场搭建2. 信息收集2.1 确定靶机ip2.2 服务信息收集2.3 社工信息收集 3. 提权 1. 靶场搭建 靶场源地址 检验下载文件的检验码&#xff0c;对比没问题使用vmware打开 # windwos 命令 Get-FileHash <filePath> -Algorithm MD5 # linux md5sum filepath2. 信…

视频汇聚平台EasyCVR支持云端录像丨监控存储丨录像回看丨录像计划丨录像配置

EasyCVR视频汇聚融合平台&#xff0c;是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。平台以其强大的视频处理、汇聚与融合能力&#xff0c;在构建视频监控系统中展现出了独特的优势。 EasyCVR视频汇聚平台可接入传统监控行业中高清网络摄像机的RTSP…

提升实验室效率的秘籍

有组织、高效的实验室而言&#xff0c;业务“人、机、料、法、环、测”的多维度发展至关重要&#xff0c;为了提高实验室管理效率和质量&#xff0c;许多实验室开始采用LIMS&#xff08;实验室信息管理系统&#xff09;软件来辅助管理。LIMS软件能够帮助实验室实现信息化、自动…

leetcode 3217 从链表中移除在数组中的结点

1.题目要求: 给你一个整数数组 nums 和一个链表的头节点 head。从链表中移除所有存在于 nums 中的节点后&#xff0c;返回修改后的链表的头节点。 示例 1&#xff1a; 输入&#xff1a; nums [1,2,3], head [1,2,3,4,5] 输出&#xff1a; [4,5] 解释&#xff1a; 移除数值…

Java中的枚举

1.1 认识枚举 枚举是一种特殊的类&#xff0c;它的格式是&#xff1a; public enum 枚举类名{枚举项1,枚举项2,枚举项3; } 其实枚举项就表示枚举类的对象&#xff0c;只是这些对象在定义枚举类时就预先写好了&#xff0c;以后就只能用这几个固定的对象。 定义一个枚举类&am…

使用VS2015编写C语言程序

前面我们给出了一段完整的C语言代码&#xff0c;就是在显示器上输出“C语言中文网”&#xff0c;如下所示&#xff1a; #include <stdio.h>int main(){puts("C语言中文网");return 0;}本节我们就来看看如何通过 VS2015 来运行这段代码。 1) 创建项目&#xf…

QD1-P8 HTML 格式化标签(font、pre、b、strong、i、u、del、s、sub、sup)

本节学习&#xff1a;HTML 格式化标签。 本节视频 www.bilibili.com/video/BV1n64y1U7oj?p8 ‍ 一、font 标签 用途&#xff1a;定义文本的字体大小、颜色和 face&#xff08;字体类型&#xff09;。 示例 <!DOCTYPE html> <html><head><meta cha…

Tkinter:为什么多个Frame相互覆盖?

在 Tkinter 中&#xff0c;Frame 是一个容器部件&#xff0c;用于组织和管理布局。如果多个 Frame 出现在同一个父容器中并且看起来相互覆盖&#xff0c;通常与布局管理器的使用方式或控件的创建顺序有关。 以下是几个常见的原因和解决方案&#xff0c;帮助你了解为什么多个 F…

生产报工信息化全流程大讲解

在企业的生产管理中&#xff0c;生产报工是一个关键环节&#xff0c;但传统的生产报工方式存在诸多痛点&#xff0c;制约了企业的发展。随着数字化技术的发展&#xff0c;多个平台为企业提供了有效的解决方案。基于生产报工信息化方案报告》白皮书&#xff0c;本文深入探讨生产…

三菱FX3U PLC绝对定位- DRVA指令

指令格式 相关软元件一览 功能和动作 这是采用绝对驱动的单速定位指令。采用从原点(0点)开始的距离指定方式&#xff0c; 也被称为绝对驱动方式。 1、在指令执行过程中&#xff0c;即使改变操作数的内容&#xff0c;也不反映到当前的运行中。 在下次的指令驱动时才有效…

客户服务的未来趋势:智能化与人性化的融合

在当今这个日新月异的数字时代&#xff0c;企业的竞争已不再局限于产品或服务的本身&#xff0c;而是延伸到了客户体验的每一个细微之处。数字化转型作为推动这一变革的重要力量&#xff0c;正深刻改变着客户服务的面貌&#xff0c;使之变得更加智能、便捷且充满人性化。随着人…

最长回文子串-双下标动态规划

题目来源&#xff1a;Leetcode 5.最长回文子串 DP定义&#xff1a; 容易想到&#xff0c;用一个二维数字dp[i][j]来表示s[i:j]是否是回文串&#xff0c;如s“daba”。dp[1][3]1表示"aba"为回文串&#xff1b; 递归条件 想要判断字符串"aba"是否为回文…