敏捷BI的理解与选择,你想好了吗?

news2024/11/25 12:48:08

很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”——马云

 

这是一个几乎所有企业都在谈数据的时代。虽然以大数据(Big Data)的定义(指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。)来看,并不是所有的企业或组织都拥有“大数据”,但无疑,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。马云的话,重点在于“应对变化”而非“大数据”。在这个变化越来越快的时代,组织是否已经具备处理和分析数据的能力,是每个组织成员都需要思考的问题。

 

BI,数据治理,数据中台,敏捷BI

 

  • Mckinsey列出了各个行业利用大数据价值的难易度以及发展潜力。《Big data: The next frontier for innovation, competition, and productivity》

数据无论大小,只要足够优质,其中便蕴含着各行各业挖掘更大商业价值和创新的可能。数据本身不产生价值,如何分析和利用数据,并对业务产生帮助才是关键,而能有效挖掘出这些可能和价值的答案,便蕴藏在商业智能(Business Intelligence,简称BI)之中。

 

BI是什么?

 

著名国际咨询分析公司Gartner,将BI定义为一个概括性术语(Umbrella term),泛指业务分析中用到的工具、基础设施设备、程序与软件,通过获取和处理数据,进而分析数据,获取有价值的信息以改进并优化决策和绩效,指导各种商业行为。

BI的本质是技术和工具和商业逻辑的结合,通过处理原始数据,以商务逻辑分析数据,为商业运营提供基于历史、当下和未来的分析视角,形成对商业行为有价值的洞察(insight)。(与之对应,近年来国外很多名校的新兴专业学科BA(Business analytics),则是一门需要同时学习商科知识和计算机技术的学科。)

BI对商业决策的支持涵盖了从运营到战略的每个层面。基础运营决策包括产品定位或定价, 战略业务决策包括最广泛层面的优先事项,目标和方向。BI的有效性在于多数据源的充分整合。例如可口可乐等快消品公司会将公司财务、运营数据(内部数据)与波士顿等公司提供的市场数据(外部数据)结合分析,这种结合就可以更好地呈现公司的经营全貌。

从这个意义上来讲,基于单表或单一数据源的分析都不能称作真正的BI。更常见的情形是组织内没有BI产品线,仅靠手工操作汇总数据源,复制粘贴到一个Excel表中再进行分析,虽然满足了多来源,但汇总和分析过程缺乏自动化,效率和准确度水分很大,也不是真正的BI。

 

BI的目标与部署中的常见问题

 

数据研究专家Kernochan在他为期两年的组织BI流程研究中,提出了以下模型及对应的BI特征目标:

 

数据输入 - 准确性

数据整合 - 一致性

数据聚合 - 范围明确

信息定位 - 匹配度

信息传递 - 及时性

信息分析 - 可分析性

 

这不仅可以作为BI部署的目标,也可以用于检验以上目标的达成,反推企业的数据治理是否足够规范。

同时,Kernochan的研究也总结了当前BI部署流程中的常见问题:

 

20%的数据有错误(准确性)

50%的数据不一致(一致性)

通常需要7天才能将数据提供给最终用户(及时性)

无法对70%的公司数据(范围)进行跨数据库查询

65%的时间,高管没有收到他们需要的数据(合适)

60%的时间,用户无法立即对他们收到的数据进行在线分析(可分析性)

Web上出现的75%的新关键信息源不会在一年内传递给用户(敏捷性)

 

产生以上问题的最大原因,在于业务用户通常不了解数据准备的复杂性和错误所涉及的风险,且缺乏统一部门强有力的数据治理(Data governance),进而使得数据的质量变得不可控。数据基层一旦出现问题,高级的分析和敏捷性需求也无从说起。

 

什么是敏捷BI?

 

在很长一段时间里,Excel和其他电子表格都是各类组织处理分析数据的主要工具,拥有数量最大的用户群(中国90%以上的组织数据仍很大程度依赖于Excel)。虽然电子表格有很多优势,但把它当做BI工具使用,在以下场景会严重受限:

1.需要对包含多个工作表或数据库的混合数据源开展分析时

2.多人同时对一张电子表格进行维护和协作时

3.数据量达到上限或包含非结构化数据让可视化变得困难

4.使用复杂的公式降低了查询性能时

5.需要交互式分析和数据探索时

6.需要定时刷新时

 

传统的BI已经在很大程度上解除了上述限制,但在国内政企组织内的普及度仍然十分有限。随着组织数据量的增大和外界环境的不断变化,组织对于数据的管控和分析有了更高的要求,希望能够摆脱过去较高的技术门槛,较长的部署时间,缓慢的数据整理和分析速度,力求“又快又好”。在这样的背景下,“敏捷BI”应运而生。

敏捷BI的出现,是以一系列自助式数据分析软件的出现为标志的(所以敏捷BI也被称之为自助式BI)。随着Microstrategy,Power BI,Qlik sence,Tableau,帆软等国内外软件的不断迭代更新,数据分析的主角不再仅指具备IT技术背景的研发人员和数据科学家,每一个没有技术基础的业务人员也可以更高效便捷的方式获取、整理和分析数据。

敏捷一词(Agile)源于17位轻量级方法学家在2001年2月提出的敏捷宣言(Agile Manifesto)。Agile的提出,一开始就是带着IT项目开发基因的,而在“敏捷BI”这一概念里,主要取的是“快捷高效,简单明晰”的意思。

结合到数据应用场景,我们可以先从Excel的Vlookup函数出发,看看何为“敏捷”?相信这是很多报表从业人员,接触的第一个稍显复杂(相比于sum、count等函数)但又觉得爱不释手的函数,在日常的工作中使用频率极高。很多人也是通过它,第一次明白了电子表格的强大威力。

为什么用它来解释“敏捷”?因为在电子表格时代,它可以帮助使用者快速高效地进行表格信息的交付、部署、变更、查询。它的交付结果可靠,运算性能稳定;部署方便:内置四个系数均具备明确含义和标准用法;且四个系数均可灵活修改,变更方便;在数据质量可靠的情况下,可以查询表格内(间)几乎所有的信息。在电子表格这个领域,Vlookup无疑可以称得上是“敏捷”的函数之一。

BI,数据治理,数据中台,敏捷BI

类似的教程图相信大家并不陌生

 

同样的道理,在敏捷BI时代,这样的特征仍不过时:能快速高效地帮助使用者进行数据的结果交付、技术部署、需求变更、精准查询,这便是敏捷BI。

 

对于敏捷BI的常见误区

 

每个概念的兴起必然带来多种的解读,同时也产生有不少误解,敏捷BI亦不例外。对于它的常见误区,有如下四点。

 

1.敏捷BI是一种能力,而不单指工具。

BI作为一个有着计算机基因的概念,在宣传的时候自然没人会爱看那些枯燥的代码,酷炫简单的效果往往更受青睐,这使得人们在理解BI时,很自然地就联想起各种形式多样色彩丰富的动态图表。但其实,图表只是BI的前端展示界面,是部署BI这项技术性极强且极具体系工作的冰山一角;敏捷BI软件也不仅是一个高级的图表制作工具,它也兼备着获取和清洗数据等高级功能。

当前主流的敏捷BI报表软件,宣称“敏捷”的最大优势,是其内置的各类图表、灵活高效的函数、简单便捷的元素拖拽方式。区别于传统BI开发偏代码的环境,敏捷BI的前端报表开发,已经变得极具可视化,其使用的难度和逻辑与Excel相仿,哪怕对于没有技术基础的业务人员,也不影响其使用或做简单的修改和开发。从某种意义上,各类敏捷BI工具是对Excel等传统表格工具和代码环境优势的中和,而这个粘合剂,就是可视化交互元素,在保留后台代码搭建环境的基础上,敏捷BI工具将很多繁琐操作进行整合形成新的功能,使得数据在软件内的交互感有了质的提升。这些功能都极大地拓展了BI的易用性、处理速度和探索深度。

 

 

BI,数据治理,数据中台,敏捷BI

一个典型的BI体系部署流程(技术维度)

 

近年来各大BI厂商都在强调“增强分析”的发展趋势,以Microstrategy为代表的顶级软件已经在支持python和R的功能打包(Microstrategy内建199种R模型,开箱即用),并引入机器学习概念和更强大的交互功能(语音识别等),增强分析使得人人都有可能成为“数据科学专家”,极大地提高工作效率,其智能化的步伐将随着技术和产品的进步越来越快。未来BI的趋势之一,便是工具和语言的融合。

在这样的发展背景下,敏捷BI,其实指的是贯穿在数据分析平台构建和运行过程中的快速实现能力。

 

BI,数据治理,数据中台,敏捷BI

BI部署的冰山效应

 

2.敏捷BI并不是电子表格和传统BI的替代品

虽然电子表格和敏捷BI工具都使用表格,但它们实际上是在不同的场合中发挥不同的作用。 电子表格首先是一种存储和显示计算的方法。BI表格中的数据使用各种算法进行压缩,不像Excel那样直接使用行和列的编号来定位。虽然电子表格可以创建复杂的数学公式,比如Excel的分析工具库,但它们的核心是数学公式而不是模型。

敏捷BI不会使传统的数据库管理或数据科学家失效。 这些由专业人士提供的复杂洞察,对大多数组织仍然具有很高的价值。而很多敏捷BI在数据治理方面也一直处于劣势,Tableau在2018年初推出的prep产品就是在弥补这一劣势,但推广和技术评价并不出众,很多功能仍是其本身可视化的拓展以及对传统ETL工具的逻辑借鉴。

敏捷BI虽然功能强大,看起来在很多场景下可以代替电子表格,却也很难真正取而代之,电子表格软件仍有其强大的生命力,并不过时。小规模数据的分析处理,Excel仍是十分轻便高效的。此外,价格、安装成本、易用度及培训门槛都是需要考虑的因素。

就好像XMind Pro和XMind:ZEN。Pro 的定位无疑是一款全栈思维导图软件,其完美地符合所有思维导图用户的大部分需求,而ZEN则舍弃掉了一部分专业性功能,主打简约美观、轻量化后的性能、100%兼容移动端。可以说,ZEN便是一款敏捷型思维导图工具。这是为了迎合更多用户需求做出的两条产品线,而诸多的敏捷型bi工具区别于传统BI、电子表格的思路也与此类似。

BI,数据治理,数据中台,敏捷BI

xmind:zen和xmind 8 pro的对比

敏捷BI、传统BI、电子表格三者并不是简单的对立关系或是高级与低级的区别。组织需要思考的,是多元选择下的组合应用,扬长避短,而不是理解为做简单的取和舍或是迭代升级。

 

3.敏捷bi工具无法直接告诉决策者答案

在这个“颜值至上”的年代,BI软件的界面也做得越发具有设计感,无论是色彩还是UI的质感,都给人一种“高大上”的感觉。仿佛只要看到了变化的数字和仪表盘,就已经获得了海量的信息。但敏捷bi其实是很难直接给出答案的,而是促进决策者通过合理的信息展现形式,进行更为系统深入的思考。而且敏捷bi在深入数学建模方面,为了兼顾性能,在功能上无法做到像R或Python语言那样具备高灵活度。如果要深入地做数据分析,不能完全依赖敏捷BI工具的分析功能。

BI的定位应该始终是一个优质信息的整合处理和参考工具,在短期内无法取代人类的思考。统计图表虽然强大,但它也是现代社会里最会说谎的事物之一,很多信息仍需要甄别和深入的思考。当我们看到各种结果呈现时,还是得多问几个为什么。

BI,数据治理,数据中台,敏捷BI

美国统计专家达莱尔·哈夫写就的传世之作,至今读来仍给人以深刻警醒

4.敏捷bi的部署需要强有力的项目管理和数据治理

正如之前提到的,敏捷二字带有鲜明的IT开发项目色彩。其部署往往以一个项目为单位开展,需要在短期内投入企业较多资源。当前敏捷bi部署的主流方向是采取外包的形式,专业性强的数据服务公司往往能更契合业务型公司的需求,项目周期和成本的可控,也为甲方公司能节约更多资源。但这绝不意味着,敏捷bi部署就是请技术人员将功能需求实现这么简单,它需要业务与技术、甲方与乙方的多重协调。这常常为需求方所忽略,进而产生较大的隐性沟通成本。

当前的敏捷bi更多强调的是在前端体验上的“自主敏捷”和“流畅敏捷”,其实都严重依赖事先的数据准备工作,一旦分析需求超出事先的准备,都很难再敏捷起来了。而数据准备一般都比较复杂,经常要做脱敏处理或多表关联,只能由技术人员来完成,是最费时费力的环节。

同时,数据质量的高低是决定BI部署成功与否的基础所在,数据清洗在数据分析过程中仍然会占据大比例的资源。这是每个企业都无法回避的现实,数据分析中经常听到的那句“Garbage in,garbage out”,在敏捷BI的部署中,依然适用。

值得注意的是,而当前的很多敏捷BI在数据准备和综合化的数据治理方面,特别是企业级大数据领域,相较于传统BI厂商(IBM、Oracal、SAP)并不占优,例如tableau直到2018年初才正式推出其主打数据整理功能的工具Tableau prep,Power BI也在很大程度上依赖于脱胎于Excel的数据整理功能,而这种数据整理功能也侧重于“数据清洗”,远远达不到数据治理的要求。而传统BI厂商在数据探索和可视化领域做的也略显颓势,综合数据治理和数据探索能力而言,Microstrategy一直是企业组织型BI的领跑者。

 

 

综上,可以想见,任何一家企业或组织想要实现BI敏捷性的成功,至少需要三点

1、自身强有力的数据管理意识和规范

2、技术团队(内部/外包)强有力的数据技术支持

3、高效敏捷的新型BI工具(技术与业务人员间的桥梁)

在敏捷BI工具极大地降低了数据分析门槛和资源消耗的今天,不管你是一个组织的普通业务或技术员工、咨询顾问、专家还是的中高层领导。如果你的团队拥有合适的工具和一个管理大量数据的简便方法,如果你能像数据专家一样,时刻保持对术语、专业技术和解决方案的敏感度并与时俱进,这将为你和你所在的组织带来巨大的价值,这将让你所在的组织,真正地实现“数据驱动”。

 

---- ---

#为了不破坏前面文章的完整性,我没有过多的加入关于Microstrategy的内容。我在后面进行了一些补充,尤总看是否能安排市场部的小伙伴做一下连接和内容上的补充。#

Microstrategy作为国际顶级BI厂商,拥有多年的BI开发经验和深厚的技术积淀。在2018年Gartner对国际多家BI厂商产品的魔力象限测评中,MicroStrategy拥有该魔力象限中所有供应商的最高产品分数,包括整体和所有评估用例,远超其他厂商产品。在BI管理,架构和安全,数据源连接; 可扩展性和模型复杂性; 元数据管理和易用性,视觉吸引力和平台工作流程集成,移动商务智能等诸多技术领域,它均获得了评价最高的“优秀”级别分数。被Gartner称之为“适用于所有用例的强大集成产品"。

BI,数据治理,数据中台,敏捷BI

Microstrategy多年来专注于企业级BI部署,其在各种企业功能,嵌入式分析,以及应对大型复杂数据库的能力都处于世界领先地位。相较于Tableau、Qlik、Power BI以普通用户为针对向的定位,Microstrategy在组织、企业级别的BI部署能力更为强大

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1162798.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决问题 [Vue warn]: Missing required prop: “index“

vue项目控制台报错 [Vue warn]: Missing required prop: “index” 出现这个报错原因是<el-submenu></el-submenu>标签中缺少index属性&#xff0c;需要加上才能不报错 解决办法是&#xff1a; <el-submenu index""></el-submenu>

语音芯片ic常见故障分析 如何排查问题 声音不清晰 有爆破声

一、问题简介 语音芯片常见故障分析 如何排查问题 例如&#xff1a;声音不清晰 有爆破声 这些问题可能存在于如下方面&#xff1a; 供电电源是否稳定PCB板上面电容是否放置位置合适扬声器是否正常生成的音源文件&#xff0c;是不是本身就存在瑕疵 其实语音芯片的这些问题&a…

taro3中使用react函数组件和mobx状管理工具结合使用教程

在使用了最新版的函数组件hooks后&#xff0c;刚开始导入mobx&#xff0c;总是报cant resolve "src/store/index"这种错误&#xff0c;然后我就开始一步一步找原因&#xff0c;后来在组件中log了一下store&#xff0c;重新启动程序后&#xff0c;就没问题了&#xff…

怎么扫码下载视频?一招生成可下载的视频二维码

怎么做可以下载视频的二维码呢&#xff1f;当我们用二维码来分享时&#xff0c;很多视频二维码生成器制作的二维码都只有展示功能&#xff0c;无法让扫码者选择下载视频&#xff0c;那么这个问题有什么解决方法呢&#xff1f;对于有这方面需求的小伙伴&#xff0c;小编可以给大…

使用Process Explorer/Process Hacker和Windbg高效排查软件高CPU占用问题

目录 1、为什么需要将Process Explorer/Process Hacker与Windbg结合起来分析高CPU占用问题&#xff1f; 1.1、使用Windbg分析时为什么还要使用Process Explorer/Process Hacker呢&#xff1f; 1.2、使用Process Explorer/Process Hacker分析时为什么还要使用Windbg呢&#x…

【Java】AI+智慧工地云平台源码(SaaS模式)

伴随着科学技术的不断发展&#xff0c;信息化手段、移动技术、智能穿戴及工具在工程施工阶段的应用不断提升&#xff0c;智慧工地概念应运而生&#xff0c;庞大的建设规模催生着智慧工地的探索和研发。 一、带你认识智慧工地 伴随着技术的不断发展&#xff0c;信息化手段、移动…

Java,面向对象,抽象类和抽象方法(abstract的使用)

关于抽象类和抽象方法的使用&#xff0c;以Person和student和Teacher为例&#xff0c;若Student类和Teacher继承于Person类&#xff0c;老师和学生都有Person的特征。在一个班级里&#xff0c;只需要创建老师和学生的实例&#xff0c;并不需要创建Person的实例。关于Person的方…

【LeetCode】剑指 Offer Ⅱ 第8章:树(12道题) -- Java Version

题库链接&#xff1a;https://leetcode.cn/problem-list/e8X3pBZi/ 类型题目解决方案二叉树的深搜剑指 Offer II 047. 二叉树剪枝递归&#xff08;深搜&#xff09;&#xff1a;二叉树的后序遍历 &#xff08;⭐&#xff09;剑指 Offer II 048. 序列化和反序列化二叉树递归&…

无法启动程序由于找不到msvcp140.dll无法继续执行代码怎么解决

今天&#xff0c;我就来分享一下关于“找不到msvcp140.dll无法继续执行代码”的问题&#xff0c;以及我个人总结的5种解决方案。希望我的经验和建议能对大家有所帮助。 首先&#xff0c;我们要明确什么是msvcp140.dll。msvcp140.dll是微软Visual C 2015运行库中的一个组件&…

山西电力市场日前价格预测【2023-11-03】

日前价格预测 预测说明&#xff1a; 如上图所示&#xff0c;预测明日&#xff08;2023-11-03&#xff09;山西电力市场全天平均日前电价为277.41元/MWh。其中&#xff0c;最高日前电价为355.83元/MWh&#xff0c;预计出现在18:15。最低日前电价为0.00元/MWh&#xff0c;预计出…

解锁无限可能:ON1 Photo RAW的新功能与优势forMac/win

作为摄影师&#xff0c;您是否曾为繁琐的照片编辑过程而感到困扰&#xff1f;是否希望有一种工具&#xff0c;能将您的照片编辑过程变得更加高效、灵活&#xff0c;同时不损失画质&#xff1f;如果是&#xff0c;那么您一定不能错过ON1 Photo RAW。 ON1 Photo RAW是一款全新的…

云资源信息安全就用行云管家!

越来越多的企业实现了上云&#xff0c;但如何保障云资源信息安全却是一个难题&#xff0c;很多小伙伴不知道怎么处理。这里我们小编告诉您&#xff0c;云资源信息安全就用行云管家&#xff01; 云资源信息安全就用行云管家&#xff01; 行云管家极其丰富的IT资源统一纳管能力&…

【IDEA使用maven package时,出现依赖不存在以及无法从仓库获取本地依赖的问题】

Install Parent project C:\Users\lxh\.jdks\corretto-1.8.0_362\bin\java.exe -Dmaven.multiModuleProjectDirectoryD:\学习\projectFile\study\study_example_service "-Dmaven.homeD:\Program Files\JetBrains\IntelliJ IDEA2021\plugins\maven\lib\maven3" "…

大厂面试题-TCP协议为什么要设计三次握手?

从下面三个方面来回答&#xff1a; 1.TCP协议&#xff0c;是一种可靠的&#xff0c;基于字节流的&#xff0c;面向连接的传输层协议。 a.可靠性体现在TCP协议通信双方的数据传输是稳定的&#xff0c;即便是在网络不好的情况下&#xff0c;TCP都能够保证数据传输到目标端&#…

国标GB28181的对接和核心参数

随着社会的发展&#xff0c;视频监控平台的使用越来越广泛了&#xff0c;但是在搭建这个平台的时候是需要符合一定的标准的。如果能符合国标GB28181的标准就可以&#xff0c;下面就给大家介绍一下国标GB28181的对接和核心参数。 一、国标GB28181的对接 1、国标GB28181设备端接…

openeuler 使用指令查找U盘:输入fdisk -l,内核崩溃 ,系统重启,使用lsblk显示正常,数据传输正常

报错日志&#xff1a; [rootedgenode1 ~]# fdisk -l Disk /dev/ram0: 4 MiB, 4194304 bytes, 8192 sectors Units: sectors of 1 * 512 512 bytes Sector size (logical/physical): 512 bytes / 4096 bytes I/O size (minimum/optimal): 4096 bytes / 4096 bytes Disk /d…

右击显示Pycharm打开教程

效果图 操作流程 win r 输入 regedit 回车打开注册表编辑器 2.找到 shell 路径 计算机\HKEY_CLASSES_ROOT\Directory\shell3.在 shell 下新建项&#xff0c;名称为 Pycharm 单击Pycharm文件夹&#xff0c;双击默认项&#xff0c;修改默认值&#xff0c;这个数值就是你右击后…

【蓝桥杯基础题】门牌制作

👑专栏内容:蓝桥杯刷题⛪个人主页:子夜的星的主页💕座右铭:前路未远,步履不停目录 一、题目描述二、题目分析三、代码汇总1、C++代码2、Java 代码四、总结1、枚举思想2、取余判断每位数字一、题目描述 题目链接:门牌制作 小蓝要为一条街的住户制作门牌号。这条街一共…

linux 系统 安装vnc

准备工作 防火墙设置 放行防火墙 firewall-cmd --add-port5901/tcp --permanent #放行5901端口 firewall-cmd --reload #重新加载生效 如果在测试环境&#xff0c;可直接关闭防火墙 systemctl stop firewalld && systemctl disable firewalld关闭selinux s…

15种稳定扩散模型的技术示例

推荐Stable Diffusion自动纹理工具&#xff1a; DreamTexture.js自动纹理化开发包 什么是稳定扩散模型&#xff1f; 潜在扩散模型 &#xff08;LDM&#xff09; 是一种图像生成技术&#xff0c;其工作原理是在潜在表示空间中迭代“去噪”数据&#xff0c;然后将表示解码为完整…