数据中台的商机

news2024/11/19 7:36:41

阿里拆中台了,很多人来问数据中台还要不要的问题,我认为中台总是要有的,无非是薄厚的问题。然后又有人来问数据中台价值创造的问题,这个其实是数据中台最核心的问题,我就来正式聊一聊,里面有很多的批判,大家自己体会。

1、认清数据中台的业务本质

前段时间《谈数据》写了一篇文章《请不要将数据中台做成BI》,大家以为作者在否定BI是数据中台的一部分,认为数据中台一定不是BI这种形式,我不是这么看的。

BI是一种支撑决策支持这种业务的数据技术,你可以把与BI相关的公共数据、指标及工具看成是一种数据中台,这没有问题。我们以前的数据仓库的90%融合模型都是为出指标做的,这些融合模型当然属于数据中台,基于融合模型做出来的公共指标也是数据中台,因为指标还可以编排成报表。

当年阿里喊出数据中台这个概念的时候,随后很多企业都马上跟进说我也有了自己的数据中台,怎么可能呢?

其实他们所谓的数据中台本质上,至少50%以上属于BI的一部分,数据中台去做决策支持不丢人,没有报表指标,业务人员就瞎了眼睛,这就是当初数据中台对业务最大的贡献。

但数据中台不能仅仅支撑老板决策,老板希望数据中台要能直接介入生产,创造更多业务价值,这是数据中台在新时期的使命,也是其存在的意义。

可惜大多数企业还是把数据中台做成了平台和工具,其出发点更多考虑说是一个支撑性的技术系统,即一定先去考虑我有什么数据和工具,然后才能干什么,这是典型的平台思维,而数据中台的第一出发点一定是业务,一开始不用看你系统里面有什么,而是想清楚你的业务问题是什么,为解决这个业务问题需要什么样的数据服务。

数据中台找不到驱动业务的新模式,往往就去卷决策支持这个唯一的业务。你会看到,企业的数据中台会越做越大(以前叫数据仓库,然后叫大数据平台,再然后叫数据中台),各种自动化工具令人目不暇接,报表指标的编排能力越来越强,可视化也是越做越炫,遗憾的是,老板的业务获得感并没有显著提升。

究其原因,还是由于决策支持领域并没有发生什么变革性的突破。

从应用上看,大家看数的模式没有变化,数据分析领域自身的数字化远未成熟,我们希望的BI至少要像ChatGPT那么智能,但实际上差强人意,增强分析更是聊胜于无。

从能力上看,企业的数据治理难以跨出第一步,少有企业能够像华为那样下决心去解决那些基础数据的根子问题,从组织、机制再到流程,大家只是在局部领域,技术层面做些优化。

2、避免共享复用的机械主义

很多人在强调数据中台的共享沉淀这个特性,甚至认为只有API的供数形式才是真正的数据中台,那是非常狭隘的看法。

共享复用更多应是业务上的概念,不要去过多强调它的技术属性。你提供了一个客户标签,发现这标签不仅可以用在这个场景,也能用在那个场景,这个标签就是数据中台的一部分,至于标签是API提供的还是数据接口提供的,甚至分两个平台提供的,无关紧要。

我们更多要从业务上去判断某个数据能力(比如模型和标签)是否有规模化产生价值的潜力,如果你认为它未来会有,那它就是数据中台一部分,即使复用还没有发生。

比如对于一个标识客户价值高低的标签,我们不会由于这个标签当前没有规模复用,就不认它是数据中台的一部分。又比如我们以前开展验真业务的时候,需要提供一个API接口,这个API接口就是数据中台,虽然我们才仅仅拓展了一个客户,但它就是被业务判断为有规模复用价值的东西。很多创新业务需要的模型都是新的,但不阻碍这些模型成为数据中台的一部分。

有时候为了强调数据中台共享复用的特性,我们会强迫自己给出诸如复用度的评估指标,从而证明数据中台的价值,这会掉入技术KPI的陷阱。

3、不要搞数据中台拿来主义

数据中台不要搞什么成功学,知其所以然更重要,你一定要先去理解别人的业务,才能知道它这个数据中台的存在意义和价值,然后获得对你有用的启示。

我是非常不喜欢数据中台商业化这个概念的,因为是业务的基因决定了某个行业和企业的数据中台长啥样,而不是反过来。

比如金融行业具有强监管的要求,报表指标满足监管要求就是金融行业数据中台最关注的业务,数据中台的核心价值就是要把数据按照规范要求做准,不要被审计出问题,否则就会给企业带来巨大的风险。但互联网行业则完全不同,虽然他们的数据中台也要支持报表指标,但更关注的是营销和销售,因此数据中台中的各种用户模型、标签满天飞。

现在商业化的数据中台偷换了一个概念,即数据中台本来是业务化的,但商业化的数据中台把数据中台曲解成了一个工具,比如DataOps。

我并不认为这种通用性的工具跟中间件有什么本质区别,它们也构筑不了企业数据中台的核心竞争力。只要业务的切入和方向问题没解决,谈任何平台工具都没有意义。很多人指责买到的商业数据中台没有看到实际的价值,质疑数据中台存在的价值,这要怪自己的认知不足。

数据中台是阿里提出来的,但其并没有从业务的角度说明其数据中台牛逼的原因,方法论大多是讲技术的,但技术牛逼跟业务价值创造不一定有什么关系。

我们其实更应关心的是阿里的业务如何激发了数据中台需求,这些数据需求如何沉淀成了数据中台的能力,流程上如何确保落实数据中台的三问(中国移动中台三问:和中台是什么关系、能否复用中台能力及能否沉淀中台能力),如何在集约化和灵活性之间做好平衡,组织上如何确保这些能力能高效的运营等等。

可惜的是,阿里很少讲它数据中台的发展历程,好像大家一下子就看见了结果,这样说服力就不太够。

从这个角度看,华为做数据治理的历程倒值得借鉴,其从解决财务报表的数据不一致问题开始,带来了企业数据管理的一系列变革,包括顶层设计、组织机制、运营流程,最后再到IT,这些管理动作是我们真正需要学习的东西,也是华为数据之道的精髓。

阿里有本讲淘宝技术10年的书,虽然写得是技术10年,但其实也在讲淘宝的业务。从历程中可以看到,淘宝的每一次技术进步都是业务驱动的结果,每个读了这本书的人,除了了解到相关技术,也能知道淘宝所以采用这个技术的业务原因,这样的借鉴意义就很大。大家需要COPY的不是淘宝最新的技术,而是COPY某种业务条件下采用某种技术的思想和方法,知其所以然很重要。

因此,没淘宝那个体量,我们其实没必要直接去抄它最新的架构,没那么多的业务驱动,就不要搞数据中台那么多的模型和工具链,因为根本用不起来。

4、业务驱动需要自己去寻找

理论上讲,所有的企业都有数据中台的原始业务驱动,那就是报表指标。现在搞数据中台的所以觉得数据中台的价值不够,仅仅在于企业已经不满足于此,特别是阿里的数据中台概念一抛出来,更加刺激了大家的神经。

但阿里当年提的中台,其实更多强调的是共享复用,因为当时阿里一家独大,内部有很多不平衡的问题,阿里希望用中台来抹平差距,提升全局的效率,降本增效成为了中台最大的业务驱动力,编排能力进一步完美化了中台,即它无所不能。

可惜的是,大部分企业对于数据中台的期望并不是什么降本增效,而是希望从数据中找到新的商机。它们没有阿里那么大的规模,没有那么多的业务,没有那么多的不平衡,没有那么多需要集约化的东西,降本增效带来的那点增益价值是不够看的,新增的诉求远大于存量的保有。

但基于数据中台去搞业务创新挑战很大,因为企业存在各种限制因素,不是你想数据驱动就能数据驱动的。

比如由于数据文化的普及不够,很多企业的业务人员并没有什么数据驱动业务的意识。比如由于业务创新力不足,业务部门其实没有那么多的业务可以用数据来驱动。又比如由于信息化水平低下,企业数据采集加工的能力很弱,根本没有那么多高质量的数据来满足业务的要求。

更关键的是,数据中台藏在业务中台之下,离业务也太远了,它很难获得第一手的业务资料,也很难真正的理解业务,但搞数据的往往不信这个邪,包括我自己。

我干了20年数据,自认为对公司的业务也有所理解,但当我去负责公司的ERP时,才知道公司的业务流程复杂度远超过想像,业务天花板也太高了,具体可以参考文章《数据从业者的技术要求很低,但业务天花板太高》。

有些业务的东西看似适合数据中台来做的,比如推荐,但对于业务和场景知之甚少的数据中台很难说能比业务中台能做得更好。事实上,当前大多业务场景的数据赋能只要理解业务规则就足够了,用不到数据中台那些高大上的东西,比如算法,当然,ChatGPT来了之后,可能情况会发生变化。

我并没有找到什么系统性的方法来解决数据中台的业务困境,也许到了这个时代,数据中台就应该和业务中台合并,毕竟现在OLTAP和OLTP的界限已经很模糊,业务跟数据已经是我中有你,你中有我的关系。

数据中台追求的那种独立的、显性的价值创造,从我的经历来看,至少需要满足两个条件,业务的馅饼不会自动从天山掉下来。

第一、风口。小米创始人雷军就说过:”风口上猪都能飞起来“,意思是创业成功的本质是找到风口,顺势而为,同样的道理,所有希望基于数据中台创造业务价值的团队,也需要寻找这样一些风口,10年前大数据是风口,近几年数字化、数据治理、大模型是风口。

第二、勇气。无论是你主动去争取,还是满足老板的要求,在关键时刻,一定要下场,过了这村就没这店了。

这里列出两种数据中台直接赋能业务的模式,供大家参考。

第一种,如果企业的数据资源很丰富,那就把数据本身当成业务去卖,这是很好的商业模式,在这种情况下,没有什么能跟数据中台竞争,因为这种商业模式的生产资料决定一切。

现在大数据变现已经是比较成熟的商业模式了,阿里我印象最深的就是那个生意参谋。随着数据二十条的发布和国家数据局的成立,参与到这个生态(确权、交易、分配到安全)中还是很有前途的。

记得10年前大数据刚起来的时候,很多人都看到了大数据变现的商机,但对数据的不同的认知造成了现在不同的结果,很多时候,时机到了,没有勇气,机会也就错过了。

第二种,去做那些正确而难的事,数据治理就是其中的一种。很多领域的业务进一步突破需要数据,但这些数据往往掌握在另一个领域手里,数据中台如果能驱动企业做好数据治理,那就能极大的赋能业务。比如征信业务通过数据治理拓展了数据源,就能大幅的提升贷款效率,效果远好于算法和业务上的调优。

10年前大数据刚起来的时候,我们做的第一个产品是客流大屏,演示的时候老板觉得挺新颖的,这成了我们大数据变现的起点;几年前老板征询数据治理的想法,我们团队研究了2个月最后汇报通过,这成了企业数据治理的起点......

读到这里,你就能理解为啥华为解决财务报表问题就能获得了很大的认可,因为这是风口, 是正确而难的事情,需要集全公司之力才能搞定。

5、驱动业务的数据能力基础

业务方向问题解决了,接下来就是要具备落地的能力,那么哪些能力是最重要的呢?

我觉得排在最前面的三项能力,打个比喻就是:运筹的将军,屠龙的少年,称手的兵器,虽然其他能力也很重要,但其实可以通过这三项能力运营出来,这三项能力是其他能力的基础。

第一、运筹的将军

公司需要设置CDO,或者说需要有个企业数据责任人,能够在战略层面给予数据团队业务方向的指引和实际资源的支持,包括组织、机制、流程和IT等等,数据的很多功夫都在细节中,CDO会因为相信数据的价值所以看见,而很多管理者做不到。

我们的数据团队每一次实现业务的重大突破,都是来自于公司管理层全力的支持,从来没有例外。10年前大数据变现起步的那会儿,无论是招人和费用,公司都一路绿灯,几年前公司启动数据治理的时候,分管领导每月都召集各部门开联席会,为数据治理工作扫清障碍。

第二、屠龙的少年

公司要有一支数据模型的产品经理队伍,不仅能够做好全域数据的拉通,而且能实现前端市场和后端数据的有效衔接,这在《未来十年,数据团队最核心的能力到底是什么?》一文中有详细的阐述。

“数据团队真正需要的是一只数据模型产品经理队伍,能够以业务对象为核心(不局限于领域)来进行数据模型产品的构建,能够为业务提供端到端的数据服务支撑,能够解决跨领域数据模型构建过程中出现的数据标准、数据质量、数据整合等问题,他们是公司数据资产的真正代言人,能力要求远远超越了传统的数据建模师......”

第三、称手的兵器

数据中台最核心的基础工作就是持续不断的获取更多高质量的差异化数据,如果没有好的数据,巧妇也难为无米之炊,公司一定要通过数据治理等手段获得匹配业务要求的稀缺性数据资源。

比如我们公司的数据变现,主要就依赖两类数据,这两类数据在8年间精度大幅提升,数据量增长了100倍,贡献了收入的80%以上。

数据治理的最大价值,就是帮助公司拿到以前拿不到,拿不全,拿不准的数据。

6、艰难的数据中台的商业化

数据中台成就业务这么难,那么企业能否买到一个现成的呢?毕竟某些领域数据驱动业务的模式还是有共性的。

我原来对此表示悲观,毕竟每家企业的具体业务不太一样,让一个第三方跟你讲用什么样的数据服务驱动你家的业务显得有些滑稽。

做了ERP后,我还是有些观念的转变,因为ERP套装商业软件的业务模式更加复杂,但ERP商业化还是成功了。

因此,领域数据中台应该也有成功的可能,现在有些电商出身的开始卖电商数据中台,这比那种纯卖平台和工具的要进步多了。

去年阿里成立了瓴羊DaaS公司,把阿里电商领域的业务规则尽可能多的沉淀下来,形成业务壁垒,同时整合业务中台和数据中台,这样它们的数据中台就有了业务的出口,从而形成合力,这算是国内比较好的探索吧。

当然ERP相对数据中台还是有些不同,一方面财务管理、会计核算每个公司都需要,涉及的会计规则非常标准且全球通用,另一方面ERP软件已经有了几十年的业务积累,构筑起了很高的壁垒,一般公司很难自己搞得定,而这些奠定了ERP软件商业化的基础。

未来商业化的中台软件要成功,也许需要具备三个条件:

1、中台软件的功能非常全面,几乎涵盖了所有可能的企业需求,并且在每一个领域都提供深度的定制功能,可以满足最复杂的业务需求。

2、提供全面的实施和支持服务,这包括业务咨询、系统配置、培训、系统升级等。这些服务帮助企业更好地使用和优化数据中台,解决在使用过程中遇到的问题。

3、建立了强大的生态系统,包括合作伙伴、咨询公司、第三方软件供应商等。这些合作伙伴可以提供各种服务和解决方案,满足企业的特殊需求。

以上就是我对业务化的数据中台的一个基本看法,以前我们讨论数据中台的时候,总是会先抛出一张架构图,然后介绍里面的各种数据和工具,业务被遗忘了。

事实上,数据和工具就好比高速公路的车,业务就是高速公路,只有高速公路修好了,方向正确了,那些车才能一路狂飙。

希望给你带来启示。

03ed236adb20994476394a4602140b50.png

c1158a127fe560ff3599923fe5049b8b.png

e28e0076a6ba5ce9a31c46daa94b1d1f.png

d3b337da0d5a3ef914b19658d3216b52.png

信息化和数字化的四大本质区别 | 史凯

孟晚舟:战略驱动是根本、数据治理是基础、数据智能是方向,华为的这三个数字化洞见靠谱吗?

ERP原理 | 业财一体化的几种架构模式

一文搞懂ERP与CRM、MRP、PLM、APS、MES、WMS、SRM的关系

把业务搞搞懂,比什么都重要

ERP原理 | 业财一体化的几种架构模式

一张图看懂“数字中国”内涵

华为ERP详细情况到底是什么样的?

查看全部文章

点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/641420.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

T900:可以完美替代P900的国产900MHz无线跳频模块

目录 国产T900模块及其系列成品 T900模块 T900成品 国产T900模块及其系列成品 T900模块及其系列成品,是专门针对无人机及机器人行业设计的,尺寸小、性能优越,可以完美替代microhard的P900产品。下面向大家介绍下T900的相关情况&#xff1…

Dubbo负载均衡策略之 一致性哈希 | 京东云技术团队

本文主要讲解了一致性哈希算法的原理以及其存在的数据倾斜的问题,然后引出解决数据倾斜问题的方法,最后分析一致性哈希算法在Dubbo中的使用。通过这篇文章,可以了解到一致性哈希算法的原理以及这种算法存在的问题和解决方案。 一、负载均衡 …

STM32单片机(五)第二节:EXTI外部中断练习(对射式红外传感器计次和旋转编码器计次)

❤️ 专栏简介:本专栏记录了从零学习单片机的过程,其中包括51单片机和STM32单片机两部分;建议先学习51单片机,其是STM32等高级单片机的基础;这样再学习STM32时才能融会贯通。 ☀️ 专栏适用人群 :适用于想要…

深入学习 Linux 操作系统的存储 IO 堆栈

一、Linux 存储堆栈图 当使用 read() 和 write() 系统调用向内核提交读写 I/O 请求操作时需要经历的步骤: 1)首先,请求经过虚拟文件系统,虚拟文件系统提供了统一的文件和文件系统的相关接口,屏蔽了不同文件系统的差异…

Applied soft computing期刊投稿流程

爱斯唯尔账户注册问题: 账号所属作者即默认通讯作者 刚开始应该会进入这个页面,这里的用户名和密码一般是导师(通讯作者)的账号密码,可以询问老师,然后点击author login登陆就好。 注册里面强调一点,这里面的Title 一般是职称的意思,如果是学生可以填Mr.或者Mrs. 投…

Python 网络舆情分析系统,舆论可视化界面

1 简介 舆情管理系统,这不仅仅可以帮助当地的管理人员迅速的排查跟本地有关的负面言论,还可以避免网民因为本身意识不到位而评论或发布一些不好的观点的情况,最终的目的就是帮助社会更好的发展。 2 技术栈 说明技术栈备注后台Python前端HT…

多线程:Lamda表达式

Lamda表达式 希腊字母表中第十一个字母,英文名字为lambda避免匿名内部类定义过多其实质是函数类编程的概念new Thread (() -->System.out.println(“多线程的学习…”)).start();为什么要使用Lamda表达式? 1、避免匿名内部类定义过多 2、可以让你的代…

Vue中如何进行移动端适配与响应式布局?

Vue中如何进行移动端适配与响应式布局? 如今,移动端适配与响应式布局已经成为Web开发中不可或缺的一部分。Vue.js作为一款流行的JavaScript框架,也提供了许多有用的工具和技术来实现移动端适配和响应式布局。在这篇文章中,我们将…

阿里云服务器ESSD PL-0云盘与ESSD PL-1云盘区别及选择参考

在我们选购阿里云服务器的时候,通常系统盘与数据盘类型都是ESSD云盘,而云盘的性能又分为PL-0和PL-1,虽然都属于ESSD云盘,但是它们之间的性能是有区别的,收费标准也不一样,本文为大家介绍一下阿里云服务器ES…

26岁,大学肄业,家里蹲5年,这位失业青年的求救,牵动百万网友的心……

近期,知乎上有一个求救贴火了,浏览量一度飙升到480多万,近千名网友在帖子下留言,纷纷表达自己的看法。 帖子是这样的。题主26岁,大学肄业。最长只上过12天的班,每次出门面试找工作就会非常害怕&#xff0c…

win11 idea shift+F6快捷键失效问题

1.结论 win11微软输入发最新版问题,使用以前版本即可 2.排查问题过程 最近一直没用shiftF6,当今天要使用时候,突然发现失效了,开始了以下排查过程 2.1 软件快捷键冲突 刚开始以为和其他软件或diea内部快捷键冲突,做了…

计算机组成原理 | 深入理解ELF格式和静态链接

深入解析C语言代码到机器码的过程 #mermaid-svg-UhCa4aLgwtwtM4hS {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-UhCa4aLgwtwtM4hS .error-icon{fill:#552222;}#mermaid-svg-UhCa4aLgwtwtM4hS .error-text{fill:#5…

whatsapp如何开发国外客户

WhatsApp可以说是目前2023年最火的社交营销方式之一,目前全球活跃人数大概在10亿,每日发送消息超过650亿条,语音和通话的时长超过20亿分钟,全球三分之一的人在用WhatsApp的,所有做外贸,WhatsApp是必不可少的…

ESXi 7.0 U3m Fujitsu (富士通) 定制版 OEM Custom Installer CD

VMware ESXi 7.0 Update 3m - 领先的裸机 Hypervisor (All OEM Customized Installer CDs) ESXi 7.0 U3m Standard (标准版) ESXi 7.0 U3m Dell (戴尔) 定制版 OEM Custom Installer CD ESXi 7.0 U3m HPE (慧与) 定制版 OEM Custom Installer CD ESXi 7.0 U3m Lenovo (联想) 定…

AIGC + RTE,一个实时互动的应用实践

一夜之间,区块链、元宇宙、Web3、VR等风口似乎都消散了,似乎只有 AI 才是C位。声网 RTC 云市场各类插件 AIGC,会迸发出什么样的火花呢? 最近,声网内部组织了一次黑客松,经过激烈的角逐,我们团…

【华为OD机试真题2023B卷 JAVAJS】完全二叉树非叶子部分后序遍历

华为OD2023(B卷)机试题库全覆盖,刷题指南点这里 完全二叉树非叶子部分后序遍历 知识点数组树递归 时间限制:1s 空间限制:256MB 限定语言:不限 题目描述: 给定一个以顺序储存结构存储整数值的完全二叉树序列(最多1000个整数),请找出此完全二叉树的所有非叶子节点部分,…

成功邀请媒体采访的关键步骤,媒介易助你成为媒体热门

在企业品牌推广和宣传中,与媒体建立合作关系,并邀请媒体进行采访是非常重要的环节。通过媒体的报道和宣传,企业可以扩大品牌的曝光度,提升品牌形象和知名度。然而,成功的媒体邀约并非易事,需要一定的策略和…

启动QT Linux应用程序后黑屏闪烁?

启动QT Linux应用程序后黑屏闪烁? 提问 问 4 年, 3 个月 前 修改于 3 个月前 点击833次 1 我将嵌入式Linux(imx6q)与eglfs一起使用。 帧缓冲在启动Qt应用程序时正在绘制黑屏。 简单的应用程序是黑色的1秒下。重度施用4~5秒。 这仅…

如何关闭A770显卡的灯效

A770的灯效看起来是不错,但对于我这样的实用主义者来说,他没啥用。所以想着怎么样能把他给关了。 查了一下,intel光放给出的办法如下: 如何使用英特尔 RGB 控制器配置英特尔 Arc™ A770 显卡有限版卡上 LED 的外观和行为。 英特…

java读取文件内容

直接上代码,两个类:一个工具类,一个测试类 工具类代码: package org.example.study.util;import lombok.extern.slf4j.Slf4j; import org.apache.commons.lang3.StringUtils;import java.io.*; import java.nio.charset.Charset…