【金猿人物展】数睿数据创始人兼CEO穆鸿:大数据价值创造关键在于应用普惠...

news2024/10/5 14:23:06


c835f5bd28bfb1e35673c21bc840b26e.png

e2e1388f2d2e7f04967bc74aafae1429.png

穆鸿

本文由数睿数据创始人兼CEO穆鸿撰写并投递参与“数据猿年度金猿策划活动——2022大数据产业趋势人物榜单及奖项”评选。

64669b02af0da334b97e0b28387c7955.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


事情还得从我2022年这一年经历的一些事情谈起,由于工作的原因,我要经常往返于北京和南京、上海以及深圳、成都等地。跟很多网友描述的情况类似,曾经一段时间我始终无法消除健康码的弹窗,甚至通过12345主动申报也不好使。大数据用于防疫,我认为是大众能够感受大数据价值和威力的一个最生动的样板。但是大数据不是万能的,时空数据分析受限于数据获取的准确性和时效性,我们没有办法获取到准确的用户行程轨迹,再加上受限于数据安全管控等原因,我们很多数据还得依赖用户上报。从这个意义上,我是理解健康码技术实现上的一些不得已的,但这并不意味着不可改进。

我另外一个印象比较深的是在某地出差,一次核酸信息登记系统的崩溃,风中等了好几个小时。我是真实感受到现场的忙乱以及后台技术人员的压力的,最后可能是一个业务小BUG导致的,但是修改很麻烦。我当时就想,类似这种数据采集系统如果能够现场搭建和修改,并且由底层来保障性能和可靠性,那该多好。后来,到了各处又填了各种各样也不知道是哪个供应商的数据采集系统,我对我自己个人信息泄露又有了担忧,这些信息大部分是重复的,或者本来是不需要申报的,但是可能没有统一的管理入口,或者没有好的共享机制,导致二维码满天飞。现实是最好的教科书,当我们真正经历了很多事情,我们就会有更深刻的认知和感同身受。

还有一段切实的感受,来自我对一个制造业企业老板的拜访,我完全没想到他对数据驱动企业运营和生产是如此热衷和执着,他们采购了全世界最先进的自动化生产设备,也采购了业界最好的ERP等管理系统。他一直在努力解决三个方面的问题:

① 如何实现全流程数据打通,从材料到制品,从生产到物流,从人员到财务;

② 如何实现知识的沉淀和复用,过去生产参数配置是在有经验的一线工人脑子里的,需要将他们数据化并形成他们行业的算法,然后根据客户需求能够自动化生成个性化的最佳参数,他们自己开发了很好的应用来完成这一点;

③ 如何实现数字化应用DIY?他有很丰富的经验,他知道企业数字化痛点,他不懂计算机专业技术,但是希望能全程参与构建,甚至他的员工和一线工人也可以根据业务需要去构建应用。

对于以上这些问题,无非需要的就是一个打通的数据底座和一个能构建各种数字化应用的平台。无论是成本还是技术,他不认为传统供应商能帮他解决这个问题。

在即将过去的2022年,无论是政府还是企业对大数据的价值发挥都有了更多的认知和迫切的期待,但是我们还需要持续努力,抛砖引玉,我提出五个主要需要解决的问题,供大家参考:

1、改进数据供给的质量,数据作为生产要素,必须对数据的采集、加工、共享和应用的端到端质量进行管控,尽量减少人的参与,推动自动化水平的提升;

2、解决数据跨供应商、跨部门、跨组织和行业的共享问题,在风险可控、合规的前提下,推动数据价值共享、交换和增值,尽量从技术而不是管理的角度解决产业关切的问题;

3、降低数据应用开发的门槛,让普通工作人员也能按照岗位的需要,自助取数、自助分析以及开发数据应用;

4、提升数据分析的手段和效果,不仅是统计分析、关联分析、预测和决策,诸如图像视频分析、地理分析、文本分析等也能围绕场景需要轻松完成;

5、提升应用开发和修改的效率,应用要能够满足场景多变的需求,可以随时随地进行修改,并且快速上线。

解决上面的问题也不是一蹴而就的事情,这里面有很多是老生常谈的问题,也有自研能力强的公司已经在局部很好地解决了问题。就更大范围的大数据应用普惠而言,还有很大的差距,这里重点强调“普惠”,就是门槛要低,人人皆可用。从空间角度看,用的人多了,累积的价值就多了;从时间角度看,门槛低了,上线时间就缩短了,迭代改进就变频繁了。我们一直以来的观点,好的应用是快速上线反馈改进出来的。

回顾2022年,为解决上面提到的问题,技术、工具和方法都可圈可点,简单总结如下:

1、大数据过程管理能力落地,提升数据供给质量。无论是DCMM的推广认证实施,还是DataOps的落地尝试,都有助于提升企业数据管理水平,推进数据价值转化;

2、大数据安全和隐私计算,为应用和共享背书。随着相关法规制定和落地,大数据安全和隐私保护得到了全行业的关注,数据安全的产品也更加丰富。为推动数据要素流通而生的隐私计算开始走向商用,尽管还存在性能等问题,但仍备受期待;

3、低/无代码开发工具日趋普及,大大降低应用开发门槛。无论是数据集成、数据分析、机器学习还是数据应用开发,低/无代码已经被企业用户普遍接受,大规模流行还需要时间;

4、处处是AI,不仅是分析外部数据,也用于软件本身。无论是前几年兴起的智能数据治理、AIOps,还是智能数据库,大数据产品本身,不断用AI增强自身能力。此外,AI用于外部数据分析仍然在持续发展。

3d5c69e5b7399bb6f893bd14fc1b923e.png

大数据分层示意图及每层控制点说明

 如上图所示,为实现应用普惠,我们需要多层次的大数据能力支撑。

要有好的数据源支撑,这个主要取决于数据资源的获取能力,数据来了,要有好的存储、计算和分析引擎来支撑。目前主流的大数据引擎技术Hadoop、Spark、Flink等,大部分还是来自国外。2022年Apache Doris、Pulsar等由国内团队主导的引擎得到了迅速的发展,但我们仍然跟国外有较大的差距,因为这层的核心竞争力来自对基础理论的突破。理论的突破会带来断代的竞争力提升。从商业角度,生态卡位则是这一层另外一个最重要的考量点。

再往上,是各种工具,工具对支持应用普惠是最重要的。体验是用户最关注的点,而工程能力是主要的竞争力。尽管过去这层积累也不足,包括数据治理工具、BI分析工具等,过去主要是国外产品天下。随着应用场景的丰富,技术的更新换代,我们完全有机会后来据上。

最后是业务理解力,这块主要取决于用户和行业专家业务知识积累。

每一层竞争力的提升都需要我们不断地应用、尝试、反馈和修正,才能累积真正的产品竞争力并最终创造商业价值。

2023年即将到来之际,随着疫情的逐步结束,企业数字化转型必将加速进行,从信息化、数字化到智能化,将大数据用起来、用好,并能够让更多的企业、企业里面更多的人用起来,已经成为企业的必然要求。这是企业管理从粗放化到精细化经营的必然要求,也是企业生产从机械化、自动化到智能化的必然要求。

从过去几年,我们服务客户的表现来看,仍然面临着诸多问题和挑战,主要表现在以下3个方面:

1、缺乏循序渐进的商业推动力

大数据应用的构建和落地总是需要投入,如果不能很好的呈现商业价值,任何的投入都有夭折的风险,尽管企业有宏大的顶层设计,也要有不断的价值呈现,最好这些价值呈现可量化,并能和商业结果(降本增效)挂钩。企业如果没有很好的闭环评估体系,或者缺乏试错、纠错和容错的机制,商业推动就会很难。只有领导者的支持很难长久。

2、缺乏优秀的平台和工具产品

对于大部分企业而言,要么是自己购买平台和工具做数据治理和分析,要么是它的供应商来做。这都需要优秀的平台和工具,这些产品的研发需要大量的客户积累和长时间的打磨,需要巨大的研发投入,而碎片化的市场、不讲究的客户和行业的内卷,让打造一款真正的好产品越发困难。

3、缺乏适应转型的组织支撑

应用普惠的目标是推动企业数字化转型,让人人都能成为数字化工作者,产生数据、运用数据并形成洞察落地到改进企业的各项活动中。“甲乙方思维”、“多一事不如少一事”以及“运动式改进”等都会导致目标落空,或者不能长期发展。

如果我们认可大数据价值发挥是企业数字化转型的必由之路,并且希望企业每个角色都能通过大数据应用带来价值,我们会有一些具体的建议给到大家,这些建议是基于最近几年我们在为大型国企提供数字化转型解决方案和客户共同摸索出来的,也代表着我们对趋势的判断,即大数据价值创造的关键是应用普惠,这也是推动企业数字化转型的重要举措。

1、建立匹配的混合型组织

无论这个组织是实体还是虚拟的,是诸如数据治理委员会、数字化转型工作组,还是类似低/无代码应用开发CoE。这个组织一般由业务人员、IT人员(可选)以及IT服务商(提供软件产品和服务)组成。这个组织的目标之一是推动大数据应用普惠,能够开发各种生产和消费数据的应用。这个组织一般要由相当层次的人作为领导者或者Sponsor,组织应当明确下面几点:

• 业务人员是业务应用构建的第一和主要责任人,业务人员要参与到应用构建中,推动中大型应用的实施落地(有IT人员参与),一些小微应用甚至不需要IT人员参与,IT服务商主要以软件产品供给和技术支持服务为主;

• 业务应用的目标和范围,尽管我们希望每个人都能用起来,但是仍然要有节奏地推进,包括阶段性的目标和里程碑设定,以及业务范围;

• 奖惩措施的确定,对内部员工而言,成功意味着升职加薪;对外部IT服务商而言,意味着成为客户战略合作伙伴,有持续的商业回报。

2、从解决一个具体问题开始

我们可以有顶层设计,有宏伟蓝图,但所谓大处着眼、小处着手,我们更建议带着解决一个个具体问题,逐步向规划的目标前进,这个具体问题可以是上一个新的应用系统,或者是通过数据分析去解决一个具体的质量问题,甚或是完成国家、上级组织的一个具体任务(比如建立行业数据中心)

3、选择一个好的支持柔性应用的平台

所谓柔性应用就是应用能够快速构建和上线,能够根据业务的变化随时调整,最好业务人员就能自行完成。无代码软件平台就是个很好的选择,把适应变化作为第一要素考虑,就是为了面对不确定性,水利万物而不争,业务永远是主角而不受限于信息技术

4、建立一个快速试错的机制

尽早让真实用户用起来,尽早拿到数据结果比其他都重要。比如,主流程跑通了,就可以上线试运行起来,我们首要是拿到业务结果的真实反馈,然后发现问题就去修改,尽管不是必须,但是无代码平台能够帮助我们完成这一点。

5、拥抱变化是新常态

大数据的发展史就是不断拥抱变化的历史,过去大部分需求明确,所以有数仓模型、有周期性报表和预计算的OLAP分析还有固定的数据专题应用。后来,为了应对不确定需求,有数据湖、有动态的OLAP分析以及无代码的数据应用构建,所以我们的架构设计、管理流程和技术堆栈都要能够适应变化,以主动元数据为核心的智能数据目录、自适应的AI系统、自动数据增强、元数据驱动的数据编织都会随着应用的需求提到日程上来。

6、建立良好的度量体系

所谓没有度量就没有管理,这里的度量有两个层面的含义。一个是度量构建各种应用对企业的价值,是降本了还是增效了;另外一个层面是能不能快速通过各种度量给业务把脉,即在各种应用中快速建立度量体系,指标中台被认为是加速度量的重要方法之一。

7、机器能做的事情让机器做

因为机器总是不知疲倦,我们希望在构建应用的时候,或者构建出来的应用都通过“机器”实现自动化处理。前者,例如通过自然语言界面,能够自动生成关于数据的见解,这些见解可以是文字或者图表。最近很火的ChatGPT可以被用于构建问答式用户界面。推荐技术最近也被大量数据处理或应用开发平台采纳来加速应用构建。后者的典型例子包括应用中自动化流程节点的处理,IDP(智能文档处理)可以在这里得到用武之地,或者采用智能工作流技术用于组织内流程的自动优化和改进,流程挖掘是这两年比较热门的话题。

8、让应用更好地为生产服务

过去我们的各类应用主要是西方管理知识的承载,是西方在工业生产管理基础上提炼总结的,当西方制造业转移后,很多场景我们已经无法获取到信息化解决方案。我们必须结合中国产业的特点来找到自己的解决方案,让不懂信息技术的客户能够直接参与应用构建,让应用更好地为生产服务,而这样的价值是远远大于一些简单的管理改进的。

一旦我们通过应用普惠,不仅实现每个岗位的效能提升,而且真正去解决企业经营和生产的具体问题,我们就通过应用真正实现了大数据价值创造。我们能够让每个人都真正参与到企业数字化转型中来,我们就对未来充满了信心,实现从信息化到数字化,并进而实现智能化。对此我充满期待。

·关于穆鸿

穆鸿先生是数睿数据的创始人兼CEO,数睿数据是数据驱动的企业级无代码平台的开创者和领导者,先后获得包括银杏谷资本、云启资本和红杉资本等数亿元融资,其推出的无代码产品smardaten服务数百家客户,客户知名度和满意度均处于领先地位。

穆鸿先生曾任360集团副总裁,负责集团大数据、人工智能、区块链以及云计算等技术中台的构建,管理超过200EB的大数据集群。在加入360前,穆鸿先生是华为中间件产品和大数据产品创始团队负责人,研发了包括Hadoop的商业发行版本、分布式关系数据库、分布式ETL平台、机器学习平台以及BI分析平台等。穆鸿先生是计算机学会大数据专委会和区块链专委会的执行委员。

3bccb9c490d027a2bced64acb835e6ab.jpeg

c4928298e5ac36efb55ddf6aa86a37f6.jpeg

8779ce8de7ac26da31ba0876e9d10306.png

bd6841ee2e328a411a384ef91a7f917f.png

《2022中国企业数智化转型升级服务全景图/产业图谱2.0版》

0b7dbffb11c0497364478d0bf32067c2.png

《2022中国数据智能产业图谱2.0版》

ef962d17631c3619299bad73dea51a87.png

‍❷ 创新服务企业榜‍‍‍

❸ 创新服务产品榜

❸ 最具投资价值榜

❺ 创新技术突破榜

6bd86027365d9104928a67ba95ddfdc6.png

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》

联系数据猿

1b03a39657d63779ca1f05d54e2e8c7c.png

41ac1ef53f9148641fbe12c37e6d164d.png

115baaa103a0f834c35df3885796890d.png

6f5ea499f7914a16d3133a03ec7d154f.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/115293.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python量化交易04——基于机器学习的交易策略

参考书目:深入浅出Python量化交易实战 学量化肯定要用的上机器学习这种强大的预测技术。本次使用机器学习构建一些简单的预测进行量化交易,使用Python进行回测。 获取数据 import pandas as pd import tushare as ts import numpy as npfrom sklearn.neighbors imp…

线程池设计与实现C

线程池实现 结构设计 先上图: 参数 线程池: 包含一个执行队列、一个任务队列mutex用来在多个线程取任务时锁任务队列,cond用来在任务队列为空时锁任务队列 如线程A锁了任务队列,去取任务时,又发现任务队列为空&…

【C++求解数学题】大圆圈里面三角形个数相等

本文介绍的问题是一道来自于二年级(上)数学的练习题。 问题 在下图中画8个Δ\DeltaΔ,使每个大圆圈里都有4个Δ\DeltaΔ. 示例: 每个大圆圈里面均有4个Δ\DeltaΔ. 方法 按照“变量-范围-条件”的三段式穷举法解题框架,对…

分布式系列之聊聊Nginx实现原理

Nginx作为开源的轻量级的HTTP服务器,广泛应用于分布式应用架构中。本文简要介绍了Nginx的特点及使用场景、Nginx的进程模型和请求处理流程,并结合不同场景进行配置,对Nginx的架构和实现原理有个初步的了解。 1、Nginx是什么 Nginx&#xff0…

Echarts之甘特图type: ‘custom‘参数详解

甘特图 const groupData XEUtils.groupBy(data, "eqpName"); //分组后的数据 const yAxisData Object.keys(groupData); const seriesData Object.keys(groupData).map((item, index) > {let arr [];groupData[item].forEach((GItem) > {arr.push([index,f…

Graphviz安装向导及入门指南

目录 1、首先在官网下载graphviz 2、安装。 3、测试并在Windows命令行中使用 4、在Python中使用 5、在自带的gvedit.exe 程序中使用 6、在语雀中使用 7、绘制一棵简单的二叉树 8、详细语法介绍 8.1 带标签 8.2 修改方框颜色和形状 8.3子视图 8.4 结构视图 8.5 …

【网络安全】Centos7安装杀毒软件----ClamAV

一、ClamAV介绍 Clam AntiVirus是一个Linux系统上使用的反病毒软件包。主要应用于邮件服务器,采用多线程后台操作,可以自动升级病毒库。 二、安装 1.下载rpm wget https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm 2.升级epe…

4.1、网络层概述

1、主要任务 网络层的主要任务是实现网络互连\color{red}实现网络互连实现网络互连,进而实现数据包在各网路之间的传输\color{red}实现数据包在各网路之间的传输实现数据包在各网路之间的传输 例如: 这些异构型网络若只是需要各自内部通信&#xff0c…

高质量发展指标构建:全国各省高质量发展需求(2014-2021年)

高质量发展是坚持更高层次和更高水平对外开放的发展。中国改革开放四十年的实践充分证明,不断扩大对外开放是推动中国经济社会发展的重要动力,是实现国家繁荣富强的根本出路。因此,在中国经济发展的新时代,推动新一轮高水平开放&a…

docker logs实时查看日志tail

docker logs实时查看日志tail docker logs -f -t --since="2017-05-31" --tail=10 container说明: --since : 指定输出日志开始日期。 -f : 查看实时日志 -t : 查看日志产生的时间戳 -tail=10 : 查看最后的10条日志。 container : 容器名docker logs -f --until=2s说…

Docker常用操作命令总结(一)

文章目录一、Docker的应用场景二、Docker 的优点三、Docker 架构四、安装Docker1、更新 apt 包索引2、安装docker3、安装完成之后,运行命令sudo docker info,检查安装状态4、有可能,第一次需要手动启动服务.就需要执行下面的命令,…

LabVIEW如何减少下一代测试系统中的硬件过时4

LabVIEW如何减少下一代测试系统中的硬件过时4 DSSP Class Definition DSSP父类定义有三种不同类型的函数:仅父类、公共类和基于度量的函数。DSSP父类,DSSP.Lvclass包含所有子类函数的超集,加上父类特有的一些函数。DSSP父类的单个子实例(例如AgSigGen.…

2022年总结(2022年1月1日至2022年12月25日)

前言 时光飞逝,又到了一年一度的年终总结的时间了,2022年充满磨难的一年,悲哉,痛哉~~ 但对于我而言,其实还好,基本无太大影响,黄金单身汉,一人吃饱,全家不饿~&#xff…

spring之手写框架

文章目录前言一、手写spring框架之核心接口实现二、手写spring框架之实例化Bean三、手写spring框架之获取所有set方法四、手写spring框架之给属性赋值4.1 非简单类型属性赋值4.2 简单类型属性赋值附:前言 Spring IoC容器的实现原理:工厂模式解析XML反射…

学习性能所必须的知识之算法

什么是算法? 通过有效地缩小查找范围,只需要很少的次数就能很快速的找到需要的数字,这样的策略或方法就称为“算法”。 算法的好坏对性能有很大的影响。 学习算法的窍门 掌握算法优点与缺陷,“折中”是一个很重要的思维通过在图上推演来思考评价算法的指标 通过复杂度(…

各种型号西门子PLC所支持的通信协议小结

西门子PLC有4大类,几十个型号类型,PLC不同所支持的通讯协议也不相同。 按照大类型来划分,具体可分为串口协议和以太网通信协议两大类。 串口协议主要有:MODBUS RTU 通信协议;PROFIBUS 通信协议;USS通信协…

疫情信息管理系统(附源代码及数据库)

本系统是一个可以对各种疫情进行管理的系统,管理员可以直接对居民、住户进行统一的管理,这样就能在疫情期间大大减轻了管理者的工作量,使管理社区的渠道更加的方便。其主要功能有:登录功能,公告的发布,到访…

2022, 6年技术路, 后疫情时代复盘

专注 聚焦 持续复盘写下你一年的希望...又到了每年一度的复盘时间。转眼一想, 做技术已经 6 年了。说实话,有点疲惫了。今年整个互联网行业都不好过, 加上疫情的反复不断, 从耳边流出了很多裁员的信息, 股市也比较低迷, 身处底层的我们只能夹缝生存。但是, 我又是…

【MySQL基础教程】DQL语句详细介绍

前言 本文为 【MySQL基础教程】DQL语句 相关内容介绍,下边具体将对DQL语句基本语法,基础查询,条件查询,聚合函数,分组查询,排序查询,分页查询,相关案例,执行顺序等进行详…

Elasticsearch 核心技术(二):elasticsearch-head 插件安装和使用

❤️ 个人主页:水滴技术 🚀 支持水滴:点赞👍 收藏⭐ 留言💬 🌸 订阅专栏:大数据核心技术从入门到精通 文章目录一、安装方式二、下载 head 插件三、安装 head 插件四、运行 head 插件五、使用…