目录
导读
第四部分
第10章 未来已来:数据成为企业核心竞争力
数据:新的生产要素
数据被列为生产要素:制度层面的肯定
数据将进入企业的资产负债表
数据资产的价值由市场决定
大规模数据交互的企业数据生态
数据生态离不开底层技术的支撑
数据主权是数据安全交换的核心
国际数据空间的目标与原则
多方安全计算强化数据主权
摆脱传统手段的数据管理方式
智能数据管理是数据工作的未来
内容级分析能力提供资产全景图
属性特征启发主外键智能联接
质量缺陷预发现
算法助力数据管理
数字道德抵御算法歧视
第四个世界:机器认知世界
真实唯一的“物理世界”和五彩缤纷的“人类认知世界”
映射“物理世界”的数字孪生——“数字世界”
“数字世界”中的智能认知——“机器认知世界”
导读
第四部分
第四部分为第10章。基于对“机器认知世界”的理解,提出了对数据治理未来的思考,畅想了AI治理、数据主权和数据生态建设。未来已来,让我们共同努力,把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
第10章 未来已来:数据成为企业核心竞争力
基于对华为公司数字化转型的解读,我们建立了数据综合治理体系,发布了信息架构,构建了数据湖、数据底座,打造了数据感知、安全合规能力,提升了数据质量。
数据:新的生产要素
数据不再仅仅被视为商 业活动的副产品,而是战略资源,是发展和提供新型数字产品与服务、建立新型数字商业模式的基础。
数据被列为生产要素:制度层面的肯定
数据作为生产要素的美好前景在我们眼前展开:加快数据要素价格市场化改革,健全数据要素市场运行机制,并提供组织保障已经提上了议事日程。各地区、各部门间的数据共享交换将得到快速推进,数据共享的责任将进一步明确,公共的、基础的数据资源将得到有效流动。在数据开发利用规范化和数据采集标准化的基础上,数字经济会不断涌现新产业、新业态和新模式。与此同时,数据管理制度得到进一步统一规范,数据质量和规范性不断提高,数据分类分级安全保护制度不断完善,企业商业秘密和个人隐私数据得到更好的保护。
数据将进入企业的资产负债表
在经济学中,国民收入是指物质生产部门劳动者在一定时期所创造的价值,是一个国家的生产要素所有者在一定时期内提供生产要素所得的报酬,即工资、利息、租金和利润等的总和。这表示,劳动、土地、资本、管理等传统的生产要素对最终价值的贡献是加成的。不难想象,因为数据能够提升劳动者能力、加速资本周转、加速知识转化、推进技术进步、提高管理水平,所以数据对最终所得收益的贡献将是一个乘数因子,而非简单的加成。数据对前面几项生产要素所得的报酬或多或少都有提高作用。
数据资产的价值由市场决定
作为生产要素的数据资产,其折旧损毁和保值增值是一对永恒的矛盾。数据资产如果不加以有效利用就会逐渐贬值,甚至成为资产负债表上的负资产。实现数据的保值增值,要从扩大数据生态、提高数据活性两方面入手。数据生态会带来数据有效连接的扩大,网络效应获得的数据价值提升往往是指数级的。数据的活性既包括数据自身的时效与质量,又包括使用者对数据的认知和黏性。
当然,数据与传统的生产要素的特点不同,数据的交易、定价、主权保护、收益分配等方面也还存在很多理论空白。可以想见,在不久的未来,在经济学界将掀起对这一生产要素的研究热潮。比如,通过数字化转型促进了企业资产的保值增值,但企业的数据资产自身的变现与保值增值仍然是一个开放的研究课题。
大规模数据交互的企业数据生态
数据生态离不开底层技术的支撑
数据生态建设目标是:从依赖管理手段到依赖自动化技术,增强数据管理的可信、透明;通过基于密码学和区块链技术的智能合约代码化,支撑商业生态系统的数据安全交换;构建统一标准的数据交换空间,实现与客户、合作伙伴协同的数据生态体验。
数据主权是数据安全交换的核心
数据主权是自然人或公司实体对其数据进行排他性自决的权利。
数据主权与云主权、数据采集组件的主权共同构成了完整的生态主权。
数据所有权管理针对的是数据提供,确保数据同源可信,数出一孔;数据主权管理针对的是数据访问与使用,确保数据安全共享,防止数据滥用。
国际数据空间的目标与原则
国际数据空间(International Data Spaces,IDS)是一个虚拟数据空间。它利用现有数据标准和数据技术以及公认的数据治理模型,推动数据在可信的商业生态系统中进行安全、标准化的交换并促进数据连接,从而为各种智能服务场景及跨公司业务流程提供基础设施,同时确保参与其中的数据所有者的数据主权得到保障。为了履行这项职能,IDS不存储信息,而是通过身份提供者及经认证的连接器组件,在经认定的通信伙伴之间建立安全交换。外部数据交换是企业的业务交流过程中的一个重要方面,来自外部合作伙伴的数据可用于提升运营服务。
多方安全计算强化数据主权
参考描述网络价值的梅特卡夫定律,数据生态圈作为一个由数据拥有者实体组成的网络,其价值与加入成员数的平方成正比。加入的成员数目越多,那么整个数据生态网络和该网络内的每个成员所能贡献和收益的价值也就越大。随着生态网络规模在多个领域的扩张,生态里会涌现出各个不同垂直领域的数据生态圈,如电信运营商的数据生态圈等。当然也会有跨领域的数据生态合作,比如涉及公共事务的数据分析,往往需要跨越多个领域获取数据。数据生态的构建和参与能力,以及在其所处生态圈中的地位和影响力,将成为未来企业的核心竞争力。
摆脱传统手段的数据管理方式
智能数据管理是数据工作的未来
应用智能化、数字化的新方法来提升工作效率和效果,借助于数据挖掘、机器学习、数据可视化等方法来更深入地了解海量、复杂、多维、高度互联的数据,让企业的海量数据更加透明、可知、易用。
内容级分析能力提供资产全景图
初步完成数据的架构工作并构建了企业级的数据湖之后,我们就可以基于多维数据特征的可视化分析技术,对数据质量进行内容级分析,采用特征工程方法,建立数据内容的多维模型,在高维空间进行多维度聚类,利用可视化投影技术在二维平面进行渲染展示。与传统的表格式数据展示不同,这种基于内容解析的数据资产智能分析会有诸多强大的应用场景,全景展示所有已经进入企业数据湖的表字段及其关系结构只是其中最为直接和显而易见的应用。
属性特征启发主外键智能联接
以很高的准确率重建已经丢失的主外键关系,加速主题连接的创建和拓展,让已有数据通过更多、更准确的连接发挥更大的业务价值。
质量缺陷预发现
除了已有的基于规则对质量的方方面面进行有尺度的微观管控和宏观治理之外,我们也可以利用大数据分析方法,进行介观层面的分析管理。之所以称之为介观层面,是因为通过大数据分析与可视化方法,我们可以以极快的速度在宏观和微观之间切换,以前所未有的人机交互的方式观察数据分布和异常,从而在很大程度上提升管理水平和效率。简单来说,比如我们观察到,相似类型的数据通常呈聚集状态,远离数据群的属性节点则往往需要质量人员的更多关注。
算法助力数据管理
利用基于密码学的资产指纹技术来更好地管理数据架构。由于大量数据表中含有相同或相似的字段,且判断两张数据表是否同源比较耗时,因此我们对每张数据表的字段名进行快速编码,实现数据表快速比对判重,而不受表中各字段排列顺序影响。我们已经为物理级数据资产建立了数据架构指纹库,支持快速查询、资产去重、篡改发现、资产比对。
数字道德抵御算法歧视
第四个世界:机器认知世界
真实唯一的“物理世界”和五彩缤纷的“人类认知世界”
数据是对真实世界中的对象、事件和概念的某一属性的抽象表示,可以说数据创建这一抽象过程,就是人类对“物理世界”的认知过程。
映射“物理世界”的数字孪生——“数字世界”
以通过对物理世界的感知,构建出完整映射的数字世界,“数字孪生”“数字世界”等概念应运而生。“数字世界”的形成,使我们可以通过对“数字世界”的认知来达到对现实“物理世界”的认知,消除了认知过程中在时间和空间上的约束,大大提升了人类对物理世界的认知能力。
“数字世界”中的智能认知——“机器认知世界”
随着以算法、算力和数据为基础的人工智能的发展和广泛应用,我们可以认为出现了第四个世界——“机器认知世界”,即基于大量数据,各种人工智能“机器”按照各自的算法对映射到数字世界中的事物进行认知,其认知结论会直接影响人类的决策和行动,如流行的购物网站的智能推荐、汽车自动驾驶的智能判断、股票交易员数据处理分析的智能助手等。