穿越数据的迷宫-数据管理知识介绍

news2024/9/23 5:19:01

一、权威书籍介绍

《穿越数据的迷宫》

本书分12章重点阐述了数据管理的重要性,数据管理的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划和设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。

本书可供非数据专业人士、企业管理者、数据行业研究者等读者学习和参考。

《DMBOK2》

数据管理领域的PMBOK,由DAMA进行编撰。

DAMA(国际数据管理协会)成立于1980年,是一个由技术和业务专业人员组成的国际性数据管理专业协会,作为一个非营利的机构,独立于任何厂商,旨在世界范围内推广并促进数据管理领域的概念和最佳实践,为数字经济打下理论和实践基础。

全球会员2万人,在世界共有52个分会。DAMA China (国际数据管理协会中国分会)

职能:年会(EDW)-知识体系-认证考试(CDMP、CDGA、CDGP等)

DAMA框架

车轮图

描述知识管理领域10大子领域

图片

六边形图

描述人、技术、过程之间的关系

图片

知识领域语境关系图 

SIPOC(供给者、输入、活动、交付成果和消费者) 

图片

二、数据管理概念介绍

数据管理与数据治理

数据管理>数据治理

数据治理的目的是确保根据数据管理制度和最佳实践正确地管理数据

图片

为什么做数据治理?

数据治理是数据由原始数据到数据资源到数据资产到数据产品实现数据价值变现的过程。

图片

不要为了治理而治理。围绕业务,围绕监管/法律规定进行治理。目标是使组织能够将数据作为资产进行管理,并从中获取价值。

图片

监管驱动的数据治理——EAST5.0 

      2022年1月30日,银保监会正式发布《中国银保监会银行业金融机构监管数据标准化规范(2021版)》,标志EAST系统从4.0迈入5.0阶段。根据新规要求,银保监会对商业银行数据标准化数据报送的采集范围、报送要求以及数据质量等各方面再次升级,进一步完善了数据采集与报送的完备性、完成性和规范性。

图片

什么是数据治理

当前企业数据面临很多的问题:没有统一的数据标准,各业务系统间数据无法充分共享,关键核心数据无法识别及跨系统无法拉通等。为有效管理企业数据资产,实现数据价值的最大化,急需建立一个完善的数据治理框架体系,为企业数字化转型打下坚实的数据基础。

总的来说,数据治理是人、工具及制度的一些列集合。

图片

数据管理角色(人)

图片

数据治理功能全景(工具)

图片

数据相关的制度及规范(制度)

图片

三、数据安全管理

数据安全管理是指通过规范和加强对企业或个人数据的管理和保护,确保数据的机密性、完整性和可用性,从而保护数据的安全性和可靠性。

1、数据安全管理的法律法规要求:

在法律法规方面,各国政府对数据保护制定了相关的法律法规,例如《中华人民共和国网络安全法》、《个人信息保护法》等,这些法规规定了数据安全的管理要求和责任,以及数据泄露和违规行为的处罚。以下是本文整理的一些数据安全相关的法律法规及标准系列的整理:

图片

2、DSMM-信息安全技术 数据安全能力成熟度模型

数据安全成熟度模型DSMM(Data Security Maturity Model)是一种基于流程和方法的模型,用于评估和改进组织在数据安全方面的能力。DSMM模型的优点是能够帮助组织全面评估和改进其数据安全能力,同时也能够提供实际可行的解决方案,使组织能够逐步提高其数据安全成熟度。

维度包括安全能力维度、安全过程维度、能力成熟度等级维度。

图片

同时,按照数据的生命周期划分未7大过程域。

图片

3、数据安全分级分类管理

在数据安全管理中,需要进行数据安全分级分类管理。这是根据数据的重要性、敏感程度、安全风险等因素,对数据进行分类和评估,然后制定相应的保护措施和管理策略。例如,将数据分为核心数据、关键数据和一般数据,针对不同类别的数据制定不同的安全管理策略和技术措施。同时,数据分类和管理也可以帮助企业或个人更好地了解数据的价值和安全风险,从而采取相应的风险控制和防范措施。

数据安全策略:敏感字段加密、访问权限控制......

图片

图片

元数据管理

元数据是描述数据的数据,数据治理的开始。让你更了解你的数据,从而分析你的数据。

图片

最简单的元数据管理模式——数据字典。

图片

图片

主数据管理(MDM)

定义:主数据是指满足跨部门业务协同需要的、反映核心业务实体状态属性的企业(组织机构)基础信息。

主数据:客户信息、组织机构信息、地址坐标、产品及服务数据、合同总账数据....

参考数据:参考数据是指可用于描述或分类其他数据(码表、映射表......)

图片

主数据管理的案例:五证合一

图片

如何识别及维护是重点!一个主数据管理系统,达成主数据的识别及维护。

图片

数据质量管理——资产价值的核心

2023年10月某小区用电户户电费为1000度;小明的身高为33米;小红的电话号码为18922098765111。以上数据从主观常识上判断就可以判断数据不准确。

判断数据质量可以从准确性、完备性、及时性、重复性、一致性及合规性上进行考量。

图片

数据质量的要求是治理的动力之一也是数据资产化路上的绊脚石。因为数据质量问题发生的原因五花八门,很难从根本上进行治理。

图片

如何进行质量管理,主流的做法是建立一站式数据质量管理中心DQC,建立完善、清晰的数据标准,从数据各环节进行全面的质量管控。但是数据质量管理是需要成本的,非所有数据均需要进行质量监控,要从对业务最重要的数据开始。

图片

数据治理从何处入手?

数据管理成熟度评估——DCMM

数据管理成熟度评估模型(DCMM)是一种针对组织内部数据管理流程进行评估的框架。该框架分为5个等级,每个等级代表了数据管理成熟度的不同程度。组织应该根据自身情况和需求,灵活运用DCMM的框架,以提高数据管理的效率和质量。

截止2023年9月,贯标企业总数量为1305家,其中甲方公司的数量占据了65%,而乙方公司数量占比35%。值得注意的是,71%企业的等级为2级受管理级,仅有7家企业等级达到了最高级别的优化级。这些优化级的企业全部都是甲方公司,主要分布于北京市及广东省。

图片

数据治理如何实施

数据治理实施方法论按照数据治理成熟度评估->评估现状、确定目标、分析差距->计划制定、计划执行->持续监测度量演进的关键实施方法形成数据治理实施闭环流程。

图片

数据是资产

数据是一种资产,在数据要素化的大背景下是毋庸置疑的。如何进行资产评估呢,DAMA从替换成本、市场价值、发现上级、售卖数据及风险成本等几个方面进行描述。

图片

 数据资产价值评估体系样例:

图片

四、数据治理体系及落地

阿里巴巴OneData数据体系

OneData数据中台解决方案基于大数据存储和计算平台为载体,以OneModel统一数据构建及管理方法论为主干,OneID核心商业要素资产化为核心,实现全域链接、标签萃取、立体画像,以数据资产管理为皮,数据应用服务为枝叶的松耦性整体解决方案。其数据服务理念根植于心,强调业务模式,在推进数字化转型中实现价值。

图片

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算平台,并开放可拓展的能力,以适应不同行业客户的平台技术架构和特定诉求。

图片

华为DAYU数据治理体系

DAYU数据治理方法论是华为数据管理方法论的精华总结,参考了业界数据治理最佳实践,并结合华为数字化转型成功经验优化而成。

图片

数据治理中心 DataArts Studio:一站式数据全生命周期管理工具平台,库仓湖智全流程治理,助力数据价值释放

图片

案例:广东省数据资源一网共享平台

开放广东:https://gddata.gd.gov.cn/index

图片

某数据治理产品demo功能演示

https://wise.esensoft.com/

图片

五、数据治理典型问题

只有大数据才需要治理吗?

大数据时代的来临将数据治理问题及挑战推到了风口浪尖。不以数据的大小,按照数据对业务的重要程度进行治理。

图片

数据安全与我无关?

树立数据安全意识,数据安全与每个人息息相关。实行‘双罚制’,将不仅处罚企业,还要处罚企业责任人。

“双罚制”是指对于企业的行政违法行为,同时给予企业及相关责任人员行政处罚的法律责任制度。我国的几部与数据相关的法律均规定了“双罚制”,“双罚制”为我国的企业合规管理体系建设留下了很大空间。例如《数据安全法》第四十五条规定,对于不履行数据安全保护义务的单位,由有关主管部门责令改正,根据不同情节给予警告、罚款、责令暂停相关业务、停业整顿、吊销相关业务许可证或者吊销营业执照,对直接负责的主管人员和其他直接责任人员处以罚款。《个人信息保护法》的罚则规定了“责令暂停或者终止提供服务”、“并处五千万元以下或者上一年度营业额百分之五以下罚款”、“吊销相关业务许可或者吊销营业执照”等严厉的处罚措施。企业在个人信息处理方面违法行为,导致的高额罚款或吊销营业资格等行政处罚危及企业的正常经营,建立起一套合规管理体系对企业变得更有实际意义。

图片

中台=数据治理?

数据中台是数据管理/治理的工具之一。3分技术7分管理及运营

狭义的数据中台指在企业内部通过对数据半成品、算法、模型、工具等能力的积累,支撑业务应用,为前台提供数据能力的企业级数据中枢平台。狭义数据中台聚焦在数据服务的生产和提供,并不包括数据本身的生产、加工、传输等基础性工作。

广义的数据中台是企业数据价值实现的能力框架,包括数据存储汇聚、数据开发、数据管理、数据服务、数据资产运营等能力。通常通过企业统一的一站式数据加工生产利用逻辑平台的形式具象化,是企业级数据价值生产的中枢平台。

图片

数据治理完成后可以一劳永逸?

一些列项目集合,演进而非革命

图片

数据治理是数据/技术部门的事?

自上而下,全局视角,统筹协作。

图片

大数据未来发展趋势

应用:资产化、要素化,交易流通加快

技术:一体化数据管理平台(研发、治理、运营)、DataOps、低代码化、联邦学习、隐私计算......

图片

其他大数据相关书籍推荐

《华为数据之道》

《一本书讲透数据治理:战略、方法、工具与实践》

《阿里巴巴大数据之路》

《数据仓库工具箱(第3版)——维度建模权威指南》

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1237522.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第15届蓝桥STEMA测评真题剖析-2023年10月29日Scratch编程初中级组

[导读]:超平老师的《Scratch蓝桥杯真题解析100讲》已经全部完成,后续会不定期解读蓝桥杯真题,这是Scratch蓝桥杯真题解析第160讲。 第15届蓝桥第2次STEMA测评,这是2023年10月29日举办的STEMA,比赛仍然采取线上形式。这…

PDF Reader Pro 3.0.1.0(pdf阅读器)

PDF Reader Pro是一款功能强大的PDF阅读、注释、填写表单&签名、转换、OCR、合并拆分PDF页面、编辑PDF等软件。 它支持多种颜色的高亮、下划线,可以按需选择,没有空白处可以进行注释,这时候便签是你最佳的选择,不点开时自动隐…

五大匹配算法

五大匹配算法 五大匹配算法 BF 匹配、RK 匹配、KMP 匹配、BM 匹配、Sunday 匹配。 1、BF 匹配 // BF 匹配(暴力匹配) public static int bfMatch(String text, String pattern) {char[] t text.toCharArray();char[] p pattern.toCharArray();int i …

麒麟v10系统,在虚拟机上直接连公司同一个局域网,设置静态ip

1.更改配置信息 cd /etc/sysconfig/network-scripts vi ifcfg-ens33 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno IPV6INITyes IPV6_AUTOCONFyes IPV6_DEFROUTEyes IPV6_FAILURE_FATALno IPV6_ADDR_GEN_MODEstable-pri…

智慧储能边缘计算网关应用,提升能源效率

智慧储能通过边缘计算网关物联网技术来实现对储能电池等设备的在线监控和远程管理。边缘计算网关可以将储能数据转化为可用的信息,并传输到储能系统中,为储能管理提供优化与调度等数据支持。 边缘计算网关在智慧储能系统中起到了关键的作用。IR4000边缘计…

二叉树--递归和回溯

首先我们需要了解递归和回溯是什么意思 递归: 定义: 递归是一种在算法或函数中调用自身的过程。递归通常用于解决可以被拆分成相似子问题的问题。在递归算法中,每一次递归调用都是对较小子问题的求解,直到达到某个终止条件&#x…

数据库实验一 数据表的创建与修改管理

数据库实验一、数据表的创建与修改管理实验 一、实验目的二、设计性实验三、观察与思考 一、实验目的 (1) 掌握表的基础知识。 (2) 掌握使用SQL语句创建表的方法。 (3) 掌握表的修改、查看、删除等基本操作方法。 (4) 掌握表中完整性约束的定义。 (5) 掌握完整性约束的作用 二…

AIGC 点亮创作之旅,「重内容」行业也能轻装出发

毋庸置疑,AIGC 的普及成为了内容产业的一束光。 不仅策划们可以从信息挖掘、素材调用、修改编辑等基础文案工作中解放出来,美术也成为 AIGC 的应用强项,基本的加文字、换背景、改尺寸、延展素材等,都能快速解决。 内容创作者们也因…

基于SpringBoot的图书管理系统

基于SpringBoot的图书管理系统 图书管理系统开发技术功能模块代码结构数据库设计运行截图源码获取 图书管理系统 开发技术 技术:SpringBoot、MyBatis-Plus、MySQL、Beetl、Layui。 框架:基于开源框架Snowy-Layui开发。 工具:IDEA、Navicat等…

基于骑手优化算法优化概率神经网络PNN的分类预测 - 附代码

基于骑手优化算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于骑手优化算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于骑手优化优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

2023年中国制服需求量、市场规模及行业细分需求现状分析[图]

制服是某一种行业为体现自己的行业特点,并有别于其他行业而特别设计的着装。它具有很明显的功能体现与形象体现的双重含义。这种职业装不仅具有识别的象征意义,还规范了人的行为并使之趋于文明化、秩序化。 职业制服市场可细分为国家统一着装部门&#x…

数字逻辑电路基础-时序逻辑电路之锁存器

文章目录 一、锁存器简介二、verilog源码三、综合及仿真结果一、锁存器简介 本文介绍数字逻辑电路中一种常用的基础时序逻辑电路-锁存,顾名思义,它的功能就是将输入在控制信号有效时透明传输到输出端,当控制信号无效时,输出值保持不变。它具有记忆和存储功能。这是它区别组…

风丘电动汽车热管理方案 为您的汽车研发保驾护航

热管理技术作为汽车节能、提高经济性和保障安全性的重要措施,在汽车研发过程中具有重要作用。传统燃油汽车的热管理系统主要包括发动机、变速器散热系统和汽车空调,而电动汽车的热管理系统在燃油汽车热管理架构的基础之上,又增加了电机电控热…

VSCode配置用户代码段以及常用快捷键汇总

一:前言 VSCode 是一款由微软开发的轻量级编辑器,可以安装插件和兼容多种语言。其本身已经是目前前端开发所使用的主流软件。那么在开发过程中,我们经常要写很多重复性的代码,比如当你去新建一个 .vue 页面的时候,往往…

一款好用的window ssh远程终端term工具

这是一款可以在window10上运行的ssh终端工具. 官方下载地址: https://github.com/kingToolbox/WindTerm/releases 具体页面如下 下载解压后: 把它移动到C目录下面,并且搞一个桌面快捷方式,就可以了

vLive虚拟直播2.6.5.1版本全新上线,四大实用功能抢鲜看!

vLive虚拟直播系统https://live.vsochina.com/cnvLive虚拟直播系统2.6.5.1版本全新上线,新版本中新增了四大实用功能!接下来小编将带你一同体验这些新功能。 1.支持带透明通道的信号源输入 新版本支持带透明通道的信号源输入,这意味着用户现…

垃圾收集器的种类及概述

1.JVM参数 1.1标准参数所有jdk版本通用参数 -version -help -server -cp 1.2-X参数 非标准参数,也就是在JDK各个版本中可能会变动 -Xint 解释执行 -Xcomp 第一次使用就编译成本地代码 -Xmixed 混合模式,JVM自己来决定 1.3 -XX参数 使用得最多…

visionOS空间计算实战开发教程Day 4 初识ImmersiveSpace

细心的读者会发现在在​​Day1​​​和​​Day2​​​的示例中我们使用的都是​​WindowGroup​​。 main struct visionOSDemoApp: App {var body: some Scene {WindowGroup {ContentView()}} } 本节我们来认识在visionOS开发中会经常用到的另一个概念​​ImmersiveSpace​​…

跑步耳机哪种好?运动耳机什么牌子好?无线运动耳机品牌排行

​运动健身已经成为当下最热门的运动健康项目,越来越多的人开始加入到这个行列中来。而在运动的过程中,佩戴一款适合自己的运动耳机听歌,不仅可以增加运动的乐趣,还能帮助我们更好地集中注意力,提高运动效果。然而&…

Talk | PSU助理教授吴清云:AutoGen-用多智能体对话开启下一代大型语言模型应用

本期为TechBeat人工智能社区第548期线上Talk! 北京时间11月21日(周二)20:00,宾夕法尼亚州立大学助理教授—吴清云的Talk已准时在TechBeat人工智能社区开播! 她与大家分享的主题是: “ AutoGen:用多智能体对话开启下一代大型语言模…