DAMA数据管理知识体系指南之数据架构管理

news2024/11/20 9:33:13

第4章

4.1 简介

数据架构管理是定义和维护如下规范的过程:

提供标准的、通用的业务术语/辞典。
表达战略性的数据需求。
为满足如上需求,概述高层次的整合设计。
使企业战略和相关业务架构相一致。

数据架构是用于定义数据需求、指导对数据资产的整合和控制、使数据投资与业务战略相匹配的一套整体构件规范。它也是主蓝图在不同层面的抽象之大集。数据架构包括正式的数据命名、全面的数据定义、有效的数据结构、精确的数据完整性规则,以及健全的数据文档。

数据架构管理职能的关联图:
在这里插入图片描述
企业数据架构是一套规范和文档的集合。它主要包括如下3类规范。

(1)业数据模型:企业数据架构的核心。
(2)信息的价值链分析:使数据与业务流程及其他企业架构的组件相一致。
(3)相关数据交付架构:包括数据库架构、数据整合架构、数据仓库/商务智能架构、文档和内容架构,以及元数据架构。

4.2 概念与活动

4.2.1 架构综述

架构是对构成要素的有组织安排,它优化整个结构或系统的功能、性能、可行性、成本以及美感。

  • 企业架构

数据架构是企业架构中的一部分。企业架构整合了数据、流程、组织、应用和技术架构。帮助组织进行变更管理,提高效率、灵活性,以及明确管理责任。使得组织可以应对不断变化的市场机会、业界挑战和技术进步,帮忙评估业务风险、管理变革、改进业务有效性、敏捷性和可问责性。企业架构包括:

信息架构:业务实体、关系、属性、定义、代码项(参考值);
流程架构:职能、活动、工作流、事件、周期、产品、步骤;
业务架构:目标、战略、角色、组织结构、场所(场景);
系统架构:应用、软件组件、接口、项目;
技术架构:网络、硬件、软件平台、标准、协议;
信息价值链分析构件:绘制数据、流程、业务、系统和技术之间的关系;

所有的组织都是基于对业务需要和业务风险的理解来开发和维护企业架构。企业架构是规划、IT治理和组合管理的工具。它可以有效的整合数据、流程、技术和改进措施,使信息系统与业务策略一致,改善跨组织的沟通与理解,更有效的使用和协同资源,降低管理IT基础设施成本,为业务流程改善提供方向。

  • 架构框架

架构框架提供了一种思考和理解架构的方法,以及需要架构的结构和系统。架构是复杂的,架构框架从总体上提供了“架构的架构”。
有两类不同的架构框架:

分类框架——将指引企业架构的结构和视图组织起来。框架定义构件的标准语法来描述以上视图以及视图之间的关系。构件大多数是图形、表格和矩阵。
流程框架——规定业务和系统规划分析,以及流程的设计方法。有些IT规划和软件开发生命周期(SDLC)包括其自定义的复合分类。不是所有流程框架都规定同一套东西,有些是很专用的。

目前已经存在一些框架,例如:

TOGAF——开放组织架构框架是开放群组(The Open Group)所开发的一套标准流程框架和软件开发生命周期(SDLC)方法。这是一个供应商和技术中立的组织,旨在定义和推广全球互操作性公开标准的合作团体。TOGAF8企业版可被任何机构采用,无论是否为开放组织的会员。
ANSI/IEEE1471-2000——推荐用于软件密集型系统的架构描述,它有望成为
ISO/IEC25961标准,是用来定义解决方案的构件。

有些咨询公司开发出有用的自有专利的架构框架。有些政府和国防部门也开发出了一些架构框架,包括:

联邦企业架构(FEA)——由管理和预算办公室产生,供美国政府内部使用。
政府企业架构(GEA)-——立法规定由澳大利亚昆士兰省政府各部门使用。
DODAF——美国国防部架构框架。
MODAF——英国国防部架构框架。
AGATE——法国DGA架构框架。

  • Zachman 企业架构框架

Zachman企业框架2是最广为人知并被广泛使用的架构框架。尤其是企业数据架构师,自从John Zachman于1987年在IBM的一篇系统刊物文章里首次发表此框架的描述之后,就开始对其采纳和使用。
Zachman 企业架构框架3.0:
在这里插入图片描述
第一个维度以利益相关者进行划分,Zachman从以下视角进行描述:

规划者视角(范围背景)——定义(业务)范围的一系列业务元素,由作为理论家的策略制定者识别。
所有者视角(业务概念)——关于业务元素之间的关系的语义模型,由作为所有者的管理领导人定义。
设计者视角(系统逻辑)——详细描述系统需求和不受约束的设计逻辑模型,由作为架构师的设计者描绘。
建造者视角(技术物理)——作为建造者的工程师,在特定技术、人员、成本和时间限定下,为实现特定应用而对设计进行优化的物理模型。
实施者视角(组件组装)——关于技师作为实施者,如何组装、运作和配置系统组件,利用专有技术的、不受背景约束的视角。
参与者视角(运营等级)——作为参与者的人员使用的实际运作系统的实例。

第二个维度从问题的不同方面来回答问题:

用什么做(数据列)——建造系统所用的材料(库存项Inventory Sets)。
如何做(功能列)——履行的活动(流程转换)。
何地做(网络列)——地点,拓扑和技术(网络节点)。
何人做(人员列)—角色和组织(组织中的团队)。
何时做(时间列)——事件、周期和日程(时间阶段)。
为何做(目标列)——目标、策略、出发点(动机原因)。

:圆括号中为每列修订后的标签。

  • Zachman框架和企业数据架构

企业数据架构是更大的企业架构中的重要组成部分,企业架构包括流程、业务、系统和技术架构。数据架构师关注企业数据架构,并和其他企业架构师一起工作,将数据架构整合进更广义的企业架构。
企业数据架构一般包括3套主要设计组件:

(1)企业数据模型,识别主题域、业务实体、控制实体元素之间关系的业务规则,以及若干重要的业务数据属性。
(2)信息价值链分析,使数据模型组件(主题域和/或业务实体)与业务流程及其他企业架构组件相一致;这些组件可能包括组织、角色、应用、目标、战略、项目和技术平台。
(3)相关的数据交付架构,包括数据技术架构、数据整合架构、数据仓库/商务智能架构、企业对内容管理的分类方法,以及元数据架构。

第一个“数据”列中的单元——现在称为Inventory sets,代表常见的数据建模和设计构件

规划者视角(范围背景)——一系列主题域和业务实体。
所有者视角(业务概念)——表达实体间的关系的概念性数据模型。
设计者视角(系统逻辑)——具有全部属性的规范化(范式化)逻辑数据模型。
建造者视角(技术物理)-—在既定技术限制下优化的物理模型。
实施者视角(组件组装)——数据结构的具体实现,通常是SQL中的数据定义语言(DDL)。
运作的企业——实际实施的实例。

4.2.2 活动

  • 理解企业信息需求

为创建企业数据架构,企业需首先定义其信息需求。企业数据模型是获取和定义企业信息需求和数据需求的一种方法。它表述了全企业范围内数据整合的主蓝图。所以,企业数据模型是所有未来系统开发项目的关键输人,也是项目级附加数据需求分析和数据建模工作的基线。

项目的概念和逻辑数据模型基于企业数据模型中适用的部分。有些项目比其他项目更能从企业数据模型中受益,这取决于项目的范围。事实上每个重要项目都会从中受益,并且影响企业数据模型。

决定企业信息需求的一个方法,是基于组织内部和外部目标评估目前组织所需要的输人和输出。利用真实的系统文档和报告采访参与者。这个材料提供重要的数据实体、数据属性和数据计算的一览表。将这些项目以业务单元和主题域形式组织成列表,与参与者一起审核,以确保分类的适合性和完整性。该表就成为企业数据模型的基本需求。

  • 开发和维护企业数据模型

业务实体是业务实体是企业真实的事物、人员、地点的概念和类别(分类)。数据是一系列采集的关于业务实体的事实。数据模型定义的是业务实体以及其应用所需的事实(数据属性)。因此,数据模型是定义和分析数据需求,设计满足这些数据的逻辑和物理数据结构,是规范和相关图表。

企业数据模型EDM是企业范围内的整合的、面向主题的数据模型,用来定义关键的数据生产者和消费者。

整合的:组织中所有数据和规则都被描述一次并无缝配合,是一个整体。不管组织内如何划分业务和职能,就数据来说只有一个版本,一个唯一的名字、定义,并规定同一个词在不同业务实体下的不同含义。
面向主题:数据模型可以分解为跨多个业务流程和应用系统的共识主题域,主题域关注的是业务实体。
关键的:企业的数据模型不能定义组织内的全部数据,应该关注关键的数据需求。这些需求可能是共享的,也可能只是单个系统生产和使用。但不管现在如何,随着时间的推移,企业的重要数据也会发生变化。关键数据的范畴会随着企业的变化而变化,应保持同步。

企业数据模型可以是自建,也可以外购。不同的企业数据模型在细节上差异较大,但成功的企业数据模型经常是通过递增和迭代开发出来的。分层次建造:
在这里插入图片描述

  • 分析并与其他业务模型匹配

信息价值链分析来源于业务价值链。业务价值链是定义组织中直接或间接贡献于组织最高目标的职能。如下图:(从左到右体现其依赖关系和事件发生顺序)
在这里插入图片描述

信息价值链分析映射出企业模型元素和其他业务模型的关系。是数据架构的输出,其每个矩阵是某一业务流程、组织或应用架构的一部分。是企业架构中不同类型的模型的粘合剂,需要数据管理领域不同角色共同负责。

  • 定义和维护数据技术架构

数据技术架构指导数据相关技术选择和整合,定义了标准的工具分类、每类中首选工具、技术标准以及技术整合协议等。

  • 定义和维护数据整合架构

数据整合架构定义了数据如何在各系统中流转。(又称为数据血缘关系或数据流)每个模型元素之间的关系,如同元素自身之间的关系一样重要。可以通过一系列的二维矩阵描述这些关系。除流程以外,还包括:

业务角色相关数据:描述哪些角色在哪些业务实体上负责创建、更新、删除和使用数据CRUD。
关于这些职责的特定业务组织数据。
关于跨业务职能的应用数据。
关于存在区域差异的不同区域数据。

矩阵是传统的企业建模方法。企业信息工厂CIF概念是数据整合架构的例子。一般来说,数据整合架构划分为支持商务智能的数据仓库、临时数据库、数据集市以及支持交易处理和操作型报表的源数据库、操作型数据存储ODS、主数据管理和参考数据/编码管理。

数据/流程关系矩阵可以有不同的细节层次。主题域、业务实体,甚至关键数据属性都可以在不通过层次上表达数据。高层的职能、中层的活动、底层的任务都代表了业务流程。通过数据整合架构对数据流的梳理,可以明确的体现出不同业务实体的生命周期状态,及状态转换。

  • 定义和维护数据仓库/商务智能

数据仓库架构关注数据变化,快照如何在数据仓库系统中存储以达到最大可用性和最高性能。数据整合架构显示了数据从源系统通过临时数据库进入数据仓库和数据集市的过程。商务智能架构定义了如何使数据用于决策支持,包括工具的选择和使用。

  • 定义和维护企业分类方法和命名空间

分类方法为话题提供大纲的层级结构,便于组织和查找。全面的企业数据架构应包括组织的分类方法。这样的分类使用的术语定义应与企业数据模型以及其他模型和分类系统一致。

  • 定义和维护元数据架构

元数据架构定义元数据的受控流程,定义元数据如何创建、整合、控制和访问。元数据存储是元数据架构的核心。

元数据架构是关于元数据如何在各类软件工具、数据存储、目录、术语和数据词典中的整合设计。数据整合架构关注如何确保参考数据、主数据、商务智能数据的质量、整合和有效使用。元数据架构则关注如何确保元数据的质量、整合和有效使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/191337.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++】从0到1入门C++编程学习笔记 - 提高编程篇:STL常用容器(vector容器)

文章目录一、vector基本概念二、vector构造函数三、vector赋值操作四、vector容量和大小五、vector插入和删除六、vector数据存取七、vector互换容器八、vector预留空间一、vector基本概念 功能: vector数据结构和数组非常相似,也称为单端数组 vector…

Discord多账号抢白名单,如何避免账号关联被封号?

相信玩NFT项目的都不会对Discord陌生,现在NFT的项目都会开Discord伺服器,并且将内容公告在上面、在伺服器里互动,所以如果你想参与NFT的世界,学会使用Discord是一件非常重要的事情。 东哥前2天也出了关于discord如何使用、如何抢白…

很多网站、APP 前段时间一下都变灰了。 先来感受一下变灰后的效果。

很多网站、APP 前段时间一下都变灰了。 先来感受一下变灰后的效果。 这种灰色的效果怎么实现的呢?如何做到图片、文字、按钮都变灰的效果呢? 方案 1,换一套灰色的 UI,那显然成本太大了,用脚指头想一想就知道不太可能…

C语言---选择排序和堆排序

文章目录前言一、简单选择排序1.简介2.算法思路3.代码实现二、堆排序1.简介2.算法思路3.代码实现总结前言 堆排序是选择排序的一种,今天我们讲解一下堆排序和简单选择排序 一、简单选择排序 1.简介 选择排序(Selection sort)是一种简单直观…

ZoomCharts JavaScript 1.20.2 Crack

深入探索数据 令人惊叹的数据可视化方式 - 这里是 ZoomCharts JavaScript 图表的不同交互可能性和功能。 内容向下钻取和向上钻取 深入研究特定数据点或获得更大的图景。通过放大或缩小与图表进行物理交互,浏览不同的数据级别。 数据过滤 选择一个或多个数据点查看具…

【软件测试面试】他凭什么能在面试中狂揽10个offer?

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 小高: 记…

2023年屏蔽iOS16系统更新,去除小红点,最新方法

昨天开始,屏蔽iOS系统更新的旧文件已经过期,许多老粉收到了更新提醒,因此现在给大家带来最新的屏蔽文件 这个文件可以屏蔽iOS系统更新和提醒,防止手机自动下载更新。 这个方法支持所有 iPhone 和 iPad,支持所有 iOS 和…

# Android未来几年发展规划【纵横发展】

前言 如果你是移动开发人员,那么首先要跟上技术的最新发展趋势,并时刻关注新事物,即使有时你甚至需要质疑自己的信仰。应用开发人员一方面一直在努力想办法简化和缩短开发过程,另一方面也在努力构建最佳的设计和用户体验。每年我…

【MPP数据库】StarRocks分区、分桶探索与实践

1.先学习一下StarRocks的架构图: 2.基本概念 2.1 Row & Column 一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。 Column 可以分为两大类:Key 和 Value…

leetcode刷题记录总结-7.递归回溯算法(进行中)

文章目录零、回溯算法理论总览什么是回溯法回溯法的效率回溯法解决的问题如何理解回溯法回溯法模板一、组合问题[77. 组合](https://leetcode.cn/problems/combinations/)题解递归实现组合型枚举:每个点选与不选子集问题模板组合问题解决思路回溯思路:遍…

GAMES101笔记:辐射度量学(上)

Radiometry 辐射度量学 如何描述光照,定义了一系列的方法和单位准确度量光的空间属性: Radiant fluxintensityirradianceradiance 以物理正确的方式进行光照计算 Radiant Energy and Flux (Power) Radiant Energy 定义 Radiant Energy 是电磁辐射的能…

6、数据的合并

目录 一、添加变量即横向合并。 二、添加个案即纵向合并 在实际工作中,为了提高效率,经常需要将一份数据分成几部分分别录入,或为了便于分析,又将几个数据文件合并成一个总的数据文件。为此,SPSS提供了两种合并数据文…

【7】【vue】【vue3】

1、项目结构: asserts用来存放静态资源的(一些图片,公共的css文件等) components用来存放vue的组件(vue是组件开发) App.vue是主入口组件 (根组件,所有组件都是从这里开始&#xff…

在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型

作为机器学习从业者,我们经常会遇到这样的情况,想要训练一个比较大的模型,而 GPU 却因为内存不足而无法训练它。当我们在出于安全原因不允许在云计算的环境中工作时,这个问题经常会出现。在这样的环境中,我们无法足够快…

万向节锁问题

以前一直听说过万向节锁当时觉得问题太难就没去认真分析最近在B站找了一些视频看懂了。简单来说旋转是有顺序的,比如transform面板有三个旋转分量,你先调整y,再调整x,最后调整z按照正常思路来说,调整x轴是在y轴旋转的基…

想成为数据分析师,看这里,数据分析必备的43个Excel函数

目录 前言 函数分类: 关联匹配类清洗处理类逻辑运算类计算统计类时间序列类 前言 Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具。 很多传统行业的数据分析师甚至只要掌握Excel和SQL即可。 对于初学者…

【DataX】datax | datax-web | win搭建datax-web环境

一、环境准备 1、jdk8 2、maven 3、mysql7 4、python3 5、window10 6、idea 7、2345解压(win支持tar.gz解压) 8、git 二、操作步骤 1、datax操作步骤 1)下载datax http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz 2&am…

ES6 环境下 Openlayers 集成使用 ol-ext 以及在线示例

ES6 环境下 Openlayers 集成使用 ol-ext 以及在线示例ol-ext 简介版本说明打包后体积集成方式在线示例最近打算重新封装一下 Openlayers,方便前端人员使用,基础功能没什么可说的,毕竟 Openlayers 的示例和 API 已经非常友好了。 想增加一些地…

2023-01-31 CSDN问答中如何防止和惩罚 “偷代码操作“

CSDN问答中如何防止和惩罚 "偷代码操作"前言一. 代码隐藏保护(CSDN官方回复目前无此功能)二. 先占位后抄袭的处理三. 编辑记录是照妖镜总结前言 随着问答的参与时间累积, 逐渐的碰到了一些问题, 常在河边走, 怎能不湿鞋, 原先看到抄代码结果原创没被采纳, 只能报以同…

AcWing 10. 有依赖的背包问题(分组背包问题 + 树形DP)

AcWing 10. 有依赖的背包问题(分组背包问题 树形DP)一、问题二、分析1、整体分析2、状态表示3、状态转移4、循环设计5、初末状态三、代码一、问题 二、分析 1、整体分析 这道题其实就是作者之前讲解过的一道题:AcWing 487. 金明的预算方案…