6.5 方法
6.5.1 数据结构
数据架构应该能够处理:
- 静态数据——存储中的数据
- 动态数据——事务或服务/API 中的数据
- 使用中的数据——应用边界的数据(例如,GUI)
- 开放数据——组织提供给公众使用并且自愿或合法要求提供的数据
将添加处理这些类型的数据架构不同替代方法。
数据架构是通过使用三个元模型实体创建的:数据实体、逻辑数据组件和物理数据组件。
数据实体可用于创建概念数据模型,以帮助 IT 开发人员理解他们将要处理的概念。通常实体关系模型还包含对关系的一些要求(例如,一个客户只能有一个地址)。
逻辑数据组件可用于创建逻辑数据模型。对于 IT 领域来说,清楚地了解 IT 环境中使用的所有数据通常很重要。逻辑数据模型通常用作对存储在应用中的数据(静态)、在应用之间移动的数据(动态)或应用用户界面处的数据(使用中)的要求。
物理数据组件是已由之前的项目实施的逻辑数据组件的集合(与XML消息、数据库模式等存在链接)或新实施项目的要求。
所有三个数据实体都可以用于数据交换模型中,用于在 IS 服务、逻辑应用组件或物理应用组件之间/进出/传递数据。
所有数据实体都可以具有特定情况下的质量属性。
6.5.2 数据架构的关键考虑因素
6.5.2.1 数据管理
当企业选择进行大规模架构转型时,了解和解决数据管理问题非常重要。结构化和全面的数据管理方法可以有效地利用数据来利用其竞争优势。
考虑因素包括:
- 明确定义环境中的哪些应用组件将用作系统记录或参考的企业主数据
- 是否将有一项企业范围的标准,所有应用组件(包括软件包)都需要采用?
(总的来说,包可以对数据模型进行规定,并且可能不灵活。)
- 清楚地了解业务能力、业务功能、流程以及业务和应用服务如何使用数据实体
- 清楚地了解企业数据实体是如何创建、存储、传输和报告的
- 支持应用之间的信息交换需求所需的数据转换的级别和复杂性是多少?
- 对支持与企业客户和供应商进行数据集成的软件有什么要求(例如,在数据迁移期间使用提取、转换、加载 (ETL) 工具,评估数据质量的数据分析工具等)?
有关数据管理的更多指导,请参阅 TOGAF® 系列指南:信息架构 — 客户主数据管理。
6.5.2.2 数据迁移
当现有应用被替换时,将存在对新应用程序进行数据迁移(主数据、事务数据和参考数据)的关键需求。数据架构应该确定数据迁移的要求,并提供指示,以了解所需的转换、清理和整理的程度,以便以符合目标应用程序的要求和约束的格式呈现数据。目标是目标应用在填充时具有质量数据。另一个关键考虑因素是确保建立企业范围的通用数据定义以支持转换。
6.5.2.3 数据治理
数据治理考虑事项确保企业具备必要的维度,以促进转型,如下所示:
- 结构:该维度涉及企业是否具备必要的组织结构和标准机构,以管理转型过程中与数据实体相关的方面
- 管理系统:在这方面,企业应该有必要的管理系统和数据相关计划,以管理数据实体在其整个生命周期中的治理方面
- 人员:这个维度解决了企业在转型中需要哪些与数据相关的技能和角色
如果企业缺乏这样的资源和技能,企业应该考虑要么获得这些关键技能,要么通过明确定义的学习计划培训现有的内部资源以满足要求。
6.5.3 架构库
作为此阶段的一部分,架构团队将需要考虑组织的架构库中有哪些相关的数据架构资源可用(请参阅TOGAF 标准 - 架构内容);特别是与组织的行业“垂直”部门相关的通用数据模型。