【华为数据之道学习笔记】3-1 基于数据特性的分类管理框架

news2024/11/30 11:53:09
        华为根据数据特性及治理方法的不同对数据进行了分类定义:内部数据和外部数据、结构化数据和非结构化数据、元数据。其中,结构化数据又进一步划分为基础数据、主数据、事务数据、报告数据、观测数据和规则数据。
        对上述数据分类的定义及特征描述。
分类维度
数据分类名称
定义
特征
举例
按数据主权所属华为内部/外部数据
External Data(外部数据)
华为通过公共领域获取的数据
客观存在,其产生、修改不受我司影响
国际、币种、汇率
从数据存储特性分为结构化和非结构化数据
Internal Data(内部数据)
企业内部经营生产的数据
在企业的业务流程中产生或在业务管理规则中定故意,受企业经营影响
合同、项目、组织
Structured Data
(结构化数据)
可以存储在关系数据库里,用二维表结构来表达实现的数据
1)可以用关系数据库存储
2)先有数据结构,再产生数据
国家、币种、组织、产品、客户
Unstructured Data
(非结构化数据)
形式相对不固定,不方便用数据库二维逻辑表来表现的数据
1)形式多样,无法用关系数据库存储
2)数据量通常较大
网页、图片、视频、音频、XML
Reference Data
(基础数据)
用结构化的语言描述属性,用于分类或目录整编的数据,也称作参考数据
1)通常有一个有限的允许/可选值范围
2)静态数据,非常稳定,可以用作业务/IT的开关、职责/权限的划分或统计报告的维度
合同类型、职位、国家、币种
Master Data
(主数据)
具有高业务价值的,可以在企业内跨流程跨系统被重复使用的数据,具有唯一、准确、权威的数据源
1)通常是业务事件的参与方,可以在企业内跨流程、跨系统重复调用
2)取值不受限于预先定义的数据范围
3)在业务事件发生之前就客观存在,比较稳定
实体型组织、客户、人员基础配置
Transactional Data
(事务数据)
用于记录企业经营过程中产生的业务事件,其实质是主数据之间活动产生的数据
1)有较强的时效性,通常是一次性的
2)事务数据无法脱离主数据独立存在
BOQ、支付指令、主生产计划
Observational Data
(观测数据)
观测者通过观测工具获取观测对象行为/过程的记录数据
1)通常数据量较大
2)数据是过程性的,主要用作监控分析
3)可以由机器自动采集
系统日志、物联网数据、运输过程中国产生的GPS数据
Conditional Data
(规则数据)
结构化描述业务规则变量(一般为决策表、关联关系表、评分卡等形式)的数据,是实现业务规则的核心数据
1)规则数据不可实例化,只以逻辑实体形式存在
2)规则数据的结构在纵向和横向两个维度上相对稳定,变化形式多为内容刷新
3)规则数据的变更对业务活动的影响是大范围的
员工报销遵从性评分规则、出差补助规则
Report Data
(报告数据)
是指对数据进行处理加工后,用作业务决策依据的数据
1)通常需要对数据进行加工处理
2)通常需要将不同来源的数据进行清洗、转换、整合,以便更好地进行分析
3)维度、指标值都可归入报告数据
收入、成本
从描述数据的手段上分类
Meta-data
(元数据)
定义数据的数据,是有关一个企业所使用的物理数据、技术和业务流程、数据规则和约束以及数据的物理与逻辑结构的信息
是描述性标签,描述了数据(如数据库、数据元素、数据模型)、相关概念(如业务流程、应用系统、软件代码、技术架构)以及它们之间的联系(关系)
数据标准、业务术语、指标定义
        不同分类的数据,其治理方法有所不同。如基础数据内容的变更通常会对现有流程、IT系统产生影响,因此基础数据的管理重点在于变更管理和统一标准管控。主数据的错误可能会导致成百上千的事务数据错误,因此主数据的管理重点是确保同源多用、重点进行数据内容的校验等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1290652.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022年第十一届数学建模国际赛小美赛B题序列的遗传过程解题全过程文档及程序

2022年第十一届数学建模国际赛小美赛 B题 序列的遗传过程 原题再现: 序列同源性是指DNA、RNA或蛋白质序列之间的生物同源性,根据生命进化史中的共同祖先定义[1]。DNA、RNA或蛋白质之间的同源性通常根据它们的核苷酸或氨基酸序列相似性来推断。显著的相…

AWS re:Invent 2023-亚马逊云科技全球年度技术盛会

一:会议地址 2023 re:Invent 全球大会主题演讲 - 亚马逊云科技从基础设施和人工智能/机器学习创新,到云计算领域的最新趋势与突破,倾听亚马逊云科技领导者谈论他们最关心的方面。https://webinar.amazoncloud.cn/reInvent2023/keynotes.html北京时间2023年12月1日00:30-02:…

解决mybatis-plus中,当属性为空的时候,update方法、updateById方法无法set null,直接忽略了

问题描述 当indexId set 22的时候是可以set的 我们发现sql语句也是正常的 表中数据也被更改了 但是当我们indexId为空的时候 sql语句中没有了set indexId这一属性。。 既然属性都没了,表是肯定没做修改的 问题解决 在实体类对应的字段上加注解TableField(strategy…

“城中村上建高楼”,开启一场数智化时代新修炼

“数字化也好,数智化也罢,你明明白白地告诉我,他们与信息化到底有什么区别?” “我在信息化方面已投入那么多,为什么又要投那么多钱搞数智化?” 中国软件网、海比研究院在《2024中国企业数智服务趋势洞察研…

Linux进程解析(冯诺依曼体系结构,操作系统,进程初步解析)

冯诺依曼体系结构: 我们常见的计算机,如笔记本。我们常见的计算机,服务器,大部分都遵守冯诺依曼体系。 截至目前,我们所认识的计算机,都是有一个个的硬件组件组成: 中央处理器(CPU)&am…

Stm32_串口的帧(不定长)数据接收

目录标题 前言1、串口中断接收固定帧头帧尾数据1.1、任务需求1.2、实现思路1.3、程序源码: 2、串口中断接收用定时器来判断帧结束3、串口中断接收数据空闲中断3.1、串口的空闲中断3.2、实现思路3.3、程序源码 4、串口的空闲中断DMA转运4.1、DMA简介4.2、DMA模式4.3、…

【从0配置JAVA项目相关环境2】node.js + 前端 从配置到运行

运行前端项目 写在最前面一、安装node.js二、运行前端项目1. 运行 npm install2. 运行 npm run serve报错Error: error:0308010C:digital envelope routines::unsupported方法1:设置 NODE_OPTIONS (没用)方法2:更改Node.js版本方法…

我把springboot项目从Java 8 升级 到了Java 17 的过程总结,愿为君提前踩坑!

项目从jdk8升级到jdk17,我不是为了追求java 17的新特性(准确来说也还没有去了解有什么新特性),也不是为了准确与时俱进,永远走在java行列的最前端,纯粹因为项目需要,因为我们都知道,…

日志框架梳理(Log4j,Reload4j,JUL,JCL,SLF4J,Logback,Log4j2)

原文链接 日志框架发展历程 在了解日志框架时总会列出一系列框架:Log4j,Reload4j,JUL,JCL,SLF4J,Logback,Log4j2,这么多框架让人感到混乱,该怎么选取、该怎么用。接下来…

LV.12 D23 IIC控制器与MPU6050 学习笔记

一、Exynos_4412下的IIC控制器 ​ 4412有四个IIC,如果要使用需要配置四个寄存器 I2CCON:配置一些功能 I2CSTAT:控制一些功能、显示一些状态 I2CDS:发送和接收数据 I2CADD:当4412作为从机时需要一个地址&#xff…

亚马逊云科技Serverless视频内容摘要提取方案

概述 随着GenAI的普及,视频内容摘要生成成为一个备受关注的领域。通过将视频内容转化为文本,可以探索到更广泛的应用场景,其中包括: 视频搜索与索引:将视频内容转化为文本形式,可以方便地进行搜索和索引操作…

利用阿里云 DDoS、WAF、CDN 和云防火墙为在线业务赋能

在这篇博客中,我们将详细讨论使用阿里云 CDN 和安全产品保护您的在线业务所需的步骤。 方案描述 创新技术的快速发展为世界各地的在线业务带来了新的机遇。今天的人们不仅习惯了,而且依靠互联网来开展他们的日常生活,包括购物、玩游戏、看电…

HarmonyOS4.0从零开始的开发教程04 初识ArkTS开发语言(下)

HarmonyOS(二) 初识ArkTS开发语言(下)之TypeScript入门 声明式UI基本概念 应用界面是由一个个页面组成,ArkTS是由ArkUI框架提供,用于以声明式开发范式开发界面的语言。 声明式UI构建页面的过程&#xff…

打包 抖音直播云游戏

抖音直播云游戏 oaid资源中的bcpkix-jdk15to18-1.68.jar与抖音云游戏的资源冲突。 其实资源名称是一样的,拷贝时资源名称有变化。 为解决此问题,需要规范化文件的资源名称,将.置为_ Error: Command failed: cmd /c echo off && Chc…

Kubernetes(K8s)DashBoard的使用-11

DashBoard 之前在kubernetes中完成的所有操作都是通过命令行工具kubectl完成的。其实,为了提供更丰富的用户体验,kubernetes还开发了一个基于web的用户界面(Dashboard)。用户可以使用Dashboard部署容器化的应用,还可以…

Redis key过期删除机制实现分析

文章目录 前言Redis key过期淘汰机制惰性删除机制定时扫描删除机制 前言 当我们创建Redis key时,可以通过expire命令指定key的过期时间(TTL),当超过指定的TTL时间后,key将会失效。 那么当key失效后,Redis会立刻将其删除么&#…

k8s 安装 Longhorn

Longhorn 的 helm 模板官网地址:Longhorn 加入仓库 helm repo add longhorn https://charts.longhorn.iohelm repo update开始部署 helm install longhorn longhorn/longhorn --namespace longhorn-system --create-namespace --version 1.5.3检查pod运行状态是…

STM32——电动车报警器

项目设计 // 如果检测到 PA4 被拉低(小偷偷车),并且警报模式打开 // 则将 PB7 拉低,继电器通电,喇叭一直响 // 如果检测到 PA5 被拉高(按键 A 按下),设定为开启警报模式 // 则将…

0X05

打开题目 点击完登录和注册都没有什么反应,所以先扫一下看看 在出现admin.php后就截止了,访问看看,进入后台。。 尝试一下弱口令 admin/12345 或者是demo/demo 设计中-自定义->右上角导出主题 找到一个导出的点,下载了一个1.zip压缩包…

多传感器融合SLAM在自动驾驶方向的初步探索的记录

1. VIO的不可观问题 现有的VIO都是解决的六自由度的问题, 但是对于行驶在路面上的车来说, 通常情况下不会有roll与z方向的自由度, 而且车体模型限制了不可能有纯yaw的变换. 同时由于IMU在Z轴上与roll, pitch上激励不足, 会导致IMU在初始化过程中尺度不准以及重力方向估计错误,…