第十二章(重点 元数据管理)

news2024/9/20 22:21:51

语境关系图:

1. 元数据概念:

  • 元数据从技术的角度叫元数据

  • 从业务的角度叫数据资源管理目录

    技术 =元数据 业务= 数据资源管理目录 但是并不是数据资产目录

    如果没有可靠的原数据,组织就不知道它拥有什么数据,数据表示什么,数据来自何处,如何在系统中流转,谁有权访问,或者对于数据保持高质量的意义,如果没有元数据,组织就不能作为资产进行管理,实际上,如果没有元数据,组织根本无法管理数据

  • 与其他数据意义,元数据也是需要管理的

元数据管理原则和数据质量管理原则区别

元数据管理的一个原则是因规尽规,因收尽收

数据质量的原则是 重要的数据先来

元数据的定义:
  • 元数据最常见的定义是 "关于数据的数据" ,元数据相当于图书馆里面的目录卡片

2.目标和原则
目标
  1. 记录和管理与数据相关的业务术语的知识体系,以确保人们理解和使用数据内容的一致性

  2. 收集和整合来自不同来源的元数据,以确保人们了解来自组织不同部门的数据之间的相似与差异

  3. 确保元数据的质量、一致性、及时性和安全

  4. 提供标准途径,使元数据使用者(人员、系统和流程)可以访问元数据

  5. 推广或强制使用技术元数据标准,以实现数据交换

最终的目标就是查询与分析

原则
  • 组织承诺

  • 战略

  • 企业视角

  • 潜移默化

  • 访问

  • 质量

  • 审计

  • 改进

2. 元数据分类
  • 元数据分3种类型:

    1. 业务元数据

    2. 技术元数据

    3. 操作元数据

如何区别3种类型的元数据:

有定义或者描述基本是业务元数据

有物理的比如字段属性,表名等等基本数据技术元数据

日志类的基本都数据操作元数据

3. 元数据注册标准 ISO/IEC 11179
4. 非结构化数据的元数据

非结构化数据的元数据包括:

  • 描述元数据,如目录信息和同义关键字;

  • 结构元数据,如标签、字段结构、特定格式;

  • 管理元数据,如来源、更新计划、访问权限和导航信息;

  • 书目元数据,如图书馆目录条目;

  • 记录元数据,如保留策略;

  • 保存元数据,如存储、归档条件和保存规则

    (参见第9章)

5. 元数据来源(14+N)
  • (1)应用程序中元数据存储库

  • (2)业务术语表

  • (3)商务智能工具

  • (4)配置管理工具

  • (5)数据字典 (1对1)

    数据字典定义数据集的结构和内容,通常用于单个(不是多个)数据库、应用程序或数据仓库。

  • (6)数据集成工具

  • (7)数据库管理和系统目录

    数据库目录是元数据的重要来源,它们描述了数据库的内容、信息大小、软件版本、部署状态、网络正常运行时间、基础架构正常运行时间、可用性,以及许多其他操作元数据属性。

  • (8)数据映射管理工具

  • (9)数据质量工具

  • (10)字典和目录

  • (11)事件消息工具

  • (12)建模工具和存储库

  • (13)参考数据库

  • (14)服务注册

  • (15)其他元数据存储

6 元数据架构类型
  • (1)集中式元数据架构

  • (2)分布式元数据架构

  • (3)混合式元数据架构

  • (4)双向元数据架构

方法

数据血缘和影响分析
  • 血缘分析(比如报告出错 查找问题是什么原因引起的) 由下往上追溯

  • 影响分析(比如改了某个字段 查找对系统有哪些影响) 由上往下追溯

度量指标

  • 1)元数据存储库完整性

  • 2)元数据管理成熟度

  • 3)专职人员配备

  • 4)元数据使用情况

  • 5)业务术语活动

  • 6)主数据服务数据遵从性

  • 7)元数据文档质量

  • 8)元数据存储库可用性

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1965254.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

运行ruoyi

创建数据库 根据ry_20240629.sql创建ry-cloud数据库 根据ry_config_20231204.sql创建ry-config数据库 nacos 数据库配置 修改nacos/conf/application.properties 单机版运行 startup.cmd -m standalone redis 运行后端 运行gateway,auth,modules/system模块 可能遇到的问…

怎么给电脑选一款合适的固态硬盘?就看这个参数!

前言 前段时间有很多小伙伴找小白修电脑,在修电脑的过程中,小白也会稍微看一下硬件配置。 小白就发现一个事情:很多小伙伴其实都不太懂电脑硬件。 为啥这么说呢?简单来说就是主板上使用了“不合适”的固态硬盘作为主系统硬盘。…

VulnHub-Tomato靶机渗透教程 简单易懂 报错链接

Tomato靶机是一个用于渗透测试和漏洞研究的虚拟机。 环境准备 攻击机(Kali Linux)IP:192.168.252.134 目标机 IP:192.168.252.133 这里我两台虚拟机都是NAT模式 渗透步骤 1.端口扫描 这里我没用kali自带的 我用的物理机上…

【Python学习手册(第四版)】学习笔记12.1-语法规则拓展

个人总结难免疏漏,请多包涵。更多内容请查看原文。本文以及学习笔记系列仅用于个人学习、研究交流。 本文是对【学习笔记10】-语句编写的通用规则 介绍过的语法概念进行复习并扩展。非常简单,应该是我写过的最简单的文章,阅读时间&#xff1a…

学习Mybatis及其简单配置

目录 JDBC的弊端 为什么要有ORM模型? 什么是ORM模型? Mybatis和hibernate 区别: Mybatis解决了jdbc的问题 为什么选择myBatis(优势)? 什么是MyBatis 主配置文件(config文件) Mapper文件…

TwinCAT3 C++环境安装教程

文章目录 下载windos插件:下载地址,安装这个插件是为了能在 TwinACT 3 工程环境创建和编辑 C模块。 点击下载的文件,打开其中的KitSetup.exe 在打开的窗口中选择"Build Environment"后点击OK 弹出的窗口点击ok 选择“I agree”后点击…

从零逐步实现SVM(含公式推导)上

支持向量机(SVM)相关概念 支持向量:支持或支撑平面上把两类类别划分开的超平面的向量点线性可分支持向量机:通过硬间隔最大化,学习一个线性分类器线性支持向量机:通过软间隔最大,学习一个线性分…

掌握时间的秘密:pytz 库的神奇之旅

文章目录 掌握时间的秘密:pytz 库的神奇之旅背景:为何选择 pytz?pytz 库是什么?如何安装 pytz?函数的使用方法场景应用常见问题与解决方案总结 掌握时间的秘密:pytz 库的神奇之旅 背景:为何选择…

【Vue3】默认插槽

【Vue3】默认插槽 背景简介开发环境开发步骤及源码 背景 随着年龄的增长,很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来,技术出身的人总是很难放下一些执念,遂将这些知识整理成文,以纪念曾经努力学习奋斗的日子。本文内…

学习c语言第18天(字符串和内存函数)

1.函数介绍 1.1 strlen size_t(就是无符号整形) strlen(const char * str); 字符串已经\0作为结束标志,strlen函数返回的是在字符串中\0前面出现的字符个数(不包 含\0) 参数指向的字符串必须要以\0结束。 注意函数的返回值为size_t,…

Java并发—Java内存模型以及线程安全

目录 一、Java内存模型 JMM的核心概念 二、什么是线程安全? 1、原子性 2、有序性 3、可见性 三、如何确保线程安全? 1、sychronized关键字 2、Lock接口和其实现 3、volatile关键字 4、Atomic原子类 5、ThreadLocal 6、不可变对象 7、并发集…

电商数据采集封装API的详细步骤分享(API测试实例)

在当今的电商行业中,数据采集已成为企业获取市场洞察、优化运营策略、提升用户体验的重要手段。而封装电商数据采集的API接口,则是将这一复杂过程标准化、模块化的有效方式。本文将详细分享电商数据采集封装API的步骤,并通过一个实际的API测试…

努力努力努力的第十四天(2024.7.31)

昨天日期写错了写成2020.7.30,应该是2024.7.31(手滑了哈哈哈) 1.行列转换 效果演示: 这是未经行列转换操作的t_score表: 这是经过行列转换后的t_score表: 第一步:确定初步的做法 使用分组查询(group by…

20240731在WIN10下数框框的方法【CPU】

20240731在WIN10下数框框的方法【CPU】 2024/7/31 20:14 百度:WINDOWs 10 多核CPU 数框框 win10怎么数框框 1、首先打开win10系统,进入任务管理器。 2、其次点击CPU使用率窗口,鼠标悬停在右边的窗口按右键。 3、最后将图形更改为:…

【计算机网络】http协议的原理与应用,https是如何保证安全传输的

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

优化|高性能模块预测控制求解器

本文介绍的是另外一种针对模块控制MPC问题的一种高效求解方法。High-Performance Small-Scale Solvers for Linear Model Predictive Control,Gianluca Frison, Hans Henrik Brandenborg Srensen, Bernd Dammann, John Bagterp Jrgensen [1]。本文讲了HPIPM的前身&a…

Phalco安装过程以及踩的一些坑(mac环境)

一 背景 公司用Phalcon框架好长时间了,中途发现了一些Phalcon使用的上的问题,于是想在本地搭建一套Phalcon的环境,方便排查问题使用。 二 Mac系统下的安装 看了很多说法,最终发现还是官网给力,安装Phalcon使用下列命令即可(前提条件是PHP已安装好,工具pecl也安装好了):…

2024-07-31 Android studio gradle、sdk、ndk 等路径记录

一、gradle的下载路径:C:\Users\user\.gradle\wrapper\dists 二、NDK下载路径C:\Users\user\AppData\Local\Android\Sdk\ndk 三、SDK下载路径:C:\Users\user\AppData\Local\Android\Sdk\platforms

数据结构的基本概念与算法

数据结构的基本概念与算法 什么是数据? 数据是信息的载体,是描述客观事物属性的数、字符以及所有能输入到计算机中并被计算机程序识别和处理的符号的集合;总结来说 -> 数据就是计算机程序加工的原料; 数据元素、数据项&#xf…

Python+Vue3+onlyoffice开发私有化文档管理系统实战笔记 20240731

之前进度 表字段设计如下: const columns [{title: 名称,key: name,dataIndex: name,},{title: 类型,key: category,dataIndex: category,},{title: 作者,key: author,dataIndex: author,},{title: 路径,key: path,dataIndex: path,},{title: 最近访问时间,key: l…