数据治理006-数据标准的管理

news2025/1/4 15:30:16

元数据的分类和标准有哪些?

一、元数据的分类

元数据可以根据其描述的对象和属性不同,被分为不同的类型。以下是几种常见的元数据分类方法:
基于数据的类型:根据数据的类型,元数据可以被分为结构化元数据、非结构化元数据、半结构化元数据等。
基于数据的来源:根据数据的来源,元数据可以被分为内部元数据和外部元数据。内部元数据来自于组织内部的业务系统和数据仓库,而外部元数据则来自于外部的数据源,如政府公开数据、第三方数据等。
基于元数据的应用场景:根据元数据的应用场景,元数据可以被分为电子商务元数据、社交媒体元数据、金融服务元数据等。

二、元数据的标准

为了更好地管理和控制元数据,需要建立统一的元数据标准。元数据标准化的目的是为了实现不同系统之间的数据共享和互操作,提高数据处理效率和质量。以下是几种常见的元数据标准:
ISO/IEC 11179:ISO/IEC 11179是一种国际标准的元数据规范,它定义了元数据的概念、属性、关系和规则。ISO/IEC 11179包括三个部分:元数据的规范、元数据的注册和元数据的交换。
Dublin Core:Dublin Core是一种用于描述网络资源的元数据标准,它包括15个核心元素,如标题、描述、创作者、发布日期等。Dublin Core被广泛应用于数字图书馆、数字遗产、数字出版等领域。
EDIMA:EDIMA是一种用于电子数据交换的元数据标准,它定义了电子单据的结构和内容。EDIMA包括三个部分:EDI对象模型、EDI元数据规范和EDI报文规范。
JSON LD:JSON LD是一种用于描述网络资源的轻量级元数据标准,它可以将JSON格式的数据映射为RDF格式的数据。JSON LD被广泛应用于语义网、知识图谱等领域。

总之,元数据的分类和标准是元数据管理的重要基础。通过对元数据进行分类和标准化,可以更好地描述和理解数据的属性、特征和关系,促进不同系统之间的数据共享和互操作,提高数据处理效率和质量。
同时,为了更好地管理和控制元数据,还需要引入元数据管理平台。元数据管理平台可以帮助组织统一管理元数据,包括元数据的采集、清洗、存储、查询、分析和可视化等。通过元数据管理平台,可以更好地保证元数据的准确性、完整性和一致性,提高数据处理的质量和效率。

数据标准的管理

2024年全国数据工作会议,国家数据局局长刘烈宏表示,将建立健全国家数据标准化体制机制,研究成立全国数据标准化技术委员会,统筹指导我国数据标准化工作,加快研究制定一批数据领域国家和行业标准。

将加强标准引领,印发国家数据标准体系建设指南,指导发布数据要素流通标准化白皮书。

数据标准是企业在提升数据质量过程中不可或缺的要素。

数据标准涉及对数据的命名、定义、结构和取值的规范,为数据的内外部使用和交换提供一致性和准确性的保障。

数据标准的定义

数据标准的权威定义可以参考一些国际标准组织和权威机构的定义,以下是两个常用的权威定义

1、ISO/IEC 11179

ISO/IEC 11179 是一个关于元数据注册的国际标准。根据该标准,数据标准被定义为:

“数据标准是关于数据的内容、格式和结构的规则和指南,用于确保数据的一致性、准确性和完整性。”

2、DAMA(数据管理协会)定义

DAMA是一个权威的数据管理专业组织,根据 DAMA 数据管理知识体系(DAMA-DMBOK),数据标准被定义为:

“数据标准是用于定义、管理和控制数据的一致性和质量的规范、指南和规则。这些标准包括数据定义、数据格式、数据命名和数据编码等方面。”

在这里插入图片描述

数据标准的维度分类

数据标准的构成维度涵盖标识、定义、关系、表示和附加等类别。
在这里插入图片描述

数据标准的重要性

数据标准统一了数据的命名、定义和格式,使数据更加规范和实用。

增强数据的一致性和准确性:数据标准化确保了数据在不同系统和应用中的一致性,减少了由于数据歧义导致的错误。
促进数据的共享和交换:通过标准化的数据格式和定义,数据可以在不同部门和系统之间无缝流动,提高数据利用率。
提高数据管理效率:标准化的数据管理使数据的维护和更新更加高效,降低了管理成本。
增强数据的安全性和合规性:数据标准包括对数据敏感性和版本控制的管理,确保数据在使用和保护方面符合相关法规和政策。
统一基础数据:便于业务数据的汇总、报送、分析应用。

数据标准建立的要求

制度保障先行:应在制度中明确各个角色以及定义相应的分工界面,固化管理流程,为制定数据标准、管理数据标准提供指导性意见。
归口部门发挥牵头作用:归口管理部门需积极发挥带头作用,推动和监督标准管理流程的执行。通过激励和问责考核体系,推进数据标准工作的制定与执行落地。
自上而下、自下而上:制定过程中一方面需要自下而上梳理信息系统中的数据情况,同时也需要自上而下定义数据主题、细化分类,两者结合才能实现全面整体的数据视图,形成有效的数据规范要求。
实际需求为根本:需要明确以需求为根本,根据业务实际个性化的制定数据标准,避免造成难以落地的情况。

ISO/IEC 11179元数据注册标准

提供了用于定义元数据注册的框架,旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。(尝试着在网上找11179这套标准的详细内容,没有找到)

元数据项类型:在对元数据进行管理维护时,则存在被管理的元数据项。一般常见管理的元数据项分为分类模式、概念域、数据元概念、数据元、值域、表示类型等。在GB/T 18391 / ISO/IEC 11179中规定了列出部分元管理项的类型(见图1),同时也支持以附件类型进行添加和扩展。
在这里插入图片描述
元数据模型:用来描述元数据的模型通常称为元模型,改为:是指人们对描述元数据以及元数据之间关系理解的表达,也称为概念模型。如在进行数据元的管理维护时,通用使用GB/T18391 / ISO/IEC 11179中推荐的数据元的元数据模型(见图2)。该模型由概念层和表示层两部分组成,概念层包括数据元概念类和概念域类,都表示概念;表示层包括数据元类、值域类,都表示数据值的容器。
在这里插入图片描述

什么是数据元?

在GB/T 18391(ISO/IEC 11179)中,有一组属性规定其定义、标识、表示和允许值的数据单元,也称为数据元素。在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。一个数据元由数据元概念和表示组成。

数据元概念:数据概念是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由以下两部分组成:
a. 对象类:可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合;
b. 特性:一个对象类所有成员所共有的特性,

表示:由值域、数据类型、计量单位(如何需要)、表示类型(可选)组成。
在这里插入图片描述

我国卫生信息元数据相关标准

我国卫生信息领域的元数据相关标准也都是在参考GB/T 18391 / ISO/IEC 11179《信息技术 元数据注册系统》的基础之上,结合卫生信息领域的元数据特性进行针对性扩展。目前已发布的元数据项类型有:数据元、值域、数据集、统计指标。

1、数据元

我国卫生信息数据元目录标准17个部分,包括1份总则和16份不同类别的数据元内容。已发布的数据元相关标准清单如下:
在这里插入图片描述
该标准规范中,将数据元的允许值分为可枚举和不可枚举两种类型:

可枚举值域:由允许值列表规定的值域,每个允许值的值和值含义成对表示,分为可选值较少的、可选值较多的两种。
a. 可选值较少的(如3个或以下):在数据元属性中直接列举;
b. 可选值较多的(如3个以上):在数据元属性中写出所引用的值域代码,若为外部标准,则注明标准号;
不可枚举值域:由描述规范的值域,且在数据元属性中准确描述该值域的允许值;

2、值域代码

我国卫生信息数据元值域代码标准分为17个部分,包括1份总则、1份标识规则和15份不同类别的值域代码内容。已发布的值域代码相关标准清单如下:
在这里插入图片描述

3、数据集

我国卫生信息领域中,为了满足各业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合,即基本数据集。

目前,我国卫生信息基本数据集分为基本信息、卫生服务、卫生管理、卫生综合四大类,其中卫生服务又分为儿童保健、妇女保健、疾病控制、疾病管理、医疗服务五小类;每个分类下包括多个数据集,如卫生综合分类下包括1份居民健康档案基本数据集和17份电子病历基本数据集。已发布的基本数据集相关标准清单如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
我国卫生信息卫生统计指标标准分为9个部分,包括1份总则和8份不同类别的卫生统计指标内容。已发布的统计指标相关标准清单如下:
在这里插入图片描述

引用:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2185794.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WPF用户控件的使用

WPF用户控件的使用 先看一下程序结构&#xff1a; WPF_Test是我的主程序&#xff1b;WPF_LIB是我添加的一个用户控件库&#xff0c;其中UserControl1是一个用户控件&#xff1b; 用户控件xaml代码&#xff1a; <UserControl x:Class"WPF_LIB.UserControl1"xmln…

爵士编曲:爵士钢琴编写的规律和步骤 关于教程的个人想法 举一反三

反思了下自己目前学习编曲和其他兴趣爱好时暴露出来的问题&#xff0c;就是举一反三的能力还有待提高&#xff01;平时多学习和多对学习内容进行举一反三&#xff0c;也就是根据一个例子&#xff0c;创作出类似的3个以上的例子&#xff0c;这样才算学会&#xff0c;并且事半功倍…

2024必备英语在线翻译工具推荐

英语在线翻译工具就如同一位随时待命的语言助手&#xff0c;为我们打破语言障碍&#xff0c;搭建起沟通的桥梁。接下来&#xff0c;让我们一起深入了解这些英语在线翻译工具的丰富功能及其为我们带来的便利。 1.福昕在线翻译 链接直达>>https://fanyi.pdf365.cn/doc …

【含文档】基于Springboot+微信小程序 的海产品加工销售一体化管理系统(含源码+数据库+lw)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 系统定…

基于SpringBoot+Vue+MySQL的民宿预订平台

系统展示 用户前台界面 管理员后台界面 商家后台界面 系统背景 随着旅游业的蓬勃发展&#xff0c;民宿作为一种独特的住宿方式&#xff0c;受到了越来越多游客的青睐。然而&#xff0c;传统的民宿预定方式往往存在信息不对称、效率低下等问题&#xff0c;难以满足游客的个性化需…

python的内存管理机制

python的内存管理机制主要分为三个部分&#xff1a;引用计数、垃圾回收和内存池机制。 引用计数机制&#xff1a; python通过维护每个对象的引用计数来跟踪内存中的对象。当对象被创建时就会有一个引用计数&#xff0c;当对象不再被使用时&#xff0c;引用计数为0&#xff0c…

Android SystemUI组件(08)睡眠灭屏 锁屏处理流程

该系列文章总纲链接&#xff1a;专题分纲目录 Android SystemUI组件 本章关键点总结 & 说明&#xff1a; 说明&#xff1a;本章节持续迭代之前章节的思维导图&#xff0c;主要关注左侧上方锁屏分析部分 睡眠灭屏 即可。 Power按键的处理逻辑最终是由PhoneWindowManager来完…

【电路基础 · 2】电阻电路的等效变换(自用)

总览 1.电路的等效变换 1.1 电阻电路 1.2 等效变换是什么 1.3 线性电路和非线性电路 1.4 时变电路和非时变电路 1.5 二端网络&#xff08;一端口网络&#xff09;、四端网络&#xff08;二端口网络&#xff09;、六端网络&#xff08;三端口网络&#xff09; 1.6 两端电路的等…

每日一题:二分查找

文章目录 一、思路一&#xff1a;常规思路1、寻找固定值2、寻找左边界3、寻找右边界 二、思路二&#xff1a;红蓝法二分三、模板题1、二分查找2、在排序数组中查找元素的第一个和最后一个位置 二分查找&#xff0c;顾名思义&#xff0c;就是每次筛选能晒掉一半的数据。 二分查…

leetcode每日一题day22(24.10.2)——准时到达的列车最小度

思路&#xff1a;这种在有约束条件情况下&#xff0c;求最值或最符合要求的情况&#xff0c;首先是很容易想到&#xff0c;从时速为1开始往后找找到满足条件就输出&#xff0c;但这无疑工程量很大&#xff0c;每种可能的速度都要对列车数组进行遍历&#xff0c; 时间复杂度为C…

数据库第8章编程题2

10-1 查询选修某两门课程的学生&#xff08;MSSQL) 本题目要求编写SQL语句&#xff0c; 检索出 sc表中至少选修了’C001’与’C002’课程的学生学号。 提示&#xff1a;MSSQLServer 评测SQL语句。 表结构: 请在这里写定义表结构的SQL语句。例如&#xff1a; -- 学生选课成…

Pikachu-Cross-Site Scripting-存储型xss

存储型xss &#xff0c;随便输入点内容&#xff0c;都能保存下来&#xff1b;刷新后也不会丢失&#xff1b;输入特殊字符&#xff0c;也能原样返回&#xff1b; 查看代码&#xff0c;也可以看到输出结果直接原路返回&#xff0c;不做处理 构造payload <script>alert(1)…

深度学习:cGAN和pix2pix图像转换

cGAN和pix2pix的基础概念 cGAN cGAN是条件生成对抗网络&#xff08;Conditional Generative Adversarial Networks&#xff09;的简称。 它是一种基于基础GAN&#xff08;Generative Adversarial Networks&#xff09;架构的变体&#xff0c;通过给GAN模型引入额外的信息或条…

翔云 OCR:发票识别与验真

在数字化时代&#xff0c;高效处理大量文档和数据成为企业和个人的迫切需求。翔云 OCR 作为一款强大的光学字符识别工具&#xff0c;在发票识别及验真方面表现出色&#xff0c;为我们带来了极大的便利。 一、翔云 OCR 简介 翔云 OCR 是一款基于先进的人工智能技术开发的文字识别…

酒店智能门锁SDK接口pro[V10] 门锁校验C#-SAAS本地化-未来之窗行业应用跨平台架构

一、代码 int 酒店标识_int Convert.ToInt32(酒店标识);StringBuilder 锁号2024 new StringBuilder(8);//信息 "未知返回值&#xff1a;" bufCard_原始;GetGuestLockNoByCardDataStr_原始(酒店标识_int, bufCard_原始.ToString(), 锁号2024);StringBuilder 退…

Pie-饼图

参考文档&#xff1a;Pie - Pie_set_color - Document (pyecharts.org) 模板 from pyecharts import options as opts from pyecharts.charts import Pie from pyecharts.faker import Faker"""1-Pie() 创建Pie对象2-.add("", [list(z) for z in zi…

CSS 圆形边框与阴影

目录 1. 圆角边框 1.1 正圆 1.2 圆角矩形 1.3 任意圆角 1.4 某个圆角 2. 盒子阴影 3. 文字阴影 1. 圆角边框 1.1 正圆 1.2 圆角矩形 1.3 任意圆角 1.4 某个圆角 2. 盒子阴影 3. 文字阴影

CSS盒子模型基础知识(23个案例+代码+效果图)

目录 1.边框样式 案例&#xff1a;制作一个边框为实线的正方形 1&#xff09;代码​编辑 2&#xff09;效果 案例&#xff1a;制作一个边框为虚线的正方形 1&#xff09;代码 2&#xff09;效果 案例&#xff1a;制作一个边框为点线的正方形 1&#xff09;代码 2&#xff09;效…

二分查找一>:在排序数组中查找元素的第一个和最后一个位置

1.题目&#xff1a; 2.解析:这里不能用传统二分&#xff0c;因为涉及范围&#xff0c;传统二分时间复杂度会降为O(N)&#xff0c;要做些改动。 步骤一&#xff1a;查找区间左端点 细节图&#xff1a; 步骤二&#xff1a;查找区间右端点&#xff1a; 细节图&#xff1a; 代码…

Cpp::STL—vector类的使用与理解(上)(10)

文章目录 前言一、vector的介绍三个原生指针的图示 二、vector的构造函数一个注意事项 二、vector的空间大小、调整函数size()capacity()empty()resize()reserve() 三、vector的增删查改push_back & pop_backinsert & erasefindswapfront & backoperator[ ] & …