数据分类分级的概念、方法、标准及行业实践

news2024/12/23 15:29:09

数据战略上升为国家战略,数据资产成为国家各行各业的核心资产。在数字化时代,数据分类分级成为数据资产管理的重要组成部分。

通过数据分类分级管理,可有效使用和保护数据,使数据更易于定位和检索,满足数据风险管理、合规性和安全性等要求,实现对政务数据、企业商业秘密和个人数据的差异化管理和安全保护。标准成为数据分类分级管理的重要抓手,为特定范围内的数据分类分级提供标准支撑,在国际、国家和各行业均取得了一定成效。

本文从数据分类分级概述、数据分类分级在国家层面、国际层面、行业层面和地方层面的实践、以及数据分类分级的方法等方面阐述数据分类分级的必要性和在国家、行业和地方的数据改革和数据治理中发挥的重要作用。

数据分级:按照公共数据遭到破坏(包括攻击 、泄露 、篡改 、非法使用等)后对国家安全 、社会秩序 、公共利 益以及个人 、法人和其他组织的合法权益(受侵害客体)的危害程度对公共数据进行定级 ,为数据全生命周期管理的安全策略制定提供支撑 。

1)《数据安全法》第二十一条 国家建立数据分类分级保护制度,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对数据实行分类分级保护

2)《GB/T 25069-2010信息安全技术术语》依据访问数据或信息需求,而确定的保护程度,同时赋予相应的保护等级。例:“绝密”、“机密”、“秘密”

在这里插入图片描述
在这里插入图片描述
4)技术选型维度,如按存储方式、数据稀疏程度、处理时效性,数据交换方式;

5)以业务应用维度:如业务数据产生来源、业务归属、流通类型、行业领域、数据质量;

6)信息安全隐私方面的分类法。
在国际上,对数据分类分级统称为数据分类,是指按照相关类别组织数据的过程,根据需要对分类的级别和类别进行分别描述,可以更有效地使用和保护数据,并使数据更易于定位和检索。目前,国际上通用的分类方法主要有《杜威十进分类法》(DDC)、《国际十进分类法》(UDC)、《美国国会图书馆图书分类法》(LCC)、《冒号分类法》(CC)、《书目用图书分类法》(BC)等,其中,《杜威十进分类法》(DDC)、《国际十进分类法》(UDC)、《美国国会图书馆图书分类法》(LCC)是世界三大分类法。与此同时,国际上也发布了数据分类的相关标准,比如ISO/IEC 27001:2013《信息安全管理体系要求》。

在国家层面,我国将数据分类分级进行了区分,分类强调根据种类的不同按照属性、特征而进行的划分,分级强调对同一类别的属性按照高低或大小进行级别的划分。在国家层面,出台了相关法律法规、政策文件、标准规范等提出了对数据分类分级的要求和建议,国家标准GB/T 21063.4—2007《政务信息资源目录体系 第4部分:政务信息资源分类》给出了政务数据的分类方法和主题分类类目;GB/T 38667—2020《信息技术 大数据 数据分类指南》,给出了数据分类过程、数据分类视角、数据分类维度和数据分类方法,指导大数据分类。GB/T 36073-2018《数据管理能力成熟度评估模型(DCMM)》是给出了结构化数据资产的分类方法,这是通常我们在企业大数据集成、应用、分析处理领域,以及数据资产管理角度关注的数据分类方法,该标准把数据分成:参考数据、主数据、指标数据、数据元。

在行业层面,工业、金融等领域以明确提出了行业数据分类分级管理的具体要求。2020年2月,工业和信息化部办公厅印发《工业数据分类分级指南(试行)》中建议结合行业要求、业务规模、数据复杂程度等实际情况,围绕数据域进行类别梳理,形成分类清单并将数据划分为3个级别;2018年9月,中国证券监督管理委员会发布JR/T 0158—2018《证券期货业数据分类分级指引》中给出了证券期货业数据分类分级方法概述及数据分类分级方法的具体描述,并对数据分类分级中的关键问题给出处理建议;JR/T 0197—2020《金融数据安全 数据安全分级指南》金融行业标准,给出了金融数据安全分级的目标、原则和范围,明确了数据安全定级的要素、规则和定级过程,并给出了金融业机构典型数据定级规则的实践;此外,国家标准GB/T 4754—2017《国民经济行业分类》从国家宏观管理角度对全社会经济活动从门类、大类、中类和小类四个层次进行分类。

数据分类是数据管理的第一步,是数据治理的先行条件。当前,数据应用方兴未艾。“数据”作为新的生产要素资源,支撑供给侧结构性改革、驱动制造业转型升级的作用日益显现,正成为推动质量变革、效率变革、动力变革的新引擎。但与此同时,数据管理中存在问题日益显现:

2.1缺乏对数据保护重要性的认知
没有认识到数据分类分级在数据治理和数据管理工作中的基础性作用,对分类分级投入产出不高,对此项工作优先级排在其他业务事项之后,忽略了数据安全问题与个人和社会息息相关。

2.2缺乏数据分类分级的技术和方法
由于数据分类分级正处在探索发展阶段,尚未形成成熟的分类分级体系,导致企业和行业无法掌握合理的分类分级方法,从而无法在实践中应用,缺乏有效的建设、管理和使用方式。

由于企业业务和管理的多样性、差异性和变化性,对数据的采集、统计、分析造成很大困难。在数据标准方面:没有统一规范数据的定义、范围、单位、格式、频次、责任部门。在数据采集方面:金字塔辐射式采集,重复要数、多头要数、频繁要数,同数多值、反复改数、人变数变等现象十分普遍。

数据分类分级项目难点与挑战

——业务分类问题

——业务指标问题(每类业务应该有哪些指标,以及指标的定义、范围、格式、频次)

——不同层级企业对同一业务的指标要求不同

——同一层级企业对同一指标的管理颗粒度不同

——同一指标的统计口径不同

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/748431.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

领略大数据分析的魅力:迈向FineBI的世界

版权声明:本文为 小异常 原创文章,非商用自由转载-保持署名-注明出处,谢谢! 本文网址:https://sunkuan.blog.csdn.net/article/details/131698171 文章目录 一、FineBI介绍(6.0版本)1、使用人群…

高并发的哲学原理(三)-- 基础设施并发:虚拟机与 Kubernetes(k8s)

上篇文章说到,Apache 无法处理海量用户的 TCP 连接,那要是由于宇宙时空所限,你的系统就是无法离开 Apache,该怎么承接高并发呢?有办法:既然单机不行,那就把单机虚拟化成多个 Linux 机器&#xf…

关于typescript的类型推断一些理解

我们先看一段代码: interface defaultObjType {[key: string]: any; } interface SquareConfig {color?: string | defaultObjType;width?: number; } let obj:SquareConfig {color: {qw:123}, }if(obj.color && obj.color.qw) { // 这里报错&#xff…

【重要】MThings V0.6.0更新要点

我们听到了您的声音并采取了行动!现在为您提供了一次全面的软件升级,让您的体验更加顺畅、稳定和安全。立即更新,畅享新功能! 下载地址: http://gulink.cn/download 01. [新增]支持系统数据、历史数据、告警功能个人版…

Liunx命令大全及基础知识扫盲

文章目录 1,ifconfig命令2,ens10和eth103,查看PCI地址 1,到达最后一行 ctrl end 1,ifconfig命令 ifconfig 是一个用于配置和显示网络接口信息的命令行工具 1,ifconfig这将显示所有网络接口的详细信息,包括接口名称、MAC 地址、IP 地址、子…

2023中国企业绿电国际峰会

会议时间/地点/主办方 2023年11月16-17日,中国上海,ECV International 会议形式 峰会采用“线下线上”的方式同步进行,中英双语同声传译,线上、线下并行进行和实时互动。 峰会背景 当下全球气候问题正在不断显现,对…

conda修改环境保存地址

可以在命令行中通过conda config指令进行修改 如: 添加环境目录envs_dirs conda config --add envs_dirs F:\conda_env\envs 添加pkgs_dirs conda config --add pkgs_dirs F:\conda_env\pkgs 也可以直接进入Anaconda Nacigator进行修改

Java反序列化:URLDNS的反序列化调试分析

URLDNS链子是Java反序列化分析的第0课,网上也有很多优质的分析文章。 笔者作为Java安全初学者,也从0到1调试了一遍,现在给出调试笔记。 一. Java反序列化前置知识 Java原生链序列化:利用Java.io.ObjectInputStream对象输出流的w…

Openlayers实战:加载OpenStreetMap(快速显示无加载不出状态)

Openlayers官方一直演示的都是用Openstreetmap, 但是目前国内使用通用的new OSM(), 是加载不出来OSM地图的。在我们的实战中代码中,不但能够加载出Openstreetmap, 而且速度非常的快,这就涉及到一个曲线救图的处理方式,请参考源代码。 效果图 源代码 /* * @Author: 大剑师…

如何提取音频中的纯人声?分享三个方法给大家!

在处理音频文件时,有时候我们只希望提取其中的纯人声,以便进行后续处理或编辑。本文将介绍三种简单有效的方法,帮助您提取音频中的纯人声。方法一使用记灵在线工具,方法二使用Audacity,方法三则为您补充其他可选方案。…

Linux—实操篇:实用指令

目录 1、指定运行级别 1.1基本介绍 1.2、示例 1.3、CentOS7 后运行级别说明 2、找回root密码 3、帮助指令 3.1、man指令 3.2、help指令 4、文件目录指令 4.1、pwd 指令 4.2、ls 指令 4.3、cd 指令 4.4、mkdir 指令 4.5、rmdir 指令 4.6、touch 指令 4.7、cp 指…

Unified Named Entity Recognition as Word-Word Relation Classification

原文链接:https://arxiv.org/pdf/2112.10070.pdf AAAI 2022 介绍 NER主要包括三种类型:flat、overlap和discontinuous。目前效果最好的模型主要是:span-based和seq2seq,但前者注重于边界的识别,后者可能存在exposure b…

保护用户数据隐私:Web3 技术在电商行业中的应用

电商行业一直是全球经济发展的重要推动力。然而,随着电商行业的不断发展,中心化的支付、物流和数据存储方式逐渐暴露出安全隐患和隐私问题。这时,Web3 技术以其去中心化、安全性和透明性等特点,为电商行业带来了新的解决方案和可能…

关于var、let、const相同与不同

相同:var、let、const都可以声明变量 var milliaA "milliaA" let milliaB "milliaB" const milliaC "milliaC"console.log(milliaA,milliaB,milliaC) 不同: 一、变量提升,var有提升,let、cons…

初识 Redis - 分布式,内存数据存储,缓存

目录 1. 什么是 Redis 1.1 Redis 内存数据存储 1.2 Redis 用作数据库 1.3 Redis 用作缓存 (cache) 1.4 用作消息中间件 1. 什么是 Redis The open source , in-memory data store used by millions of developers as a database, cache, streaming engine, and message br…

使用 Elastic 时间序列数据流探索 Nginx 指标

作者:Lalit Satapathy Elasticsearch 最近发布了用于指标的时间序列数据流。 这不仅为 Elastic Observability 提供了更好的指标支持,而且还有助于降低存储成本。 我们在之前的博客中讨论过这个问题。 在本博客中,我们通过回顾什么是时间序列…

rar文件怎么打开?简单4步,轻松解决!

什么是rar文件? Rar文件是一种专用的文件格式,比较常用于归档打包和数据的压缩,我们可以将原有的文件数据压缩后保存为rar文件格式。其常用于将文件夹或者大型文件压缩为单个文件,以便更方便地传输和存储。 在日常的工作中&…

jmeter 终端命令执行jmx文件 生成jtl日志文件

终端命令执行jmx文件 生成jtl日志文件, 步骤如下: 步骤1:终端进入jmx文件目录 步骤2:执行命令:jmeter -n -t ****.jmx -l ****.jtl -n 以cli模式(命令行运行模式)运行jmeter -t 需要运行的…

怎么快速敲代码,最简单的代敲代码工具,codeWhisperer走起

题记:谁不想提升工作效率,谁不想有人帮你敲代码,来吧,上菜; 第一步:下载并安装AWS Toolkit(下载有点慢,请耐心等待); 第二步:点击start。 第三步…

【论文阅读笔记】Attack-Resistant Federated Learning with Residual-based Reweighting

个人阅读笔记,如有错误欢迎指出 Arxiv 2019 [1912.11464] Attack-Resistant Federated Learning with Residual-based Reweighting (arxiv.org) 问题: 联邦学习容易受到后门攻击 创新: 提出一种基于残差的重新加权聚合算法 聚合算法…