【数据治理-06】做好数据分类分级,为数据安全有序流动保驾护航

news2024/11/24 11:47:12

我们常说人以类聚,物以群分,确实是这样,杜威说过“所有知识都是分类”!很好理解,分类是认知经济,任何有效分类,都可以极大地节省我们的认知精力。数据分类分级具体说来,其实包含了2个方面,一方面涉及数据架构中的分类,另一方面涉及数据安全的分级。数据分类和分级相辅相成,在数据流通、数据安全、数据共享等方面发挥着重要作用,接下来我们开始聊聊这个话题。

为什么做

我们为什么要做数据的分类分级,为什么要重视数据分类分级这样工作,一个最朴素的目标是让数据发挥价值。我们知道,数据是有价值的,但是前提是流动,流向能够发挥价值的地方去。但是数据安全这座大山是所有“数据泛保护”人群的尚方宝剑,“我们不能开放共享,因为不安全”,为了“绝对的安全”,群众办个事多个部门来回跑,跑断了腿,效率低下,也造成了社会资源的浪费。不是数据共享难推动吗,好吧,那就分类分级,明确有哪些数据,哪些数据能共享,哪些数据不能共享。正如数据安全法强调“保障数据依法有序自由流动”,进行数据流动是激发行业经济活力和降低行业成本的有效解决方案,数据分类分级则为数据安全有序流动保驾护航。各级政府和行业煞费苦心,相关国家标准、行业标准、团体标准层出不穷,最后面附了各地数据分类分级相关规定,作为行业中的重要一员,尤其是各级政府、企事业单位没有理由不做好此项工作。

聊聊方法论

怎么实施数据分类分级呢,国家标准《信息安全技术 网络数据分类分级要求(征求意见稿)》中给出了大致的数据分类分级实施流程,依次为数据资产梳理、数据分类、数据分级、审核上报目录、动态更新管理,但是我认为不全面,应该从业务梳理开始,因为数据是源于业务,没有业务,数据也就成为了无源之水,只有搞清楚业务才能更好地梳理数据资产。标准中给出的实施流程如下图所示,接下来我们从业务梳理入手,聊聊每个环节的关键工作。
在这里插入图片描述

业务梳理

数据一般因业务而产生,供业务需要使用;无业务需求,也无数据的产生和消费。因此,研究数据的分类分级一定要搞清楚业务,从业务入手才是做数据工作的不二法门。面向数据做业务梳理不同于面向产品设计,是基于当前的业务系统侧重于理清现有业务对象的产生和关联关系,从现有划定的业务域入手,梳理每个业务域中的业务流程、活动、任务等,找出业务对象,从而构建业务对象的概念模型,具体概念模型的定义参考【数据架构系列-06】一文搞懂数据模型的3种类型——概念模型、逻辑模型、物理模型。接下来我们从概念模型出发,建立起概念模型到当前业务系统物理模型的映射,通俗点说就是数据库中表和业务的对应关系。我们通常把这种从业务入手去梳理数据的方法叫做自上而下的数据梳理方法

数据资产梳理

数据资产梳理:对数据资产进行全面梳理,包括以物理或电子形式记录的数据库表、数据项、数据文件等结构化和非结构化数据资产,明确数据资产基本信息和相关方,形成数据资产清单。

第一步的业务梳理当然也属于数据资产梳理的范畴,自上而下的数据梳理方法能让我们从业务入手理解数据如何产生如何被使用。这样梳理出来的数据一般是站在核心业务流程上梳理出来的数据,数据梳理的不够全面,此时,我们就要从数据入手去梳理,最典型的就是从数据仓库、BI、数据开放共享平台等数据被加工使用端入手,倒推出数据对象,逐步把我们的数据资产梳理的全面,这种方法叫做自下而上的数据梳理方法

结合项目实践,我们总结了两种数据梳理的方法,一种为自上而下,另一种为自下而上,这两种方法互为补充,建立起企业的数字资产全景视图。

数据分类

数据分类:按照数据分类分级有关要求,根据行业领域数据管理和使用需求,结合本行业本领域已有的数据分类基础,灵活选择业务属性将数据逐级细化分类,同时对个人信息、敏感个人信息进行识别和分类。

在数据分类中,当然我们要首先依照行业内的数据分类体系建立,比如各个地方、行业数据分类分级指南,像这样的指南分类比较宽泛,不够具体,这就需要我们进一步设计。那么如何进行数据分类呢,我比较推荐用数据仓库面向主题的数据分类思想,通俗的理解就是整合数据对象,把多个业务关联性较大数据对象划分为一个主题,业务上关联的主题组成一个主题域。

以电商为例,数据分类包括供应商主题、商品主题、客户主题和仓库主题,在销售这个更高层级的业务流程中,这些主题都以商品主题而关联,可以组成销售主题域:

  • 商品主题可能涵盖的关系表有商品表、供应关系表、购买关系表和仓储关系表;
  • 仓库主题可能涵盖的关系表有仓库关系表、仓库表、仓库管理关系表和管理员表。
  • 供应商主题可能涵盖的关系表由:供应商关系表,供应关系表等;
  • 顾客主题可能涵盖顾客购买表,顾客关系表等;
    在这里插入图片描述

数据分级

参考多个地方和行业标准,一般都是根据数据被非授权操作后的影响程度,将公共数据划分为3个或4个等级。比如可公开的数据(公开数据)定为1级;受限公开的数据(受限数据)定为2级;敏感数据定为3级;涉密数据定为4级。那么如何进行定级呢,《重庆市公共数据分类分级指南》给出了结构化数据分级判定方法,值得借鉴参考,如下图所示。

在这里插入图片描述

对于不同级别的数据在不同环节采取不同程度的保护措施,浙江省杭州市地方标准《数据资源管理 政务数据分类分级》中给出了“数据分级保护基本要点”,定义了不同分级的数据在数据采集、数据传输、数据存储、数据处理、数据共享、数据销毁数据全生命周期的保护要点,定义的非常详细,很值得借鉴学习。

为了方法大家学习,我收集的一些相关标准和论文,请下载。

相关法律法规

法律《网络安全法》2016.11.07
法规《数据安全法》2021.06.10
《网络安全等级保护条例(征求意见稿)》2018.06
《网络数据安全管理条例(征求意见稿)》2021.11
技术标准(综合性)《信息分类和编码的基本原则与方法》2002.07.18
《国民经济行业分类》GB/T 4754-20172017.06.30
《政务信息资源目录体系》GB/T 21063-20172017.09.10
《大数据安全管理指南》GB/T 37973-20192019.08.30
《信息安全技术个人信息安全规范》GB/T 35273-20202020.03.06
《信息安全技术网络安全等级保护定级指南》GB/T 22240-20202020.04.28
《信息技术大数据数据分类指南》GB∕T 38667-20202020.04.28
信息安全技术 网络数据分类分级要求(征求意见稿)2022.09.14
地方文件《贵州省政府数据数据分类分级指南 DB52/T1123-2016》2016.09.28
《坪山区政务数据分类分级管理办法(试行)》2020.10.22
浙江省《数字化改革 公共数据分类分级指南 DB33/T 2351-2021》2021.07.05
《重庆市公共数据分类分级指南(试行)》2021. 10
《上海市公共数据开放分级分类指南(试行)》2021
北京市《政务数据分级与安全保护规范(征求意见稿)》2021
技术标准(行业)《电信和互联网服务用户个人信息保护分级指南》YD/T 2782-20142014.12.24
《证券期货业数据分类分级指引》JR/T 0158—20182018.09.27
《个人金融信息保护技术规范》JR/T 0171-20202020.02.13
《工业数据分类分级指南(试行)》工信厅信发〔2020〕6号2020.02.27
《金融数据安全数据安全分级指南》JR/T 0197-20202020.09.23
《基础电信企业数据分类分级方法》YD/T 3813-20202020.12.09
其他《汽车数据安全管理若干规定(试行)》2021.08.16
《网络安全标准实践指南——网络数据分类分级指引》2021.12.31
《互联网平台分类分级指南(征求意见稿)》2021.10.29

数据分级保护基本要点(截取部分)
在这里插入图片描述

参考文章

  1. 数据资产目录建设之数据分类全解(上)
  2. 数据资产目录建设之数据分类全解(下)
  3. 全国信息安全标准化技术委员会:网络安全标准实践指南 —数据分类分级指引.pdf
  4. 金融数据安全 数据安全分级指南.pdf
  5. 证券期货业数据分类分级指引.pdf
  6. 智慧民航数据治理规范-数据安全.pdf
  7. 信息安全技术 网络数据分类分级要求(征求意见稿)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667357.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

欢迎来到 VOXEL WARS!

Sandbox Streams 的全新节目,我们希望你们能参与其中! 我们正在寻找 15 名 Voxedit 艺术家,他们将需要抽出 1 小时进行现场表演(仅限屏幕共享),并在节奏快速的环境中进行创作,以赢得“最佳快速设…

报道 | 7月国际运筹优化会议汇总

七月召开会议汇总: 30th International Annual EurOMA Conference Location:Leuven Important dates: Conference: July 3, 2023 - July 5, 2023 Details:https://euroma2023.org/ The Equilibrium Computation Workshop at EC Location:Kings College London…

STM32速成笔记—ADC

文章目录 一、什么是ADC二、ADC的用途三、STM32F103ZET6的ADC3.1 ADC通道对应引脚3.2ADC时钟3.3 ADC工作模式3.4 ADC转换时间3.5 ADC校准3.6 ADC转换结果与实际电压的换算 四、ADC配置步骤五、ADC配置程序5.1 ADC初始化程序5.2 软件触发AD转换5.3 读取AD转换结果 六、实战项目6…

运动健身APP开发需要具备哪些功能?

想要开发一款运动健身APP软件,需要具备哪些功能呢? 1、用户注册和登录:用户通过个人信息注册健身APP,登陆之后建立个人账号,以后使用秩序登录自己的账号就可以记录和追踪自己的健身计划和成果。 2、个人…

【新星计划回顾】第六篇学习计划-通过自定义函数和存储过程模拟MD5数据

🏆🏆时间过的真快,这是导师回顾新星计划学习的第六篇文章! 最近这段时间非常忙,虽然导师首次参与新星计划活动已经在4月16日圆满结束,早想腾出时间来好好整理活动期间分享的知识点。 🏆&#x1…

机器学习:问题构建及框架化

机器学习作为一种解决方案,并不是“万金油”,它只适用于一些特定的场景。在实际应用中,我们首先需要进行问题构建——即通过分析问题以隔离需要解决的各个元素的过程。问题构建有助于确定项目的技术可行性,并提供一组明确的目标和…

应届生软件面试自我介绍(合集)

应届生软件面试自我介绍篇【1】 尊敬的领导: 您好! 我是中南大学(原中南工业大学)冶金科学与工程学院2014年轻金属冶金专业应届毕业生。在此临近毕业之际,我希望能得到贵单位的赏识与栽培。为了发挥自己的才能,特向贵单位自荐。自我介绍 中南…

在元宇宙上做传统建筑施工培训提高培训安全性和效果

随着VR虚拟现实技术不断发展,VR元宇宙在建筑行业中的应用也越来越广泛。通过VR元宇宙技术打通虚拟空间和现实空间实现建筑全生命周期的改进和优化,形成全新的数字建造体系,达到降低成本、提高生产效率、高效协同的效果,促进建筑业…

SignalR 跨域问题(Vue3+Net6)

文章目录 背景困难~~*调用 UseCors*~~ 解决办法环境错误信息解决方式部分代码 问题分析 背景 使用前后端分离技术,前端使用Vue,部署在独立的服务器上,后端接口部署在另外一个服务器上。 困难 网上找了一个多小时的SignalR的跨域问题&#…

textract OCR的安装使用

安装 pip install textract使用 在 Python 中,textract 是一个用于提取文本和信息的库。它提供了一个函数 textract.process(),用于处理不同类型的文档并提取文本内容。下面是 textract.process() 函数的各个参数的介绍: filename&#xf…

spring boot框架步骤

目录 1. 创建一个新的Spring Boot项目2. 添加所需的依赖3. 编写应用程序代码4. 配置应用程序5. 运行应用程序6. 编写和运行测试7. 部署应用程序 总结 当使用Spring Boot框架开发应用程序时,以下是一些详细的步骤: 1. 创建一个新的Spring Boot项目 使用…

ChatGPT在物流与运输行业的智能场景:智能调度和自动驾驶的前瞻应用

第一章:引言 随着人工智能技术的飞速发展,物流与运输行业正迎来一场革命。传统的调度和运输模式已经无法满足快速增长的物流需求和客户期望。在这一领域,ChatGPT作为一种先进的自然语言处理模型,具有巨大的潜力。本文将探讨ChatG…

【经验贴】多项目并行,如何解决资源管理这个难点?

随着公司业务的逐步增加,我手上管理的项目也多了起来,开始接触了一些中大型项目。但还没来得及算能拿到多少项目奖金,我就被接踵而至的管理难题压得喘不过气来,第一次感受到多项目并行带来的手忙脚乱的感觉。 我首先遇到了各种资…

分享 7 个不常用但有用的 CSS 小技巧

在这篇文章中,我想向您展示一些简单的CSS技巧,您可以在下一个项目中使用它们。让我们开始吧! 1、-webkit-text-stroke 通过使用这个简单易用的属性,可以创建出酷炫的文字效果。它可以给文字添加描边。-webkit-text-stroke是-webki…

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月19日论文合集)

文章目录 一、检测相关(7篇)1.1 Vehicle Occurrence-based Parking Space Detection1.2 Squeezing nnU-Nets with Knowledge Distillation for On-Board Cloud Detection1.3 MixedTeacher : Knowledge Distillation for fast inference textural anomaly detection1.4 Efficien…

金测评 听歌更自如的骨传导耳机,音质更出色,南卡Runner Pro 4S体验

我一直对骨传导耳机很感兴趣,因为这种耳机可以让我在户外运动的时候,既能享受音乐,又能保持对周围环境的敏感。为了获得更好的听歌体验,我的骨传导耳机换代频率很高,目前我用的是一款南卡Runner Pro 4S的骨传导耳机&am…

windows环境cmake引用boost库

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、下载源代码二、编译前准备1.操作系统2.gcc环境3.建立安装目录 三、开始编译1.解压源代码2.开始编译 四、开始使用1.Clion创建项目2.Boost版本差异3.Boost版…

数据结构Pta训练题函数题详解

​ pta网站:PTA | 程序设计类实验辅助教学平台 (pintia.cn) 文章内容较长,建议搭配目录使用 点击直达快乐 6-1 线性表元素的区间删除解析: 6-2 有序表的插入解析: 6-3 合并两个有序数组解析 6-4 顺序表操作集解析 6-5 递增的整数…

Linux磁盘空间占满,但搜不到大文件

使用 df -h 查看磁盘空间 使用 du -sh * 查看每个目录的大小 经过查看没有发现任何大的文件夹。 继续下面的步骤 如果您的Linux磁盘已满,但是通过 du -sh 找不到大文件,可能是因为有一些进程正在写入磁盘,但是这些文件已经被删除&#…

与用户同行!2023卡萨帝开启高端生活方式新时代

6月20日,2023思享荟暨卡萨帝品牌升级发布会在重庆国际博览中心举行。在经历了高端产品引领、高端品牌引领、高端场景引领后,卡萨帝启动全新品牌升级,持续与用户同行,开启高端生活方式引领的新时代。 现场,海尔智家副总…