数据安全--16--数据采集阶段安全防护措施

news2024/12/24 20:44:32

本博客地址:https://security.blog.csdn.net/article/details/131033616

一、引子

数据安全采集阶段的防护措施主要是从三个方面来开展的,第一个是从个人数据主体采集方面,第二个是从外部机构采集方面,以上两个方面基本涵盖了数据采集的源头,但由于数据源头不同,所做的数据防护措施也是不一样的,第三个方面是老生常谈的数据分类分级。

二、从个人数据主体采集

从个人数据主体采集数据的防护措施主要有以下:

1、采集数据的客户端在完成对应的业务之后,本地不应该留存敏感数据,这里的客户端包含APP、Web等,同时,要及时清理客户端的缓存,防止采集的数据泄露;

2、采集数据时不应该超范围采集数据,这里主要是要做到采集的个人信息应与提供的服务直接相关,同时与合同协议条款、隐私政策中约定采集的内容保持一致;

3、采集的合规性保障,主要包括不违规采集数据,例如采集频率过高等;不隐瞒采集数据,例如实际上采集了但隐私政策等文件中没有说明;不通过诱骗、误导用户的方式来采集数据等等;

4、采集的生命周期要与业务服务周期一致,当提供的产品或服务停止运营时,数据的采集活动也要相应的停止。

三、从外部机构采集

从外部机构采集数据的防护措施主要有以下:

1、合同约束,在从外部机构采集数据时,需要通过合同协议等方式,明确双方在数据安全方面的责任及义务,明确数据采集范围、频度、类型、用途等,以此确保外部机构数据的合法合规性和真实性,必要时提供相关个人信息主体的授权;

2、约束机制,在从外部数据供应方处采集数据时,需要制定数据供应方约束机制,并明确数据源、数据采集范围和频度,并事前开展数据安全影响评估;

3、采集数据时不应该超范围采集数据,这里主要是要做到采集的企业客户数据应与提供的产品或服务直接相关,并与合同协议条款、隐私政策中约定采集的内容保持一致。

四、数据分类分级

数据分类分级是一个理论上很简单,但实际操作起来非常复杂的事情,这主要介绍数据分类分级的实践。

数据分类分级本身在数据防护中不会产生太大的价值,它的意义在于将分类分级结果输入给其他安全防护能力,之后可以对不同类别、不同级别数据进行不同的防护措施,从而开展差异化的数据安全防护。

1、建立数据分类分级制度

做数据分类分级,第一步要做的就是建立分类分级规范制度,这也是数据分类分级工作中最容易做的一步,这里主要介绍一下数据分类分级制度的思路。

在数据分类分级制度中,第一要明确数据分类分级的步骤和数据分类分级的原则,数据分类分级的步骤一般都是先细分业务、然后根据业务归类数据,之后划分数据级别,最后做后续操作。第二是对数据分类分级的步骤进行详细描述即可。同时,在该制度中还应当根据公司的具体情况列明哪些数据属于哪些类别和级别(这里列明主要数据即可)。

数据分类分级的规范制度是为后续数据全生命周期涉及到的技术和管理提供依据的。

2、建立数据分类分级平台

数据分类分级的实际工作全部都集中在数据分类分级平台上开展,那如何建立数据分类分级平台呢?答案只有一个字:买!或者两个字:自研。这个具体就不多说了。

3、数据资产梳理及接入

这里梳理的数据资产主要是指数据库,因为平台化的东西都需要结构化的数据来对接。当然,对于类似word/excel等办公文档也是需要梳理的,只是这些文档不能很好的与数据分类分级平台集成。

梳理完数据资产后,就需要将这些数据资产接入数据分类分级平台了,除了靠人工梳理的数据资产外,还可以通过扫描的方式发现数据资产。

人工梳理资产接入如图所示:

在这里插入图片描述

自动扫描发现数据资产如图所示:

在这里插入图片描述

4、分类分级模板维护

分类分级模板维护是数据分类分级工作中最为关键的一步,也是最难的一步。

这一步我们首先需要设计数据分类分级的架构,例如分多少个一级类多少个二级类,每个类叫啥名等等,然后分多少个级别,每个级别如何定义等等,这里主要是根据前面编撰好的数据分类分级规范来开展即可。

需要注意的是,分类分级模板需要覆盖到所有数据。在这里,我们会发现实际上的数据远比理论上的数据复杂的多,会冒出很多奇奇怪怪的数据字段出来,例如这个名称那个类型的种种,所以在分类分级制度中我有提到,我们只需要列举主要字段所在的类别和级别就可以了,因为制度中是写不全的。

另外,实际中的数据还会存在诸多问题,例如姓名字段,有叫name、names、username、usersname、xingming、yonghu、yonghuming、shouhuoren……等等各式各样的名称,如果数据库中的字段没有写备注,那就只能靠挨个排查,而面对天量的数据库,这是一个很难完成的工作。除此之外,还有例如在这个库中username字段是指姓名,而另一个库中username是指口令名(可能是邮箱、QQ号、手机号之类的东西),导致同一个字段的释义是完全是两个不同的概念。

除以上之外,实际的数据库中还有很多其他问题,就不一一例举了,这些问题会严重影响分类分级模板的准确性与维护的难度!

目前对于分类分级模板的维护尚未有较好的解决办法,相对比较柔和的办法是每个库都维护一个独立的分类分级模板,毕竟就单一库来说,存在一些坑爹问题的概率要低很多。而分类分级模板可以直接复制,这样相同字段的规则就可以直接使用了。

模板如下所示(图片不涉及泄密,因为这是官方的demo):

在这里插入图片描述

5、分类分级任务执行

分类分级模板设置完成之后,选中对应的数据资产使用分类分级模板执行分类分级任务即可,分类分级任务是一键执行的。

那这里我们主要做什么工作呢?这里主要关注并解决的问题是:由于分类分级模板的不完善,导致部分数据字段没有被匹配到或者匹配错误的问题。

对于以上两个问题,主要的解决办法是通过回头完善分类分级模板,之后再次执行分类分级任务。同时也可以对未匹配到的数据字段进行人工打标,即人工指定该字段所属的类型与级别。

这里的工作量主要取决于产生问题的数据字段的多少,如果产生问题的数据字段不多,则可以很快完成问题字段的修补,如果产生问题的数据字段很多,则工作量较大。

将所有数据字段都划分到对应的类别和级别后,数据分类分级工作就算是基本完成了,至于分类分级数据的报表这种,一般平台会自动生成,后续主要维护好新增数据库表和新增数据字段即可。

分类分级任务执行如图所示:

在这里插入图片描述

分类分级数据报表如图所示:

在这里插入图片描述

6、联动其他防护平台

我们前面说到,单纯的只做数据分类分级工作并没有特别大的价值,分类分级的目的是为了对数据进行更好的差异化管理,而不是一把梭式的管理,所以对数据做完分类分级后,需要将分类分级的结果对接到其他的防护平台中进行差异化防护。

举个例子,我们将数据分类分级结果对接到OA审批系统中,即可实现数据外发审批的自动化,当数据是公开级别时,可自动判定无审批通过,当数据级别不是公开级别时,将依据不同的数据级别自动对接不同的审批层级。

再举个例子,我们将数据分类分级的结果对接到数据防泄漏系统中,公开级别的数据外发不会触发DLP的拦截规则,而不是公开级别的数据外发,则会根据外发数据的敏感度、数据量来触发不同的告警。

总体来说,使用数据分类分级工具可以帮助我们完成资产的梳理与发现工作,并大大降低了数据分类分级的难度,弥补手工分类分级的各种短板。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

读改变未来的九大算法笔记05_数字签名

1. 数字签名”(Digital Signature) 1.1. 单词数字化(digital)意味着其“由数字字符串组成” 1.2. 任何数字化的东西都能被拷贝 1.3. “签名”的全部意义在于能被读取,但不能被除了作者的任何人拷贝(也就…

linux(信号产生中)理论部分

1.实际执行信号的处理动作称为信号递达 2.信号从产生到递达之间的状态,称为信号未决(Pending) 3.进程可以选择阻塞某个信号的 ----------------------------------------------------------------------------------------------------------…

【JavaSE】Java(五十一):核心要点总结

文章目录 1. String str "love"; 和 String str new String("love);一样吗?2. 如何将字符串反转3. String类的常用方法有哪些?4. new String("sn") new String("ow")会创建几个对象? 1. String str “love”; 和…

「C/C++」C/C++ Lamada表达式

✨博客主页:何曾参静谧的博客 📌文章专栏:「C/C」C/C程序设计 相关术语 Lambda表达式:是C11引入的一种函数对象,可以方便地创建匿名函数。与传统的函数不同,Lambda表达式可以在定义时直接嵌入代码&#xff…

JSON与storage

JSON JSON由来 ◼ 在目前的开发中,JSON是一种非常重要的数据格式,它并不是编程语言,而是一种可以在服务器和客户端之间传输的数据格式。 ◼ JSON的全称是JavaScript Object Notation(JavaScript对象符号)&#xff1a…

苹果震撼发布首款头显,搭配强悍Mac和iOS 17等全新产品,价值25000元!

🌷 博主 libin9iOak带您 Go to New World.✨ 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发…

随机过程与排队论(一页纸总结)

参数为 λ 的泊松过程的点间间距是相互独立的随机变量,且服从均值为 1/λ 的 指数 分布。 病人以每小时3人的泊松流到达医院,设该医院只有一个医生服务且容量为无穷,医生服务的时间服从指数分布,并且平均服务一个病人为30分钟&am…

内联函数 C/C++

代码&#xff1a; file1.c #include<stdio.h>void spam(double v); void masp(double w);inline static double square(double); double square(double x) { printf("%s %s %d\n", __FILE__, __func__, __LINE__);return x * x; } int main() {double q …

chatgpt赋能python:Python如何将图片Resize

Python如何将图片Resize 在网页设计和开发过程中&#xff0c;图片大小和质量对于网站性能和用户体验至关重要。网站图片过大会影响页面加载时间&#xff0c;降低用户体验&#xff1b;同时&#xff0c;过小的图片也会影响网站排名&#xff0c;因为搜索引擎的排名算法很重视网站…

chatgpt赋能python:Python如何循环运行程序

Python如何循环运行程序 Python是一种强大的动态语言&#xff0c;具备灵活性和易用性。在编写Python程序时&#xff0c;一个常见的需求是循环运行程序&#xff0c;特别是需要定期执行一些任务的情况下。 本文将介绍如何在Python中实现循环运行程序&#xff0c;并提供一些例子…

chatgpt赋能python:Python如何循环执行

Python如何循环执行 循环是编程中最基本和常用的结构之一。Python作为一门高级编程语言&#xff0c;提供了多种循环执行的方式。在本文中&#xff0c;我们将介绍Python中的循环语句和循环控制语句以及其运行原理。 Python循环语句 for循环 for循环是Python中最常用的循环语…

chatgpt赋能python:Python列表:如何使用Python将数据存入列表中

Python列表&#xff1a;如何使用Python将数据存入列表中 Python是一种广泛使用的编程语言&#xff0c;由于其易于学习和可读性&#xff0c;在数据科学和分析领域中使用广泛。在本文中&#xff0c;我们将讨论如何使用Python将数据存储在列表中。 什么是Python列表&#xff1f;…

语言是世上最奇妙的事物,没有之一

语言是世上最奇妙的事物&#xff0c;没有之一 品牌是靠语言传播的 语言是咋产生的&#xff1f;太玄了 趣讲大白话&#xff1a;猪如果会说话&#xff0c;谁吃谁还不一定呢 【趣讲信息科技187期】 **************************** 《未来简史》的作者说 人有了语言&#xff0c;就有…

Object类和Java中内置的一些接口

文章目录 一、Object类1.1Object类中的方法1.1.1toString()方法1.1.2equals()方法1.1.3hashCode()方法 二、Java中内置的一些接口2.1Comparable<T>接口2.2Cloneable接口 一、Object类 Object类是所有类的父类 1.1Object类中的方法 1.1.1toString()方法 Object类中的t…

Optimize Game Objects骨骼节点优化后SkinMesh以及动态骨骼

为了降低模型动画的性能开销&#xff0c;可以进行骨骼节点优化。 一、接口 unity官方提供了有两种方式可以进行节点优化&#xff1a; 注意当骨骼节点被优化后&#xff0c; Transform节点被剔除&#xff0c;因此需要将挂点等需要用到的节点暴露出来&#xff0c;即下面两个接口…

【高级篇】微服务保护

文章目录 微服务保护1.初识Sentinel1.1.雪崩问题及解决方案1.1.1.雪崩问题1.1.2.超时处理1.1.3.仓壁模式1.1.4.断路器1.1.5.限流1.1.6.总结 1.2.服务保护技术对比1.3.Sentinel介绍和安装1.3.1.初识Sentinel1.3.2.安装Sentinel 1.4.微服务整合Sentinel 2.流量控制2.1.簇点链路2.…

<DB2>《DB2内存详细介绍》

《DB2内存详细介绍》 1 架构图2 主要概念2.1 内存集&#xff08;Memory Set&#xff09;2.2 内存池&#xff08;Memory Pool&#xff09;2.3 内存块&#xff08;Memory Block&#xff09; 3 内存方案3.1 第一级服务器内存3.2 第二级操作系统内存和实例共享内存3.3 第三级数据库…

K8S | 核心原理分析

整体上理解流程和原理&#xff1b; 一、背景 基于分布式的架构中&#xff0c;需要管理的服务是非常多的&#xff0c;无论是服务的数量还是体系划分&#xff1b; 从服务的能力上看&#xff0c;可以进行分层管控&#xff0c;只是其中有相当一部分服务层&#xff0c;改动更新的频…

【Python黑科技】自动答题项目代码分析(保姆级图文+实现代码)

目录 实现效果图片素材和源码 实现思路1. 打开对应网页&#xff0c;做好准备工作2. 获取正确答案3. 答题4. 提交试卷实现代码总结 欢迎关注 『Python黑科技』 系列&#xff0c;持续更新中 欢迎关注 『Python黑科技』 系列&#xff0c;持续更新中 实现效果 图片素材和源码 已经…

chatgpt赋能python:Python如何在图像上标注

Python如何在图像上标注 对于图像标注&#xff0c;Python提供了许多工具和库&#xff0c;其中最常用的是OpenCV和Pillow。这篇文章将介绍如何使用Pillow在图像上进行标注。 安装Pillow库 在使用Pillow库之前&#xff0c;需要先安装它。在命令行中输入以下命令&#xff1a; …