干货分享 | CloudQuery 数据保护能力之动态数据脱敏!

news2025/1/21 22:10:44

在企业数字化转型的过程中,尤其随着互联网+、云计算、大数据等信息技术与通信技术的迅猛发展,海量数据在各种信息系统上被存储和处理,其中包含大量有价值的敏感数据,这意味着数据泄露的风险也不断增加。

数据泄露可能由各种因素引起,包括恶意攻击、黑客入侵、员工失误、设备丢失或盗窃等。一旦数据泄露,个人隐私将面临泄露风险,可能导致身份盗窃、金融欺诈、个人信息滥用等问题。此外,一些行业和法规要求组织必须采取措施来保护敏感数据,例如金融机构需要保护客户的个人身份信息,医疗机构需要保护患者的病历数据。

为了应对这些挑战,数据脱敏技术应运而生。数据脱敏是一种数据保护方法,通过对敏感数据进行修改、转换或隐藏,以保护数据的安全性和隐私性。脱敏后的数据仍然保留其原始数据的结构和格式,但不包含直接识别个人的敏感信息。

数据脱敏也成为大部分企业在数据管控中的必修课。

CloudQuery 的数据脱敏能力

CloudQuery 目前已经搭载了静态脱敏和动态脱敏两种数据脱敏方式。

静态脱敏是一种在数据存储或传输过程中对数据进行脱敏处理的方法,采用“先脱敏-后分发”的方式。它通常在数据收集和存储阶段对敏感信息进行脱敏,以确保数据在存储和传输过程中的安全性。静态脱敏的目标是通过对敏感信息进行不可逆的处理,使其无法还原为原始数据,以保护个人隐私。

而动态脱敏一种在数据使用过程中动态地对敏感信息进行脱敏处理的方法。与静态脱敏不同,动态脱敏是在需要使用敏感信息时进行加密,其他情况下仍保持数据的明文状态。可以说,动态脱敏的核心概念是根据实际需求和使用场景,在数据使用过程中灵活调整脱敏级别和方式,以实现更高级别的隐私保护和数据可用性的平衡。

动态数据脱敏和静态数据脱敏适用于不同的场景,两者之间没有优劣之分,主要是以使用场景来选择合适的脱敏模式。目前 CloudQuery 静态脱敏功能仅对企业版客户开放,本文将主要介绍几个版本的通用能力——动态脱敏。

CloudQuery 动态脱敏解决方案

目前主流的动态脱敏技术路线分为「结果集解析」和「语句改写」两条路径:

  • 结果集解析:
    不改写发给数据库的语句,需要提前获悉数据表结构,待数据库返回结果后再根据表结构判断集合内哪些数据需要脱敏,并逐条改写结果数据。

  • 语句改写:
    将包含敏感字段查询的语句改写,对于查询中涉及的敏感字段(表列)通过外层嵌套函数的方式改写,使得数据库运行查询语句时返回不包含敏感数据的结果集。

但两种方法各有优劣。「结果集解析」具备更高的灵活性和数据可用性,但同时在处理大规模数据时会带来一定的性能开销。「语句改写」效率更高,其在查询语句中改写敏感字段的方式更确保敏感数据不会传输到应用层或其他环节,保证较高的数据安全性,同时语句改写还具备良好的可移植性。但相对的,因为在查询语句中进行修改,「语句改写」势必会限制一些复杂查询,其可定制性较弱。

针对两种方法的不同,CloudQuery 在动态脱敏的实现上融合了 SQL 语句改写与结果集改写两种技术路线优点,实现了性能和适用性的平衡,用户可基于不同的场景根据 SQL 语句的不同,触发不同方式的脱敏,全面覆盖运维场景和业务场景下数据实时脱敏需求。

例如:select * from table1;

该语句由于语句中是查询的所有列,这时我们不会进行前置脱敏,转而在执行结束之后,对比结果集中的列名,判断与已配置的列名是否相同,去进行结果集解析的脱敏。

而下面这种:select a from table1;

在语句中有显式的查询 a 这个列,则会对 a 进行改写,将语句改写成select func(a) from table1;

去执行,这样就只会使用前置脱敏,而不用去遍历结果集。

使用过程中可以根据数据量和性能要求使用不同的 SQL 语句去查询。

CQ 的动态脱敏功能如何使用?

CloudQuery 社区版 v2.0.0 的动态脱敏功能无须改变生产数据库中的数据,即可依据用户级别、数据级别,对数据库返回数据进行差异化脱敏。可以确保不同角色的用户能够差异化地访问数据库中的敏感数据。支持截取、加密、隐藏、替换等脱敏算法。

在 CloudQuery 的主页面点击「数据保护管理」菜单按钮可进入数据保护设置页面。


我们这里给 AAA 字段设置一个保留前三位的截取算法。

之后也可在该处或者该表的父级节点选择是否开启规则。

改写前后如下图所示:

(改写前)

(改写后)

CloudQuery 动态脱敏展望

在之后的版本中,CloudQuery 会陆续推出更多功能来完善动态数据脱敏图谱,如:

  • 自定义结果集数据解析规则: 即在一个 schema 下指定一个正则表达式,如手机号码或身份证号,如果查询结果有符合格式的数据,则会按照相应改规则进行脱敏。并且支持内置脱敏规则的自定义添加,该方式可以捕捉到没有被配置的脱敏算法拦截到的敏感数据,进一步保障数据安全。

  • 通过分级方式脱敏: 即支持对字段设置等级,对用户设置等级。不同用户只能查询到其对应等级的数据,不符合要求的数据则会被脱敏,提供更加个性化和精确的隐私保护能力。

  • 数据扫描: 自动识别敏感数据项和敏感数据的位置,扫描后数据可被分类为不同的敏感级别或类别,以便为每个类别应用相应的脱敏规则。同时,数据扫描可以分析敏感数据之间的关联性,确保在脱敏过程中保持数据的一致性和完整性。通过理解敏感数据之间的关系,可以确保脱敏后的数据仍然具有可用性和实用性。

  • 字段脱敏算法推荐: 针对不同的应用场景和需求推荐不同的字段脱敏算法,结合多种算法和策略,以实现对不同类型的敏感数据进行灵活、安全和高效的脱敏处理。

动态数据脱敏是 CloudQuery 数据保护管理能力里的重要组成部分。通过实时对敏感数据进行脱敏处理,在数据使用和共享的过程中减少了对敏感信息的可见性,从而降低了数据泄露和滥用的风险。

后续 CloudQuery 不仅会完善动态脱敏功能,更会不断补充数据保护能力。目前在 CloudQuery 企业版中就已经实现了国密支持、审计日志、数据备份等能力。综合运用这些数据保护措施,企业可以建立起完善的数据安全和隐私保护体系,保障数据的安全性、完整性和可用性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/618478.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【项目】实现web服务器

目录 1.需要实现的项目需求(web服务器的工作原理) 2.实现过程: 1.编写套接字 2.多线程的代码和任务类 3.文件描述符的处理方法的框架 4.读取请求 4.1.读取请求行 4.2.读取请求报头 4.3.分析请求行和报头 请求行的方法、URI、版本…

桌面图标删不掉?试试这几个解决办法!

案例:我想对电脑桌面上的应用进行删除,但是我怎么删也删不掉应用的图标?有人知道这是怎么回事吗?怎样才能成功删除桌面图标?求一个解决办法! 有时候我们可能会遇到桌面图标无法删除的困扰,桌面…

【已解决】Macbook pro/Macbook air 电脑过热问题(附软件下载地址)

问题: 今天早上一上班打开我的macbook air,刚开机了十来分钟,就觉得左上角位置特别的热,耳朵凑近风扇处,基本听不到风扇的声音,风扇的转速太慢,导致cpu温度堆积造成温度升高。 解决办法&#…

【JS】1705- 重学 JavaScript API - Fullscreen API

❝ 前期回顾: 1. Page Visibility API 2. Broadcast Channel API 3. Beacon API 4. Resize Observer API 5. Clipboard API 6. Fetch API 7. Performance API 8. WebStorage API 9. WebSockets API ❞ 本文中,我们将探索 Fullscreen API 的概念、使用方法…

SpringBoot+Vue 的简历招聘系统

文章目录 1、效果演示2、 前言介绍3、主要技术4 **系统设计**4.1 系统体系结构4.2开发流程设计4.3 数据库设计原则4.4 数据表 5 **系统详细设计**5.1管理员功能模块5.2用户功能模块5.3前台首页功能模块 6、源码获取 1、效果演示 2、 前言介绍 随着科学技术的飞速发展&#xff…

加速5G部署,到底该怎么做?

今天,第31届中国国际信息通信展(PT展)在北京国家会议中心圆满落幕。 这次通信展,在举办日期上有着特殊的意义。因为,今年的6月6日,正好是国内5G牌照正式发放的四周年纪念日。而且,去年大概这个时…

DETR模型转RKNN

目录 1.前言 2.准备工作 3.开始转模型 4.测试代码 5.不想转,直接用也可以,转好的给你,请关注评论一下 1.前言 RKNN出最新版本了,测试了一下,rk在transformer方面做了很多的工作,至少之前不能转的模型&am…

ReadProcessMemory可不是一个进程间通信的好方法

有时候我看到有人会使用 ReadProcessMemory 这个 API 来实现进程间通信,老实说吧,我觉得这不是一个明智的选择,原因有如下几条。 首先,你不能使用 ReadProcessMemory 来跨越安全上下文 (Security Contexts),至少你需要…

SpringCloud入门实战(八)- Gateway服务网关集成

📝 学技术、更要掌握学习的方法,一起学习,让进步发生 👩🏻 作者:一只IT攻城狮 ,关注我,不迷路 。 💐学习建议:1、养成习惯,学习java的任何一个技术…

macOS Sonoma 14.0 (23A5257q) Beta1 带 OC 引导双分区黑苹果镜像

6月6日,在WWDC2023开发者大会上,苹果带来了全新Mac系统,命名为macOS Sonoma。该系统最大的亮点是带来了小组件,macOS Sonoma可以添加手机上的所有小组件,包括车辆小组件。 镜像下载: 微信公众号&#xff1…

聚观早报 | 苹果发XR头显Vision Pro;英特尔将出售部分Mobileye股票

今日要闻:苹果发XR头显Vision Pro;英特尔将出售部分Mobileye股票;华为已申请注册两枚NETGPT;瑞幸咖啡全国门店数量突破1万家;iPhone15系列本月将在郑州富士康量产 苹果发XR头显Vision Pro 6 月 6 日,苹果 …

从零手写操作系统之RVOS环境搭建-01

从零手写操作系统之RVOS环境搭建-01 背景介绍操作系统的定义操作系统的分类典型的 RTOS 介绍课程系统RVOS简介 Hello WorldQEMU介绍QEMU-virt 地址映射 系统引导引导程序要做哪些事情如何判断当前hart是不是第一个hart?如何初始化栈? 如何在屏幕输出Hello World通过串口输出U…

基于java SpringBoot框架和Vue的智能停车场管理系统

近年来,中国不仅综合国力大幅提升,国民经济也快速增长,推动了中国汽车工业的发展。技术的飞速发展逐渐降低了汽车的制造成本,越来越受欢迎。今天,大多数家庭都有能力购买汽车,因此,中国城市的汽…

R语言手动绘制连续线条的校准曲线(Calibration curve)(4)

校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。 一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。 我们既往已经通…

基于组件化开发思想的微信小程序开发框架

跨端框架的出现为小程序应用的开发带来了巨大的便利性和灵活性。它们提供了统一的开发方式、代码复用的能力,并且与小程序容器技术紧密结合,实现了一次编码、多端运行的目标。开发者可以根据项目需求和团队技术栈选择合适的跨端框架,从而在不…

【大数据工具】Spark 伪分布式、分布式集群搭建

Spark 集群搭建 Spark 安装包下载地址:https://archive.apache.org/dist/spark/ 1. Spark 伪分布式安装 安装前提:安装 Spark 前需要先安装好 JDK 1. 上传并解压 Spark 安装包 使用 fileZilla 或其他文件传输工具上传 Spark 安装包:spar…

简单易懂的 nvm 和 Node.js 版本控制指南

NVM是Node.js的版本管理工具,可以方便地在不同版本的Node.js之间切换。它可以通过命令行或者脚本来管理Node.js的版本,支持在同一台机器上安装多个版本的Node.js,并能够方便地切换它们。 NVM的主要功能包括: 安装和卸载Node.js的不…

2022年国赛高教杯数学建模A题波浪能最大输出功率设计解题全过程文档及程序

2022年国赛高教杯数学建模 A题 波浪能最大输出功率设计 原题再现 随着经济和社会的发展,人类面临能源需求和环境污染的双重挑战,发展可再生能源产业已成为世界各国的共识。波浪能作为一种重要的海洋可再生能源,分布广泛,储量丰富…

DevExpress WinForms v23.1新功能抢先看——支持系统强调色更改

DevExpress WinForm 下一个主要版本(v23.1)将在6月份左右发布,本文将为大家介绍在早期访问预览版(EAP)中包含的新功能。 PS:DevExpress WinForm拥有180组件和UI库,能为Windows Forms平台创建具…

5月琐碎但值得的事情

转眼间时间就来到了6月份,又该写5月的思考总结了,依然记录一些5月份发生的小事或者收获, 这些内容本意给我记录生活的,如果对你有一些帮助就更好了。 往期: 1月的碎碎念,但是很有必要 二月的一些琐事&#…