【OSS安全最佳实践】对OSS表格文件中的敏感数据进行脱敏

news2025/1/9 2:08:30

使用数据安全中心 DSC(Data Security Center)的静态脱敏,对当前账号下源OSS Bucket中的结构化TXT、CSV、XLSX和XLS格式文件中的敏感数据进行脱敏,然后将脱敏后的文件保存到当前账号下的目标OSS Bucket,实现数据的安全共享。

方案概览

脱敏后数据示例:

脱敏前的数据

脱敏后的数据

姓名

手机号

身份证号码

姓名

手机号

身份证号码

张三三

13900001234

111222190002309000

张**

139****1234

111###########9000

李四四

13900001111

150802202207214000

李**

139****1111

150###########4000

王五五

13900002222

120105195001066000

王**

139****2222

120###########6000

要实现以上数据脱敏效果,只需4步:

  1. 创建OSS Bucket并上传文件:创建源OSS Bucket和目标OSS Bucket,并上传包含敏感数据的表格文件到源OSS Bucket。

  2. 将OSS Bucket文件接入DSC:DSC授权接入OSS Bucket,确保DSC能对OSS Bucket进行读取和写入操作。

  3. 新增脱敏任务:创建脱敏任务,配置源文件中敏感字段的脱敏算法及对应脱敏规则,以及脱敏后文件的存储位置等。

  4. 启动脱敏任务:启动任务,对源OSS Bucket中表格文件中的敏感数据进行脱敏,然后将脱敏后的文件保存到目标OSS Bucket。

 

前提条件

  • 当前账号已购买数据安全中心实例并授权数据安全中心访问其他阿里云资源。

    因数据安全中心服务仅企业版实例支持数据脱敏功能,所以必须购买数据安全中心的企业版,本示例针对OSS文件数据脱敏,仅需开启OSS数据管理服务,选择最低标准的OSS防护容量,对于数据库管理增值模块服务可以全部关闭。

  • 当前账号已开通对象存储OSS。

步骤一:创建OSS Bucket并上传文件

1.1 创建源OSS Bucket和目标OSS Bucket

  1. 在对象存储OSS控制台的Bucket列表页面,单击创建Bucket

  2. 创建 Bucket面板,配置如下参数,其他参数采用默认配置,然后单击完成创建。该OSS Bucket作为源OSS Bucket使用。

    image

  3. 重复以上操作步骤,再创建一个OSS Bucket作为目标OSS Bucket使用。

1.2 上传表格文件到源OSS Bucket

  1. 在对象存储OSS控制台的Bucket列表页面的Bucket列表,单击源OSS Bucket名称。

  2. 文件列表页面,单击上传文件

  3. 单击扫描文件,选择本地文件(本文上传示例文件userdata.csv中包含姓名、手机号和身份证号码的敏感信息),然后单击上传文件,等待文件上传成功。

    image

步骤二:将OSS Bucket文件接入DSC

  1. 在数据安全中心的授权管理页面,单击资产授权管理

  2. 资产授权管理面板的非结构化数据下,选择OSS,单击资产同步

  3. 资产同步完成后,选择源OSS Bucket和目标OSS Bucket,然后单击批量授权

    image

  4. 批量授权完成后,在资产授权管理页面,选择源OSS Bucket和目标OSS Bucket,然后单击批量连接

    image

  5. 在提示框中,无需选中数据扫描和识别,直接单击确定

    3.png

    等待OSS Bucket的连接状态变为已连接

步骤三:新增脱敏任务

在数据安全中心的数据脱敏页面,单击新增脱敏任务。根据页面导航,完成数据脱敏任务配置。

3.1 配置脱敏的源文件

输入任务名称后,配置脱敏源为源OSS Bucket中敏感文件userdata.csv,对于csv类型的文件,需要指定列分隔符为逗号,本文示例文件表格包含标题行。

image

3.2 配置敏感字段的脱敏规则

脱敏算法导航页中自动匹配展示userdata.csv中标题行字段,本示例对姓名、手机号和身份证号码进行遮盖脱敏

  1. 分别打开对应字段的脱敏开关,选择遮盖脱敏

    image

  2. 单击遮盖脱敏后的参数查看和修改,配置算法规则,单击保存。本示例配置以下脱敏规则:

    image

    • 姓名:使用*遮盖,保留前1后0。

    • 手机号:使用*遮盖,遮盖自4至7。

    • 身份证号码:使用#遮盖,保留前3后4。

3.3 配置脱敏后文件的存储位置

OSS数据源不支持添加水印,直接配置脱敏后文件到目标Bucket中存储,本示例选择结果集形式保存,文件名可以自定义,文件类型必须为csvxlstxt

image

3.4 配置脱敏任务的触发方式

目前针对OSS文件脱敏任务,仅支持任务触发方式生效,其他参数配置均无效。

  1. 配置任务触发方式仅人工

    image

  2. 单击提交

步骤四:启动脱敏任务

4.1 执行任务

  1. 静态脱敏页签的任务配置页签,单击新创建的脱敏任务操作列的启动,执行脱敏任务。

    image

  2. 静态脱敏页签,单击任务状态子页签,等待脱敏任务的执行进度为100%和状态为执行成功

    image

4.2 检验脱敏结果

  1. 前往对象存储OSS控制台的Bucket列表页面,单击目标Bucket名称,在文件列表中找到脱敏后的文件,文件名格式为<目标文件名称>_<脱敏任务的执行时间>.<文件类型>。例如usernews_20240808150643.csv,其中20240808150643表示任务执行时间为2024年08月08日的15:06:43。您可以单击下载获取该文件。

    image

  2. 下载完成后,打开该文件,可以看到姓名、手机号、身份证号码已显示为脱敏后的数据。

    image

总结

对于存储在OSS Bucket中原始数据,可以脱敏后存储到目标OSS Bucket再共享使用。数据脱敏后,即使共享数据遭泄露,也不会直接暴露敏感内容,降低了数据滥用和隐私侵犯的风险。脱敏后的数据可以在不泄露个人隐私的前提下,用于数据分析、模型训练、业务报告分享等场景。

灵活选择脱敏算法

数据脱敏主要依赖脱敏算法及其规则,DSC支持的脱敏算法包括哈希脱敏、遮盖脱敏、替换脱敏、变换脱敏、加密脱敏、数据解密和洗牌脱敏,每个脱敏算法都具备多种规则配置方法,在实际业务需求中可以选择不同脱敏算法应用到不同的业务场景中。

image

提升脱敏规则配置效率

DSC还支持脱敏模板功能,可以将相同应用场景中使用频率较高的脱敏算法配置在同一个脱敏模板中,并在配置静态脱敏规则时使用已有模板,提高配置脱敏规则的效率。

更多内容,请参见配置脱敏模板和算法。

定时脱敏任务

数据脱敏任务支持按照每小时、每天、每月或每周的某个时间点定时触发,以保障更新的数据能及时被脱敏使用。

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2168256.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue实现文件解压缩

1. 使用CompressionStream API实现压缩 这里开启了多线程解压缩 <template><div class"page"><input type"file" placeholder"选择文件" id"file" /><button click"compress(compress)">压缩<…

基础算法(4)——前缀和

1. 前缀和 题目描述&#xff1a; 解法一&#xff1a;暴力解法 直接模拟实现题目流程即可 时间复杂度为&#xff0c;根据题目给出的条件&#xff0c;肯定会超时 解法二&#xff1a;前缀和&#xff08;适用题型&#xff1a;快速 求出数组中某一个 连续区间 的 和&#xff09;…

什么录屏软件最好?这四款软件留着有用!

在这个数字化时代&#xff0c;无论是教学分享、游戏直播还是产品演示&#xff0c;高质量的录屏软件都成为了我们不可或缺的工具。面对市面上琳琅满目的选择&#xff0c;到底哪款录屏软件才能真正满足你的需求&#xff0c;成为你创作路上的得力助手呢&#xff1f;别急&#xff0…

如何调用Ascend C算子

Ascend C是CANN针对算子开发场景推出的编程语言&#xff0c;原生支持C和C标准规范&#xff0c;兼具开发效率和运行性能。基于Ascend C编写的算子程序&#xff0c;通过编译器编译和运行时调度&#xff0c;运行在昇腾AI处理器上。使用Ascend C&#xff0c;开发者可以基于昇腾AI硬…

【ADC】ΔΣ ADC 中数字滤波器的延迟以及 SAR ADC 与 ΔΣ ADC 的差异对比总结

本文学习于TI 高精度实验室课程&#xff0c;深入探讨 delta-sigma 转换器中使用的数字滤波器。具体来说&#xff0c;本文将重点介绍数字滤波器如何引入延迟&#xff0c;因为这是 SAR 和 delta-sigma ADC 之间的显著差异。 文章目录 一、低延迟数字滤波器二、高延迟数字滤波器三…

MSVCR100.dll丢失怎么办,教你6种解决MSVCR100.dll丢失的方法

在计算机的日常使用中&#xff0c;我们可能会遇到各种各样的问题&#xff0c;其中之一就是MSVCR100.dll文件丢失。这个文件是Microsoft Visual C 2010的一个组件&#xff0c;如果丢失&#xff0c;可能会导致某些程序无法正常运行。那么&#xff0c;如何解决这个问题呢&#xff…

拉取指定版本的代码

// 获取指定版本的分支 https://git.swf.daimler.com/mbient/meta-mbient/-/blob/release/E066.1-2024.07.31-457-4870220-4882586/meta-mbient/recipes-mbient/dialog-domain-handlers/dialog-domain-handlers_git.bb?ref_typetags meta-mbient meta-mbient recipes-mbient …

大数据新视界 --大数据大厂之 Spark Streaming 实时数据处理框架:案例与实践

&#x1f496;&#x1f496;&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎你们来到 青云交的博客&#xff01;能与你们在此邂逅&#xff0c;我满心欢喜&#xff0c;深感无比荣幸。在这个瞬息万变的时代&#xff0c;我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

如何通过10个简单步骤,让AI创作效率翻倍,性能提升90%

本文背景 随着不断深入地使用 AI 以及体验更多产品 最近对于大模型的使用感悟又有了一些新收获。 今天&#xff0c;特意来和大家分享 10 个大模型的使用妙招 。 这既是分享&#xff0c;也是我自己的学习梳理。 下面介绍的这些技巧&#xff0c;适用于所有大模型应用&#xff08;…

9月26日

1.虚函数与纯虚函数&#xff1a; 在类中定义函数时&#xff0c;在函数前加关键字 virtual &#xff0c;允许在派生类中重写的方法。那么该函数就是虚函数。 纯虚函数&#xff1a;没有实现的方法&#xff0c;用于定义接口。 2.基类为什么需要虚析构函数&#xff1a; 确保删除派生…

使用 Higress AI 插件对接通义千问大语言模型

前言 什么是 AI Gateway AI Gateway 的定义是 AI Native 的 API Gateway&#xff0c;是基于 API Gateway 的能⼒来满⾜ AI Native 的需求。例如&#xff1a; 将传统的 QPS 限流扩展到 token 限流。将传统的负载均衡/重试/fallback 能力延伸&#xff0c;支持对接多个大模型厂…

深入浅出 AbstractQueuedSynchronizer (AQS)

文章目录 什么是 AQSAQS 的工作原理同步状态&#xff08;state&#xff09;等待队列 AQS 是如何让线程排队并唤醒的公平锁和非公平锁AQS 的应用场景ReentrantLock&#xff08;可重入锁&#xff09;AQS 在 ReentrantLock 中的工作原理典型应用场景 CountDownLatch&#xff08;倒…

基于Django技术开发的酒店信息管理系统,包括员工用户功能和管理员用户功能两部分

项目摘要 该项目是基于Django技术开发的一套酒店管理系统&#xff0c;系统应用浏览器/服务期&#xff08;Browser/Server&#xff09;架构。系统主要包括员工用户功能和管理员用户功能两部分。开发员工信息管理、顾客信息管理、会员信息管理、停车场信息管理、餐厅信息管理、客…

HTML5+CSS3小实例:立方体控件的登录表单

实例:立方体控件的登录表单 技术栈:HTML+CSS 效果: 源码: 【HTML】 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial…

【算法篇】二叉树类(1)(笔记)

目录 一、认识二叉树 1. 二叉树的种类 &#xff08;1&#xff09;满二叉树 &#xff08;2&#xff09;完全二叉树 &#xff08;3&#xff09;二叉搜索树 &#xff08;4&#xff09;平衡二叉搜索树 2. 二叉树的存储方式 3. 二叉树的遍历方式 4. 二叉树的定义 二、Leet…

(done) 使用泰勒展开证明欧拉公式

问问神奇的 GPT&#xff0c;how to prove euler formula? 一个答案如下&#xff1a;

华硕NUC亮相工博会,解锁工业AI PC解决方案

2024年9月24日至28日&#xff0c;中国国际工业博览会于上海国家会展中心盛大举行&#xff0c;华硕智能物联网展台位于展馆6.1H E183展位&#xff0c;在展位上华硕向大众展示了智能AI、物联网设备、华硕NUC等解决方案及IoT硬件产品&#xff0c;吸引了众多专业观众驻足交流和体验…

线程池的执行流程和配置参数总结

一、线程池的执行流程总结 提交线程任务&#xff1b;如果线程池中存在空闲线程&#xff0c;则分配一个空闲线程给任务&#xff0c;执行线程任务&#xff1b;线程池中不存在空闲线程&#xff0c;则线程池会判断当前线程数是否超过核心线程数&#xff08;corePoolSize&#xff09…

EfficientViT(2023CVPR):具有级联组注意力的内存高效视觉Transformer!

EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention EfficientViT: 具有级联组注意力的内存高效视觉Transformer 万文长字&#xff0c;请耐心观看~ 论文地址&#xff1a; https://arxiv.org/abs/2305.07027 代码地址&#xff1a; Cream/Effici…

计算机毕业设计 饮食营养管理信息系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…