安全数据资产统一管理

news2024/11/30 8:32:39

安全数据资产
统一管理DataOps,即 Data 和 Operations 的集成,于 2014 年首次提出。Gartner 将 DataOps
定义为“一种协作性的数据管理
实践,专注于改进组织内数据管道的通信、集成和自动化”[7]。DataOps 是一种面向流程的自动化方法,适用于从数据采集到生成数据分析
报告的整个数据生命周期,通过创建对数据、数据模型和相关组件的可预测交付和变更管理,实现
更快的价值交付。在整个数据生命周期中,DataOps 提供一个所有成员无缝协作的环境,
协助数据团队将数据孤岛转变为敏捷、高速、自动化的数据供应链,持续改善和优化整个
数据管道,最大限度发挥数据价值。
DataOps 在产品开发的各个方面保障数据完整性,旨在提高数据分析质量和缩短数据
分析周期,提高企业使用数据的效率,降低使用数据的门槛和成本,让数据为企业带来更
多价值在这里插入图片描述

数据存储

定义内涵

数据存储是指将数据以某种格式记录在计算机内部或外部存储介质上。在本节中主要介
绍 SecXOps 中的数据集存储方式。

技术背景

传统的数据存储是一个手动的、管理进行驱动的过程,需要专家知识管理数据存储的整
个周期,不仅成本昂贵、耗费大量资源,也易受到存储资源复杂性的困扰和限制。随着数据
向云上部署进程的推进,传统管理方法使得存储过程和 IT 运营更为困难。DataOps 的问世缓
解了上述困境。
DataOps 的理念建立在 DevOps 之上,旨在实现敏捷数据存储、分析和管理。眼下很多
公司和企业都没有完善的数据管理过程,缺乏版本控制、持续集成等环节,数据的传递流程
需要人去沟通,而 DataOps 则是建立了一个完整的数据管道,极大地简化了数据的存储管理
流程。
一个典型的数据管道包括数据提取、集成、转换和分析阶段。在数据存储阶段,敏捷数
据流程往往从单个数据子集和子集的增量价值交付开始,需要软件开发人员、IT 运维人员和
数据团队之间进行协作,并尽可能将这个流程自动化。
DataOps 以数据作为基础和支撑。然而,对安全领域而言,安全数据资产的合法获取十
分困难。安全数据的来源通常是黑客论坛、博客、社交网络、应用程序论坛等,但这些渠道
获取的数据存在以下问题:一是数据量往往不足以支撑项目的运行,二是数据质量无法保障,
三是数据集中是否存在投毒数据、是否携带后门触发器等风险尚未可知。开发者也可以通过
爬虫程序获取安全数据,但许多企业已经具备反爬虫意识,在网页代码中嵌入了反爬虫策略,
同时也为数据收集者带来了法律风险。总之,安全数据的收集在获取渠道、获取方式上都存
在着较高难度。

思路方案

在众多开源的自动化机器学习平台中,数据的存储方式各有差异。例如 H2O,它能够从
HDFS、S3、NoSQL、SQL 中读取数据或写入数据,能从本地和分布式文件系统接收 CSV 格
式的数据,支持写代码对数据进行处理。Databricks 则与 Spark 和 Apache 的数据湖相结合,
为批处理或流式提取、转换和加载提供了一个简单的接口。
021
SecXOps 关键技术
而在 SecXOps 平台上,我们允许用户创建多个数据集,同时一个数据集可以拥有多
个版本,在每一个版本里可以存放大量的数据。一个数据集版本内的全部数据存放在一个
Kubernetes 的 PVC 当中。
PVC 是 Kubernetes 中的一个概念,全称是持久卷申领,表达了用户对存储的需求。PV
又叫持久卷,是集群中的一块存储,可以由集群管理员预先制备,也可以通过使用存储类
(storage class)来动态制备。PVC 的申领会耗费 PV 资源,SecXOps 平台上部署了 NFS 的
存储服务作为一个存储类,允许 Kubernetes 在创建 PVC 时自动创建一个 PV。
当用户想要访问数据集时,平台会根据用户的选择,创建一个 ReplicaSet。ReplicaSet
是 Kubernetes 中的一种 Pod 控制器,主要作用是能够保证一定数量的 Pod 能够正常运行。
ReplicaSet 会持续监听这些 Pod 的运行状态,一旦 Pod 发生故障,就会重启或重建。由于数
据集的查看和在线编辑对性能需求并不会很高,因此 ReplicaSet 下创建一个 Pod 即可。Pod
内包含一个用户容器,将数据文件所在的 PVC 挂载到该容器上,供用户上传、下载或在线编
辑数据文件。SecXOps 支持用户选择数据集版本的打开方式,平台上集成了 jupyterlab,允
许用户能够编写脚本对数据集进行批量化的在线修改,同时还集成了 filebrowser,允许用户
能够快速地批量上传和下载文件。
SecXOps 不仅支持用户从本地上传数据文件,从用户个人或企业内部配置的数据管理服
务(如 LakeFS 等)中批量导入数据文件,从公有数据管理服务中批量导入数据文件,还支
持用户自定义部署数据采集服务(例如一些流量采集等服务),自动化生成数据集,全面打通数据获取通道,让安全数据的来源更加广泛

参考资料

绿盟SecXOps安全智能分析技术白皮书

友情链接

GB-T 38674-2020 信息安全技术 应用软件安全编程指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/84886.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

U盘被写保护怎么解除?解决方案只需这几个

U盘写保护是一种物理开关保护功能,用于防止存储介质上的数据被错误删除或者写入。如果你想去掉“写保护”,u盘被写保护怎么解除?看看下面的解决方案是怎么说的,赶紧跟随下面去掉U盘写保护的步骤来操作吧! 方案一&#…

基于opencv传统数字图像处理实现车道线检测详细过程(附源码)

车道线检测 (Lane Detection) 1、实验内容 本实验使用数字图像处理的基本方法,构建了一个车道线检测模型。该模型可以识别图像中所有的车道线,并得到完整的车道线信息。模型在tuSimple Lane Dataset大小为100的数据子集进行了测…

餐饮门店数字化转型|餐厅管理系统小程序

餐饮行业规模非常庞大,每年都有大量公司或个体户入局,国内各类美食非常多,不同品类菜品都有大量需求,以前几乎在业的餐饮门店,只要运营得当,挣多挣少总归是有利的,也能很好的生存下去&#xff0…

nodejs+vue大学生交流互动论坛网站系统

目 录 1 概述 1 1.1课题背景及意义 1 1.2 国内外研究现状 1 1.3 本课题主要工作 2 2 系统开发环境 3 前端技术:nodejsvueelementui 前端:HTML5,CSS3、JavaScript、VUE 系统分为不同的层次:视图层(vue页面&…

【云计算与大数据技术】Bloom Filter、LSM树、Merkle哈希树、Cuckoo哈希等数据结构的讲解(图文解释 超详细)

一、重要数据结构与算法 分布式存储系统中存储大量的数据,同时需要支持大量的上层读/写操作,为了实现高吞吐量,设计和实现一个良好的数据结构能起到相当大的作用 这是以下三个数据库使用的数据结构,一个良好的数据结构对于分布式系统来说有…

Swift 周报 第十九期 |技术汇总

前言 本期是 Swift 编辑组自主整理周报的第十期,每个模块已初步成型。各位读者如果有好的提议,欢迎在文末留言。 欢迎投稿或推荐内容。目前计划每两周周一发布,欢迎志同道合的朋友一起加入周报整理。 十期磨一剑,废铁亦有形&am…

使用TensorFlow Probability实现最大似然估计

TensorFlow Probability是一个构建在TensorFlow之上的Python库。它将我们的概率模型与现代硬件(例如GPU)上的深度学习结合起来。 极大似然估计 最大似然估计是深度学习模型中常用的训练过程。目标是在给定一些数据的情况下,估计概率分布的参数。简单来说&#xff0…

开源依赖项管理指南

就像人际关系中人与人之间的关系一样,软件生态系统中包含一个庞大的关系网络。其中一些联系非常深入,而有一些关系则更为表面。但实际上,现代基于开源的软件开发涉及一个极其庞大的依赖关系树,依赖关系层层叠加,同时涉…

喜讯丨创新微MinewSemi的MS11SF1系列荣获2022中国IoT创新奖—产品金狮奖

北京时间2022年12月8日,由知名电子科技媒体“电子发烧友”举办的2022第九届中国IoT大会在深圳圆满落幕,创新微MinewSemi凭借高性能、低功耗的WiFiBLE Combo 模块—MS11SF1系列,在众多参会嘉宾和行业主流媒体的共同见证下,荣获2022…

卷积神经网络中卷积的作用与原理

目录 前言 卷积的作用 卷积的参数 卷积核大小(kernel_size) 填充(padding) same valid full 卷积核算子(operator) Robert 算子 Prewitt算子 Sobel 算子 Laplance 算子 卷积核深度与个数&…

【C++进阶】哈希(万字详解)—— 运用篇(下)

🎇C学习历程:入门 博客主页:一起去看日落吗持续分享博主的C学习历程博主的能力有限,出现错误希望大家不吝赐教分享给大家一句我很喜欢的话: 也许你现在做的事情,暂时看不到成果,但不要忘记&…

[附源码]Python计算机毕业设计电子工厂进销存管理系统Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

为什么要把测试环境的告警当成生产环境的告警处理?是一个哲学问题,还是一个技术问题?...

开发不愿意了一个后端服务通常有三个环境:测试环境,预发布环境,生产环境。运维在给测试环境增加告警规则和告警路由时,开发人员反对。这很容易理解,如果真把告警规则配置到测试环境,他们可能无时不刻地收到…

Web GIS开发教程

Web GIS开发教程 非程序员的基本 Web GIS 开发 课程英文名:Web GIS development course 此视频教程共4.0小时,中英双语字幕,画质清晰无水印,源码附件全 下载地址 课程编号:355 百度网盘地址:https://p…

杭州联合银行 x 袋鼠云:打造智能标签体系,助力银行大零售业务转型

“智能标签平台上线后,支行及业务部门已创建多个客群用于营销,为我行客户精细化管理打下了良好基础。” 2021 年,联合银行就已搭建了大数据基础平台,围绕平台搭建了数据研发平台、大数据调度平台及大数据服务平台,提高…

(附源码)Python飞机票销售系统 毕业设计 141432

摘 要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存…

Vue组件的嵌套关系,父组件传递子组件 ,事件总线,Provide,inject,作用域插槽,具名插槽非props的attribute ,子组件传递父组件

组件化 – 组件间通信 认识组件的嵌套 ◼ 前面我们是将所有的逻辑放到一个App.vue中:  在之前的案例中,我们只是创建了一个组件App;  如果我们一个应用程序将所有的逻辑都放在一个组件中,那么这个组件就会变成非常的臃 肿和难以维护;  所以组件化的核心思想应该是对…

【YOLOv5】记录YOLOv5的学习过程

以下记录的是Ubuntu20.04版本,其他Ubuntu版本也相差不大~ 一、安装pytorch GPU版本、显卡驱动、CUDA、cuDNN 下载pytorch GPU版本: 最新版本链接:Start Locally | PyTorch 历史版本链接:Previous PyTorch Versions | PyTorch…

MySQL——内置函数

文章目录内置函数日期函数字符串函数数学函数其他函数内置函数 日期函数 基本使用: 可以进行运算: 在日期基础上加时间 在日期基础上减时间 计算两个日期相差的天数 案例1: 建一张表,记录生日 案例2: 创建一…

设计有趣的轻巧真无线,体积小续航长,南卡小音舱上手

大家平时都会听听音乐、玩玩游戏,这时候就需要用到蓝牙耳机,特别是在户外接打电话时,戴上一副耳机都会方便很多。最近发现了一款南卡小音舱Lite2,这些天用过之后感觉它质量不错,做得十分小巧,日常携带特别方…