安全智能分析 技术背景

news2024/11/29 10:34:30

安全数据资产
统一管理DataOps,即 Data 和 Operations 的集成,于 2014 年首次提出。Gartner 将 DataOps
定义为“一种协作性的数据管理
实践,专注于改进组织内数据管道的通信、集成和自动化”[7]。DataOps 是一种面向流程的自动化方法,适用于从数据采集到生成数据分析
报告的整个数据生命周期,通过创建对数据、数据模型和相关组件的可预测交付和变更管理,实现
更快的价值交付。在整个数据生命周期中,DataOps 提供一个所有成员无缝协作的环境,
协助数据团队将数据孤岛转变为敏捷、高速、自动化的数据供应链,持续改善和优化整个
数据管道,最大限度发挥数据价值。
DataOps 在产品开发的各个方面保障数据完整性,旨在提高数据分析质量和缩短数据
分析周期,提高企业使用数据的效率,降低使用数据的门槛和成本,让数据为企业带来更
多价值在这里插入图片描述

数据存储

定义内涵

数据存储是指将数据以某种格式记录在计算机内部或外部存储介质上。在本节中主要介
绍 SecXOps 中的数据集存储方式。

技术背景

传统的数据存储是一个手动的、管理进行驱动的过程,需要专家知识管理数据存储的整
个周期,不仅成本昂贵、耗费大量资源,也易受到存储资源复杂性的困扰和限制。随着数据
向云上部署进程的推进,传统管理方法使得存储过程和 IT 运营更为困难。DataOps 的问世缓
解了上述困境。
DataOps 的理念建立在 DevOps 之上,旨在实现敏捷数据存储、分析和管理。眼下很多
公司和企业都没有完善的数据管理过程,缺乏版本控制、持续集成等环节,数据的传递流程
需要人去沟通,而 DataOps 则是建立了一个完整的数据管道,极大地简化了数据的存储管理
流程。
一个典型的数据管道包括数据提取、集成、转换和分析阶段。在数据存储阶段,敏捷数
据流程往往从单个数据子集和子集的增量价值交付开始,需要软件开发人员、IT 运维人员和
数据团队之间进行协作,并尽可能将这个流程自动化。
DataOps 以数据作为基础和支撑。然而,对安全领域而言,安全数据资产的合法获取十
分困难。安全数据的来源通常是黑客论坛、博客、社交网络、应用程序论坛等,但这些渠道
获取的数据存在以下问题:一是数据量往往不足以支撑项目的运行,二是数据质量无法保障,
三是数据集中是否存在投毒数据、是否携带后门触发器等风险尚未可知。开发者也可以通过
爬虫程序获取安全数据,但许多企业已经具备反爬虫意识,在网页代码中嵌入了反爬虫策略,
同时也为数据收集者带来了法律风险。总之,安全数据的收集在获取渠道、获取方式上都存
在着较高难度。

思路方案

在众多开源的自动化机器学习平台中,数据的存储方式各有差异。例如 H2O,它能够从
HDFS、S3、NoSQL、SQL 中读取数据或写入数据,能从本地和分布式文件系统接收 CSV 格
式的数据,支持写代码对数据进行处理。Databricks 则与 Spark 和 Apache 的数据湖相结合,
为批处理或流式提取、转换和加载提供了一个简单的接口。
021
SecXOps 关键技术
而在 SecXOps 平台上,我们允许用户创建多个数据集,同时一个数据集可以拥有多
个版本,在每一个版本里可以存放大量的数据。一个数据集版本内的全部数据存放在一个
Kubernetes 的 PVC 当中。
PVC 是 Kubernetes 中的一个概念,全称是持久卷申领,表达了用户对存储的需求。PV
又叫持久卷,是集群中的一块存储,可以由集群管理员预先制备,也可以通过使用存储类
(storage class)来动态制备。PVC 的申领会耗费 PV 资源,SecXOps 平台上部署了 NFS 的
存储服务作为一个存储类,允许 Kubernetes 在创建 PVC 时自动创建一个 PV。
当用户想要访问数据集时,平台会根据用户的选择,创建一个 ReplicaSet。ReplicaSet
是 Kubernetes 中的一种 Pod 控制器,主要作用是能够保证一定数量的 Pod 能够正常运行。
ReplicaSet 会持续监听这些 Pod 的运行状态,一旦 Pod 发生故障,就会重启或重建。由于数
据集的查看和在线编辑对性能需求并不会很高,因此 ReplicaSet 下创建一个 Pod 即可。Pod
内包含一个用户容器,将数据文件所在的 PVC 挂载到该容器上,供用户上传、下载或在线编
辑数据文件。SecXOps 支持用户选择数据集版本的打开方式,平台上集成了 jupyterlab,允
许用户能够编写脚本对数据集进行批量化的在线修改,同时还集成了 filebrowser,允许用户
能够快速地批量上传和下载文件。
SecXOps 不仅支持用户从本地上传数据文件,从用户个人或企业内部配置的数据管理服
务(如 LakeFS 等)中批量导入数据文件,从公有数据管理服务中批量导入数据文件,还支
持用户自定义部署数据采集服务(例如一些流量采集等服务),自动化生成数据集,全面打通数据获取通道,让安全数据的来源更加广泛

参考资料

绿盟SecXOps安全智能分析技术白皮书

友情链接

GB-T 38674-2020 信息安全技术 应用软件安全编程指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/85201.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux安装多版本jdk(jdk8和jdk11)并可随意选择版本

一、官网下载不同版本的压缩包 官网下载地址 我这里下载的是jdk8和jdk11 二、将压缩包上传至服务器自定义的文件夹中 三、安装jdk8 1、解压压缩包 tar zxvf /install/java/jdk-8u202-linux-x64.tar.gz2、修改配置 vi /etc/profile在配置文件中添加以下配置(需修改成自己的…

购物车系统设计

1 主要功能 在用户选购商品时,下单前,暂存用户想购买的商品。 购物车对数据可靠性要求不高,性能也无特别要求,在整个电商系统是相对容易设计和实现的一个子系统。 购物车系统的主要功能: 把商品加入购物车&#xf…

3个月前被裁员了,心情跌落谷底,直到学姐给了我这份面试文档…

3个月前的某一天,正在愉快的打工,突然被喊去谈话,然后就被辞退了。。 加入了找工作的大军 然而,因为疫情,因为大专学历的我,找工作比以往都艰难了许多 很多,纯粹就是因为学历,都不…

如何在SpringBoot中异步请求和异步调用

一、SpringBoot中异步请求的使用 1、异步请求与同步请求 特点: 可以先释放容器分配给请求的线程与相关资源,减轻系统负担,释放了容器所分配线程的请求,其响应将被延后,可以在耗时处理完成(例如长时间的运…

Python运维之远程登录paramiko(VsCode)

Python运维之远程登录----paramiko paramiko是一个用于做远程控制的模块,使用该模块可以对远程服务器进行命令或文件操作,paramiko是用python语言写的一个模块,遵循SSH2协议,支持以加密和认证的方式,进行远程服务器的连接。 par…

CentOS7中搭建docker

一、配置要求 系统:Centos7 Linux 内核:官方建议 3.10 以上 1.查看当前的内核版本 uname -r 2.卸载旧版本(如果之前安装过的话) yum remove docker docker-common docker-selinux docker-engine 二、安装Docker 1.安装依赖包 …

【C进阶】第十篇——数据在内存中的存储

数据类型的介绍 类型的基本归类 整型在内存中的存储 原码,反码,补码 大小端介绍 什么是大小端 为什么有大端和小端? 判断当前机器的字节序 浮点型在内存中的存储 例题引入 浮点数的存 浮点数的取 浮点数的比较 数据类型的介绍 char //字符数据类型 short…

现代制造技术产品设计与柔性制造系统的预测和分析

产品设计要求的市场竞争是面向市场,以用户为中心。精益设计的工业设计方法,以及一系列新的设计概念,如制造、装配过程、检查和测量、环境中的绿色设计等,使设计与柔性制造系统的整个过程紧密结合,包括从产品概念设计到…

Flask全栈开发教程

Flask全栈开发教程 成为使用 Flask、Python、HTML、CSS 和 MongoDB 的全栈 Web 开发人员! 课程英文名:Web Developer Bootcamp with Flask and Python 此视频教程共5.0小时,中英双语字幕,画质清晰无水印,源码附件全…

[前端]白屏性能优化

[前端]白屏性能优化 业务面会问的东西 从打开一个页面,到页面的画面展示经历了怎样的过程? 简单来说,有以下几个主要步骤。 1、URL解析:判断浏览器输入的是搜索内容还是URL; 2、查找缓存:如果能找到缓存…

笔试强训(四十四)

目录一、选择题二、编程题2.1 驼峰命名法2.1.1 题目2.1.2 题解2.2 单词倒排2.2.2 题解一、选择题 (1)IPv4版本的因特网总共有多少有效A类地址网络(D) A.255 B.128 C.256 D.126 A类地址的网络号从0~127共128个,其中有两…

大数据 常用命令

常用shell命令 管道命令 查看/etc目录信息前5行信息 执行命令:ll /etc | head -5 查看/etc/profile文件后5行信息 执行命令:cat /etc/profile | tail -5 grep命令 抓取/etc目录下的python信息 执行命令:ll /etc | grep python 抓…

解决visual studio对不安全函数的警告

解决visual studio 对scanf ,strcpy,strcmp等函数的不安全警告报错 可以看到,编译器对scanf进行了报错,原因是说它不安全 编译器自己给了一种解决方案: 使用vs自带的 scanf_s,但是用这个函数,仅…

留学Assignment写作格式简单讲解

对于Assignment写作,不知道大家认为它最基础的东西是什么呢?可能大家的答案都会是格式,毕竟Assignment写作,最需要保证的就是格式无误,特别是文献综述的格式,错了的话后果是非常严重的,下面就给…

Springboot 那年我双手插兜,手写一个excel导出

前言 其实就是利用了csv 和txt 文件转换 。 不多说,开始玩代码。 正文 本篇内容: ① 了解根本生成excel内容的CSV文件玩法 ② 手动拼接文本演示 ③ 项目内实战写法,从数据库到导出 ④ 解决list数据过多,使用分批分页处理生成c…

极智AI | centos7源码编译tensorflow

欢迎关注我的公众号 [极智视界],获取我的更多笔记分享 大家好,我是极智视界,本文介绍一下 centos7 源码编译 tensorflow 的方法。 之前这篇《极智开发 | centos7源码编译bazel》已经为这篇 tensorflow 的源码编译铺平了道路,所以…

[附源码]Nodejs计算机毕业设计基于web的小说浏览系统Express(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流 项目运行 环境配置: Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。 项目技术: Express框架 Node.js Vue 等等组成,B/S模式 Vscode管理前后端分…

【Docker】Docker安装MySQL,并解决中文乱码和配置数据备份同步到宿主机

专栏精选文章 《Docker是什么?Docker从介绍到Linux安装图文详细教程》《30条Docker常用命令图文举例总结》《Docker如何构建自己的镜像?从镜像构建到推送远程镜像仓库图文教程》《Docker多个容器和宿主机之间如何进行数据同步和数据共享?容器…

银河麒麟操作系统V10SP1创建网页快捷方式至桌面的方法

修改浏览器配置文件添加快捷方式 1.在桌面点击鼠标右键,选择‘’打开终端‘’,终端界面显示‘桌面’ 2.在终端界面输入命令行 sudo vim qaxbrowser-safe.desktop (奇安信浏览 器的快捷方式) 进去后按‘/’然后输入‘Exec’,最后按回车键。…

Android监听UEvent之UEventObserver分析

(1)背景概述 众所周知,在安卓系统中有状态栏,在插入外设的时候,会在顶部状态栏显示小图标。 比如,camera设备,耳机设备,U盘,以及电池等等。这些都需要在状态栏动态显示。…