科技云报到:存储开源,风雨飘摇下“披着羊皮的狼”?

news2024/11/20 0:41:38

科技云报道原创。

这些年开源界的风风雨雨,时不时撼动着人们的内心。

image.png

2022年,俄乌冲突导致全球最大的独立开源软件公司SUSE、美国开源软件巨头Redhat、主流开源容器引擎Docker,纷纷宣布停止与俄罗斯的合作。

而全球最大的开源及私有代码项目托管平台Github甚至直接限制所有俄罗斯开发者访问开源存储库。

同年,开源软件JavaScript被植入恶意代码,根据判断是否为俄罗斯IP地址,删除用户的任意文件内容并替换为心形表情符号。

将目光再往前拉远,在2021年末,Apache开源日志记录框架log4j爆发可载入史册的核弹级漏洞,攻击者仅需一行代码便可不留痕迹地控制并接管服务器,导致90%的java开发平台遭受危机。

覆巢之下,焉有完卵?一向推崇“自由、平等、相互尊重”原则的开源技术,在复杂国际环境叠加天生残缺的安全性时,早已变得混沌不清。

重重迷雾之下,这些令人胆战心惊的记录,让开源界一次次感到震惊的同时,也为崇尚开源的中国企业敲响了警钟。

在当今中国发展格局之上,数据存力建设的重要程度不言而喻。存储既是数字世界生生不息的最关键载体,更是守护数据安全与信息资产的最后一道防线。

然而,事实令人些许悲观。

多年以来,中国信息存储技术仍落后于西方。那些被称为“国产”的存储中,又有一大半是基于Ceph、Lustre等国外开源技术进行二次开发,正在大行其道、充斥于世。

在中国飞速向前奔跑的背影中,这种颤颤巍巍的技术堆栈方式,并不在少数。

危机之下,作为中国数字产业根基的存储,眼前横亘着一场叩问灵魂的兴衰战役。到底有多少国产存储在“挂羊头、卖狗肉”?开源存储又该何去何从?

“披着羊皮的狼” 何时露出凶光?

众所周知,存储是一门技术艰深的领域,任何一家企业想要自研一款存款产品,往往需要长达十余年的技术研发积累。

但随着开源技术的爆发,Ceph、HDFS、Swift、Lustre、GlusterFS等国外开源技术的涌现,让很多国内创业公司以及缺乏足够技术底蕴的企业,在短短几年内就摘得了分布式存储这一新船票。

不仅如此,这些公司的做法也十分粗暴。

他们通过对Ceph等开源代码简单的包装、套壳等手段,实现了所谓的“自研”存储,并以商业软件的名义对外出售。

早在2015-2016年,国内诞生了一批这样的国产存储创业公司,比如业内较为知名的X公司、S公司,都美曰其名“自研”,但实际上“自主可控”的成分有多少,恐怕只有厂商自己清楚。

一浪高过一浪,在看见有人尝到开源存储的甜头后,国内不少大厂居然也加入了分布式存储的阵营。

但苦于传统存储技术积淀薄弱,又急于抢占新的市场份额,这些大厂的做法就更为直接。

典型如L厂、X厂,就通过加入Ceph等开源基金会、对Ceph等开源代码进行二次开发和优化、不断提升对各主流开源社区贡献度的方式,来快速获取分布式存储的市场地位。

毕竟,来不及投入工程师人力潜心开发,那站在国外开源巨头的肩膀上踮踮脚,就成为一条捷径。

image.png

尽管借助开源能够在短时间内解决“从无到有”的问题,但是开源存储软件面临的商业化与安全挑战,并不是一时半会儿能解决的。

首先,开源存储代码漏洞频发,被攻击的风险持续加大。

根据美国新思科技(Synopsys公司)的《2023年开源安全和风险分析报告》统计,在审查的1700多个商业软件代码库中,96%包含开源代码,84%代码库有漏洞,且高达48%包含至少一个高风险漏洞。

我们观察到,自2016年以来,国际最权威的漏洞披露社区CVE官网上,已公开的Ceph严重级漏洞高达45个,而Ceph官网显示这些漏洞已修复的数量仅31个。

这个数据令人担忧,就好比一座跨越峡谷却未修建妥善的栈桥,当勇士们大步流星时突然踩空,便坠入峭壁下的万丈深渊。

在已披露的中高风险与严重风险评级漏洞中,最典型的是这三大类:密码/密钥未进行加密便直接存储,导致敏感信息极容易被泄露、被入侵者利用;访问接口时缺少完整的认证和授权,导致任何人都可以随意进行数据访问;采用易受攻击的公开协议或操作系统,大幅增加了利用已知漏洞攻击系统的风险。

这很难不怀疑,Ceph自身在数据机密性、访问控制、软件级运行安全方面存在难以预知的缺陷,存储层引发的数据丢失及服务不可用的可能性不言而喻。

同时,Ceph引用了大量老旧开源软件,很多漏洞未被解决。有开发者分析过Ceph V17.2.1版本,发现其直接或间接引入了50多款开源软件。

由于社区对老版本几乎不会投入资源进行维护,未被及时修复的安全漏洞和严重功能问题,都有可能被利用成为被攻击对象。

与对单个端点或服务器的网络攻击不同,针对存储系统的攻击具有更大的破坏性,一个存储系统的漏洞就可能导致数千台服务器停机,业务中断若干小时或若干天,并清除数PB的数据。

过去三年,针对企业数据的勒索软件攻击的日益增加,这是一个可怕的前景。

其次,开源存储代码漏洞披露不可控。

2022年6月,美国商务部工业和安全局(BIS)针对网络安全领域的出口管制要求表示,在美国实体与中国政府相关的组织和个人合作时,若发现安全漏洞和信息,禁止直接公布,必须先经过美国商务部审核。

Ceph作为开源存储软件的代表,自然也被要求遵循这条新规。

从历史上看,Ceph每年都有近10个中高风险漏洞披露,这意味着从此之后,任何漏洞信息都几乎无法被国内存储客户所知晓并修复,妄图从根源上主动管理更是化为泡影。

可以说,中国大量采用Ceph系统作为数据底座的企业们,正在风云莫测的国际形势中面对“数据裸奔”的无声威胁。

这自始至终是一场不对称信息打击的同台竞技,更是一场中国企业捆绑着定时炸弹的缚足攀岩。

最后,开源存储软件无法持续演进的可能性大。

Ceph被美国Redhat收购后,法律仲裁归属美国加州,Ceph属于Linux社区的特例,受到美国出口管控。

目前,美国仍在进一步加强开源软件的保护及管控,美国白宫与开源组织、科技巨头共同推动1.5亿美元开源软件保护计划,以加强美国的开源安全。

这一系列动作都让人明白了那句话——代码无国界,但写代码的人有国界。从俄乌冲突经验来看,政治原因已经导致开源软件不再可用,Ceph为首的开源存储软件也存在断供与卡脖子的风险。

如果国内关键基础设施的存储系统使用Ceph来构建,那么极有可能无法获得后续更新迭代,全数据业务系统随时可能面临断供,对将来的工具更新、平台演进、甚至国家核心技术的发展都将造成极高威胁。

如同高悬在头顶上的达摩克利斯之剑,让人不寒而栗。

固守还是激变?国产存储更需“国魂”

在国家数字经济发展大战略下,数据作为生产要素已成为重要资产,数据存力作为数据基础设施的核心组成部分,支撑着全国数据价值的释放,更事关国家的信息安全。

因此,今年两会上,就曾有人大代表呼吁加快“国芯国魂”产品的应用,破解“卡脖子”问题:“我国要有独立的存储产业‘强链补链’规划,构建存储产业生态体系和产业链,并加速自主创新能力提升、国芯国魂产品应用,实现真正自主可控”。

尽管理想丰满,但打造“国芯国魂”的数据基础设施并不能一蹴而就,而是需要政产学研用的多方合力:

政策层面,推进先进自主自研产品的应用,建立开源软件供应链安全治理机制,势在必行。

农工党对此提出过四大建议:一是,在新型数据中心、关键信息基础设施等建设中鼓励使用先进自主自研存储产品,限制国外开源代码(Ceph、Lustre等)使用比例;二是,健全漏洞风险的自主治理能力;三是,建立软件产品安全可信测评体系;四是,积极推进具有检测技术和检测能力的存储认证机构的建设。

也有专家建议,在涉及到国家关键信息基础设施建设的领域设置准入机制,慎重使用没有掌握核心技术的供应商。对于那些掌握核心代码、具有安全管控能力的厂商,可以予以更多支持。

产业层面,存储厂商及相关研究机构应唤醒自主创新、自研可控的意识。

例如,在存储软件的开发、维护等活动中做好安全需求分析、安全设计、安全编码、安全测试、漏洞修补等工作,真正做到清本溯源,掌握核心代码,提高产品安全能力,实现存储产品的可信安全。

用户层面,建立软件供应链安全全流程治理体系,提升自身的软件安全治理能力,成为大势所趋。

企业用户必须意识到,在信息技术发展、稳定夯实数据基座的征程之上,唯有“国芯国魂”的数据基础设施才能作为我国信息发展的重要引擎。

所以,有计划、分批次、逐步替换Ceph等开源存储软件,需要各行各业的持续与坚定。

在破除开源Ceph的桎梏后,存储还需进一步摒弃软硬解耦建设,转向软硬一体的全栈自主可控。

这才称得上是真正的“国芯国魂”数据基础设施,从根本上摧毁数字时代的“特洛伊木马”。

所有人都知道,这是一件艰难而正确的事,但正如荀子所言“先义而后利者荣”,挣脱开源基础设施的枷锁,将为国家与时代筑起一条护城长河。

结语

天下从来没有免费的午餐。风雨飘摇中,那些披着开源外衣的“国产”存储产品并没有想象中的那么安全。

如今,在以基础软硬件替代为重点方向的新一轮自主可控浪潮正在掀起。

我们坚信,不久的未来,在企业用户和科技厂商彼此信任地携手中,将迎来真正的“国芯国魂”。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/444571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

react-8 Redux 状态管理 - 持久化存储 => 进阶:React-Redux()和模块化

1.redux redux是独立于react的库,是js状态管理库,提供可预测的状态管理。Vue也可用,但是和react比较搭配 。 2. 什么时候用 redux? 解决:任意:多组件共享状态, 解决:任意:两个…

83.qt qml-初步学习2D粒子影响器(二)

由于QmlBook in chinese翻译过来的文字有些比较生疏难于理解,所以本章在它的基础上做些个人理解,建议学习的小伙伴最好配合QmlBook in chinese一起学习。 QML粒子所有类型: Qt Quick Particles QML Types | Qt Quick 6.5.0 Affector类型: Attractor QML Type | Qt Quick 6.5.…

TouchGFX界面开发 | TouchGFX软件安装

TouchGFX软件安装 TouchGFX和STemWin类似,都是一个GUI框架,可以方便的在STM32 Cortex-M4 以及更高级别的STM32芯片上创建GUI应用程序。 本文中的TouchGFX软件安装,是基于已经安装有STM32CubeMX Keil MDK-ARM开发环境的情况下进行的&#x…

CSS3 2D变换

CSS3 2D变换 位移: div {transform: translateX(30px); /*水平位移*/transform: translateY(30px); /*垂直位移*/transform: translate(30px, 30px); /*两个方向位移*/ }注意:位移的百分比是元素本身,不是父元素 div {transform:…

JVM常用调优参数 ——JVM篇

JVM常用性能调优参数详解 ​ 在学习完整个JVM内容后,其实目标不仅是学习了解整个JVM的基础知识,而是为了进行JVM性能调优做准备,所以以下的内容就是来说说JVM性能调优的知识。 一、性能调优 ​ 性能调优包含多个层次,比如&…

学习实践-Vicuna【小羊驼】(部署+运行)

1、Vicuna【小羊驼】-FastChat"更快的对话" 介绍 3 月底,UC伯克利开源大语言模型Vicuna来了,这是一个与 GPT-4 性能相匹配的 LLaMA 微调版本。“缺啥补啥缺啥练啥,傻子也突出”! Vicuna 使用从 ShareGPT 收集的用户共…

生成对抗网络GAN

1.基本概念 生成对抗网络Generative Adversarial Networks(GAN)包含生成模型(generative model)和判别模型 (discriminative model) 两个模型。生成模型的任务是生成和原始数据相似的实例,判别模型的任务是判断给定的实…

四百左右音质好的蓝牙耳机有哪些?2023公认音质最好的蓝牙耳机排行

与有线耳机相比,蓝牙耳机有着功能多样、使用便捷的优点。最近看到很多人问,四百内音质好的蓝牙耳机有哪些?针对这个问题,我来给大家推荐几款音质最好的蓝牙耳机,一起来看看吧。 一、南卡小音舱Lite2蓝牙耳机 参考价&…

Mybatis(九)插件原理及应用

一、Mybatis的插件实现原理 Mybatis允许用户通过自定义拦截器的方式改变Sql的执行方式,例如在Sql执行时追加Sql分页语法,从而达到减缓分页查询的目的,用户自定义拦截器也被称为Mybatis插件。 我们先从插件的配置及解析过程来分析插件&#…

蓝奥声核心技术分享——基于物联网的无线智能标签刷新控制技术

1.技术背景 基于物联网的无线智能标签刷新控制技术指基于对目标场景状态变化的协同感知而获得触发响应并进行智能决策,属于蓝奥声核心技术--边缘协同感知(EICS)技术的关键支撑性技术之一。该项技术涉及物联网边缘域的无线通信与智能控制技术领域。 物联…

学习同步异步的概念,并了解MQ消息队列

文章目录 一、 同步和异步1.1 同步调用1.2 异步调用 二、MQ1.1 介绍1.2 MQ的优点和使用场景 一、 同步和异步 1.1 同步调用 同步调用是一种程序调用方式,在该调用方式中,调用者发起一个请求,然后一直等待被调用者返回响应结果后再继续执行。…

wps - 使用宏来为每行标记序号

在WPS中遇到需要加序号的虽然可以用项目符符号来标注# 但或许用宏更厉害一些 WPS 的宏是一种自动化工具,可以通过编写宏代码来自动执行一些操作,例如创建和编辑文档、打印、格式化等。 WPS 宏的编写可以使用 VBA(Visual Basic for Applicat…

236. 二叉树的最近公共祖先 ——【Leetcode每日一题】

236. 二叉树的最近公共祖先 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点 p、q,最近公共祖先表示为一个节点 x,满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff…

inode和软硬链接

文章目录: 一、理解文件系统1.1 什么是inode1.2 磁盘了解1.2.1磁盘的硬件结构1.2.2 磁盘的分区1.2.3 EXT2文件系统 二、软硬链接2.1 软链接2.2 硬链接 一、理解文件系统 1.1 什么是inode inodes 是文件系统中存储文件元数据的数据结构。每个文件或目录都有一个唯一…

JavaSE学习进阶day06_01 数据结构(进阶)

第一章 数据结构(温习数据结构的内容) 1.1 树基本结构介绍 树具有的特点: 每一个节点有零个或者多个子节点 没有父节点的节点称之为根节点,一个树最多有一个根节点。 每一个非根节点有且只有一个父节点 名词含义节点指树中的…

第二届“威固新能源 GO野”,威固重塑新能源出行不凡体验

中国,上海,近日——全球特种材料公司伊士曼旗下汽车膜品牌威固(V-KOOL),于近日开启了第二届“威固新能源 GO野”不凡之旅,通过专为新能源而来的创新产品与服务,引领高端新能源车主驶出城市生活的…

晨控可视化标签在资产管理上的应用及优势

晨控可视化标签在资产管理上的应用及优势 资产是企业功能的核心组成部分,是企业重要的基础设施建设。资产存在的形式各种各样,不仅具有价值高、流动性强、安全管理困难的特点,而且成为资产管理的重要环境之一。通过射频识别技术,…

【00-Java Web先导课】-如何进行IDEA的安装

前沿 Pycharm与IDEA激活教程一样,本篇以IDEA激活教程为例进行保姆级教学 文章目录 前沿一、支持系统二、软件版本1.引入库 三、软件下载教程1、点击网址进入jetbrains官网2、按照下图选择相应下载的软件3、按照如图选择需要下载的版本4、按照如下方式进行下载软件 四…

Web服务器

目录 什么是Web服务器? Web容器 Servlet Servlet 规范 Servlet 的API结构 编写Servlet servlet生命周期(产生到销毁的过程) 服务器产生响应信息的两种格式 什么是Web服务器? Web服务器是一个程序,用于接收客户…

【LeetCode: 718. 最长重复子数组 | 暴力递归=>记忆化搜索=>动态规划】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…