真正的云原生大数据平台,让Kubernetes又牛了一把

news2024/10/2 1:39:43

作为一款开源的容器编排引擎,始于2014年的 Kubernetes 一经推出就受到了开发者的喜爱,谁也不曾想到它会取得如此大的成功。如今,在云原生技术发展的浪潮中,Kubernetes 作为容器编排领域的事实标准和云原生领域的关键项目,已经成为了云原生的标配。

 1 

Kubernetes 横空出世:改写容器编排市场格局

谈到 Kubernetes,就绕不开 Docker。

2010 年,一家名叫 dotCloud 的公司,基于 Google 公司推出的 Go 语言开发的一套内部工具,之后被命名为 Docker。作为一个用于开发、发布和运行应用程序的开放平台,Docker人气攀升速度之快,连Google、微软、Amazon这样的巨头们都对它青睐有加。

但随着业务规模逐渐扩大,容器越来越多,出现了一系列新问题,如何协调和调度这些容器?如何在升级应用程序时不会中断服务?如何监视应用程序的运行状况?如何批量重新启动容器里的程序……

解决这些问题需要的是容器编排技术,可以将众多机器抽象,对多个容器进行部署、管理和监控,作为真正的PaaS平台,让用户把自己的容器应用部署上来。

原来,容器本身没有“价值”,有价值的是容器编排。

于是,在2014年左右,Docker、Mesos、Google相继发布自己的PaaS平台,容器编排之争正式开始。

Docker携其在容器引擎市场的巨大成功,进入容器编排领域是顺理成章之事。2015年初 Docker 发布 Swarm,Swarm平台擅长与Docker生态无缝集成,用户可以低成本过渡。

Mesos在2014年成为首批支持Docker容器的容器编排框架之一,其最大优势是它在运行关键任务时的成熟度,比其他容器技术更成熟、更可靠,因而被Twitter、苹果、Netflix等公司所采用。

2014年6月,Google发布了Kubernetes,作为谷歌严格保密十几年的秘密武器—Borg的一个开源版本。也就是说,从一开始Kubernetes就站上了他人难以企及的高度,每一个核心特性的提出,几乎都脱胎于已经在Google内部运行了多年的 Borg/Omega 系统的设计与经验,在开源社区落地后,得益于整个社区的贡献,改进并修复了很多当年遗留在 Borg 体系中的缺陷和问题。

更为可贵的是,Kubernetes并未直接延用Borg,而是在这些宝贵经验的基础上从零开始设计,采用最先进的设计理念而没有任何历史包袱。

正是Kubernetes所体现出的独有的先进性与完备性,与“稚嫩”的Docker 技术栈和“老迈” 的 Mesos 社区相比,Kubernetes虽然出道晚,但后发优势明显。

2015 年 5 月,Kubernetes 在 Google 上的搜索热度远远超过 Mesos 和 Docker Swarm,之后一路飙升,容器编排引擎领域的三足鼎立时代结束。

2017年9月,Mesos宣布支持Kubernetes。

2017年10月,Docker官方支持Kubernetes。

2018年3月正式从CNCF毕业,开始坐上容器编排一哥之位。

如今,云原生大数据领域再出两大标志性事件,即2021年3月,Apache的Spark支持了Kubernetes;同年5月,Kafka也公开支持Kubernetes,标志着最核心的大数据组件现在都支持K8s。

 2 

Kubernetes 市场现状:超53%的企业将大数据应用程序迁移其上

或许,很多人认为Kubernetes是一款难以监控和管理的复杂软件,但在过去几年里,Kubernetes 经历了不可思议的发展,随着越来越多的企业投身使用,它已经从科研课题成为了 IT 行业的主流技术,这里的好处完全压倒了缺点。

据 Dimensional Research 最新研究发现,Kubernetes 正在成为主流技术的一个最明显迹象是要部署的集群数量出现快速增长。2020年提出此问题时,30% 的公司所拥有的集群数不超过 5 个,只有 15% 的公司拥有 50 个以上的集群。2022 年调查显示,只有 12% 的公司拥有不超过 5 个 集群,而 29% 的公司拥有 50 个以上的集群,且根据未来规划,来年可能出现更具爆炸性的增长。

关注公众号回复关键字【Clearpath】获取《2022年Kubernetes大数据报告(中文版)》

在Pepperdata的报告中显示,一半以上(53%)的受访者表示他们正在“将大数据应用程序迁移到Kubernetes,以降低整体支出。”77%的受访者表示,预计将50%或更多的大数据应用程序迁移到Kubernetes;约10%的受访者表示会将所有应用程序迁移过去。(回复关键字【Pepperdata】获取该报告完整中文版)

另外,在2022年春季,研究公司 Clearpath Strategies的调查报告中显示,83% 的受访者将超过 10% 的营业收入归功于在Kubernetes 上运行数据,三分之一的企业注意到企业生产力提高了两倍。

企业正在拥抱容器,因为它们可以更好地利用资源。

Dimensional Research报告显示,99% 的受访者表示,他们已经意识到部署Kubernetes 带来的优势。排在前两位的优势保持不变,依然是提高了资源利用率(59%),以及简化了应用升级和维护(49%)。第三是实现了向云环境的迁移(42%) ,第四是实现了混合云模式 (40%)。选择降低公有云成本(34%) 的受访者比例也比去年增加了 6%。

有三分之一左右的受访者选择了今年新增的两个选项:让运维团队成员更高效地工作和运用技能 (32%),以及消除之前孤立团队的低效 (28%)。Kubernetes 能够减少可能减缓运维的摩擦,帮助最大限度地提高 IT 资源利用率,让各个团队更高效、更紧密地协同工作。

 3 

Kubernetes 大有可为:对传统大数据平台进行改造

回顾Kubernetes发展史,分析其市场现状,无疑不说明K8s在企业的应用已相当广泛。但就目前来看,国内企业在使用K8s时,大多是在做云计算方面的相关调度,针对大数据领域,企业还在管理另一套纷繁复杂的系统,即传统大数据平台。

起初,企业如果想使用大数据平台,需要购买至少十几台服务器,找专业人员安装大数据的每个组件,安装后还需要一个开发平台、运维平台,以及购买各种各样的工具,建设和使用成本、门槛和决策风险比较高。

随后,传统大数据平台的短板和种种弊端慢慢显现。例如,多个部门共用集群,没有资源隔离和限制,且互相影响;系统依赖复杂的手动部署,且运维运营成本较高;资源利用率低,且难以集成既有数字化系统;没有标准的大数据组件发布流程,无法形成客户的自主数据能力。

现在,将这样的大数据平台迁移至K8s上,以上问题将迎刃而解,基于这个需求和背景之后,就出来一个名词叫做Data on Kubernete。

去年10月份北美的KubeCon刚刚结束,第一次组织了Data on Kubernetes专场,就是在讲如何在Kubernetes跑数据应用,这也从侧面说明了这一新兴热门领域得到了极大的关注。在DoK社区组织的行业报告中,展示的就是这些使用Data on Kubernetes的企业,为什么要把这些应用迁移到Kubernetes上,基于前两位的是保证管理的统一性以及简化管理。

3d714d60a1cf688e980b922722574a2b.png

至此,一款常常被客户称为“活的”“纯正的”云原生大数据平台浮出水面,它就是智领云自主研发的,作为市场上首个可完全在Kubernetes上部署的容器化云原生大数据平台--Kubernetes Data Platform (简称KDP)。

 4 

Kubernetes 改造思路:所有组件用K8s进行改造,做真正的云原生大数据平台

KDP能够称为纯正的K8s云原生大数据平台,是因为行业内很多企业在做,但大家的区别主要在于采取的路线不一样,KDP目前是市场上第一款公开的完全基于K8s搭建的容器大数据平台。

完全基于K8s搭建的大数据平台,目前在硅谷已经有很多实践,趋势比较明显。但在国内很多厂家还在处理原来传统大数据平台问题,总体来看,国内用户更希望能够从现有架构平稳地迁移,厂商也更谨慎些。

比如,某些厂商是基于自己的调度系统和分布式计算体系开发的大数据平台,虽然现在也在做 K8s 改造,把一部分调度工作移到了 K8s,但是绝大部分组件还是基于原来的大数据平台体系运行,并未真正地实现了云原生架构下的数据平台。

所以,多数大数据企业在K8s方面尽管做了很多工作,但智领云的差异化在于,其构建的是首个真正的K8s云原生大数据平台。之所以强调“真正”二字,是因为平台中的所有组件,都通过容器进行了重构,并纳入K8s的标准管理体系,而不仅仅是一部分。

这样做的价值是显而易见的,即使跨越不同的环境,只要底层基础设施是K8s环境,就无需反复处理物理基础架构的配置,也无需代码改造,大数据平台就可顺利地部署。

此外,“云原生大数据平台”的底层支撑,是一个全局共享的平台。用户可以将既有的系统迁移至资源池,实现更高的资源利用率。同时,云原生的存算分离架构,还可以分别管理冷热数据存储,即针对不同的应用场景,选择机械硬盘、固态硬盘、对象存储等不同的存储介质,以降低存储成本。

当然,KDP让用户完全去除了对Hadoop的依赖,可以直接在K8s环境中运行所有工作负载,统一资源管理,便于多租户计费管理,大幅降低运维成本。

综上,云原生大数据平台常听说,这次终于见到活的了。

- FIN -       

b98709e7f9efea3ac49f12ba4de8102b.png

更多精彩推

  • Kubernetes已经成为主流

  • 智领云彭锋深度探讨“云原生时代的数据赋能”

  • 智领云彭锋:云原生数据平台的最佳实践 | 甲子引力

  • “纯K8s”才是大数据的味道

  • 明日黄花Hadoop方兴未艾——传统大数据平台的云原生化改造

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/338064.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode-111. 二叉树的最小深度

目录题目分析递归法题目来源111. 二叉树的最小深度题目分析 这道题目容易联想到104题的最大深度,把代码搬过来 class Solution {public int minDepth(TreeNode root) {return dfs(root);}public static int dfs(TreeNode root){if(root null){return 0;}int left…

C++笔记之单例模式

C笔记之单例模式 前言 当一个类在程序的整个生命周期中,只需要一个实例的时候,就可以考虑把这个类设计成单例的方式,提供出去,让全局访问。一般来说比较 “重” 的一些类会设计成单例,比如像“引擎”, “x…

微搭低代码从入门到精通12-网格布局

开发小程序首要的就是考虑布局的问题,我们在以前的版本只能选择普通容器结合图片和文本组件来构建页面。 使用通用组件布局也可以,但有个问题是你要先学习CSS,要懂布局的概念,比如需要知道啥是flex布局,然后还得熟悉每…

分布式事务 | 使用DTM 的Saga 模式

DTM 简介前面章节提及的MassTransit、dotnetcore/CAP都提供了分布式事务的处理能力,但也仅局限于Saga和本地消息表模式的实现。那有没有一个独立的分布式事务解决方案,涵盖多种分布式事务处理模式,如Saga、TCC、XA模式等。有,目前…

【AI数学】相机成像之内参数

计算机视觉偏底层的工作会跟摄像机打交道,最近正好有接触,所以整理总结一下。 相机参数通常分为内参数、外参数,偶尔会有畸变参数等滤镜参数。 申明:本文图例均为原创,借用需附此文链接。 内参数:相机内部的…

[SSD固态硬盘技术 15] FTL映射表的神秘面纱

为什么需要映射表?固态硬盘的存储器件采用的是闪存[5],具有以下几个特点: (1)读写基本单位是以页(Page)为单位,擦除是以块(Block)为单位。

NFC概述摘要

同学,别退出呀,我可是全网最牛逼的 WIFI/BT/GPS/NFC分析博主,我写了上百篇文章,请点击下面了解本专栏,进入本博主主页看看再走呗,一定不会让你后悔的,记得一定要去看主页置顶文章哦。 原理来说,NFC和Wi-Fi类似,利用无线射频技术来实现设备间通信。NFC的工作频率为13.5…

基于c语言实现的对代码的同源性检测

完整代码:https://download.csdn.net/download/qq_38735017/87382389本次课程设计为了巩固上学期在软件安全课程上所学的安全知识,包括堆栈溢出、整数溢出等等,同时考察了一些课外的新事物,例如字符串匹配与CFG控制流程图的同源性…

Attention机制 学习笔记

学习自https://easyai.tech/ai-definition/attention/ Attention本质 Attention(注意力)机制如果浅层的理解,跟他的名字非常匹配。他的核心逻辑就是“从关注全部到关注重点”。 比如我们人在看图片时,对图片的不同地方的注意力…

为什么要在电子产品中使用光耦合器?

介绍 光耦合器不仅可以保护敏感电路,还可以使工程师设计各种硬件应用。光耦合器通过保护元件,可以避免更换元件的大量成本。然而,光耦合器比保险丝更复杂。光耦合器还可以通过光耦合器连接和断开两个电路,从而方便地控制两个电路…

【Markdown】markdown语法规定

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注…

Vue3 如何实现一个函数式右键菜单(ContextMenus)

前言: 最近在公司 PC 端的项目中使用到了右键出现菜单选项这样的一个工作需求,并且自己现在也在实现一个偶然迸发的 idea( 想用前端实现一个 windows 系统从开机到桌面的 UI),其中也要用到右键弹出菜单这样的一个功能,…

通讯录文件操作化

宝子,你不点个赞吗?不评个论吗?不收个藏吗? 最后的最后,关注我,关注我,关注我,你会看到更多有趣的博客哦!!! 喵喵喵,你对我真的很重…

几个chatGPT的难题,关于语言转换

不同语言代码的移植一直以来是程序员面临的难题,最近问了问chatGPT能否解决这个问题。编写一个程序,实现c语言函数转换为php函数答:这是一个非常困难的问题,因为两种语言的语法、结构和标准库都不相同。如果您希望完成这个任务&am…

MySql服务多版本之间的切换

从网上总结的经验,然后根据自己所遇到的问题合并记录一下,方便日后再次需要用到 MySql服务多版本同时运行 步骤 1、如果你电脑上已经有一个mysql版本,例如mysql-5.7.39-winx64,它占据了3306端口。此时如果你想下仔另一版本&…

活动星投票紫砂新青年制作一个投票活动

“紫砂新青年”网络评选投票_免费链接投票_作品投票通道_扫码投票怎样进行现在来说,公司、企业、学校更多的想借助短视频推广自己。通过微信投票小程序,网友们就可以通过手机拍视频上传视频参加活动,而短视频微信投票评选活动既可以给用户发挥…

6年自动化测试,终于进华为了,年薪25w其实也并非触不可及

我的职业生涯开始和大多数测试人一样,开始接触都是纯功能界面测试,第一份测试工作就是在电商公司做功能测试,工作忙忙碌碌,每天在各种业务需求学习和点点中度过,过了好几年发现自己还只是一个功能测试工程师&#xff0…

锐捷(十四)mpls vxn optionc的关键问题所在和具体问题分析

用锐捷的设备搭建mpls vxn optionc的基础版和带RR的版本,在控制平面和转发平免上分析mpls vxn optionc的关键问题所在和具体问题分析。一 基础mpls vxn optionc:核心:两pe之间之间建立MP EBGP邻居,从而直接传递路由解放了ASBR。关…

LeetCode-1223-掷骰子模拟

1、动态规划法 我们可以利用数组dp[i][j][k]dp[i][j][k]dp[i][j][k]来表示当我们已经投过iii次骰子,其中第iii次投出的骰子是jjj,此时连续投出骰子jjj的次数为kkk。因此我们可以根据上一轮中得到的状态dp[i−1][j][k]dp[i-1][j][k]dp[i−1][j][k]&#…

最小二乘支持向量机”在学习偏微分方程 (PDE) 解方面的应用(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 本代码说明了“最小二乘支持向量机”在学习偏微分方程 (PDE) 解方面的应用。提供了一个示例&#xff0c…