阿里云易立:以增效促降本,容器服务全面进入智能化时代

news2025/2/24 12:36:18

容器技术已经跨越鸿沟,广泛应用于金融、通讯、制造、交通等千行百业。Kubernetes支撑的工作负载也从早期单一的互联网应用发展到数据库、AI、大数据等等,并覆盖了公共云、专有云、边缘云等多样化、动态的云环境。

11月5日,2022杭州 · 云栖大会上,阿里巴巴研究员、阿里云智能云原生应用平台容器技术负责人易立在云原生峰会上发表主题演讲,发布阿里云容器服务全面智能化升级,帮助企业精益用云,以增效促降本,实现IT架构在云上的高质量发展。

在这里插入图片描述

容器服务助力企业数字化创新

经过7年的发展,阿里云容器服务产品线已经成为企业的云原生操作系统。基于阿里云容器平台,阿里集团实现了100%业务云原生上云。

2021 年,阿里云发布了 ACK Anywhere,进一步拓展产品的宽度,覆盖从公共云、边缘云、到本地数据中心的各个场景。让所有需要云能力的地方,都能基于统一的容器基础设施之上。

得益于阿里集团和阿里云的大规模容器应用实践,阿里云容器产品能力得到了业界的广泛认可 2022年1季度,在权威咨询机构Forrester 发布的全球公共云容器平台分析师报告中,ACK稳居全球领导者象限,这也是中国科技公司首次进入该象限;2022年2季度,在 Omida 发布的全球容器管理解决方案报告中,由于在公共云、专有云、混合云等环境完善的产品体系,ACK成为全球领导者,产品能力与规模国内领先;2022年8月,在CSDN 2022中国开发者调查报告中,有52%的国内开发者选择阿里云容器云平台。

在这里插入图片描述

过去几年,降本增效成为了众多企业IT管理者关注的重要问题。企业已经到了精益用云的时代,提升资源效率、研发效率,IT管理效率成为关键。

四大全新升级,阿里云容器服务迈入智能化时代

智能化是容器平台发展的必然趋势。今天,阿里云基于过去10年的大规模容器实战经验,通过数据化手段和智能化算法,推动容器服务ACK面向基础设施层、容器编排层、应用架构层和运营治理领域 4 大维度全面升级,迈入智能化新阶段。

升级1:新算力

在基础设施层,利用面向云原生优化的新算力,提升计算效率。

在这里插入图片描述

2021 年,阿里云发布了新一代云原生CPU,倚天710,基于ARMv9架构,已经在电商、阿里云内部规模化应用,实现了卓越性价比。

相比 X86 芯片,典型 Web 应用性价比高50%,视频编解码应用性价比高 80%。倚天芯片面向云原生优化,vCPU 采用独立物理核,没有超线程架构中的性能争抢。可以提供更加确定性的性能。

ACK 通过对芯片微架构的拓扑感知调度优化,相比开源K8s实现,帮助 Web 应用吞吐提升 20%。

为了更好支持 AI、HPC等I/O密集型应用。ACK 正式提供了对eRDMA高性能容器网络支持。 通过软硬一体优化的网络实现,可以提供更高的带宽与更低的延迟。应用在AI训练加速20%,微服务吞吐提升10%;

ACK 支持多容器高效复用eRDMA设备,满足了容器应用部署密度的需求。

在这里插入图片描述

为了更好支持有状态应用容器化,阿里云发布新一代容器网络文件系统 CNFS 2.0,它采用全链路加速技术,可以实现:

  • 容器应用对后端存储系统的访问并行化,提升网络带宽的利用率。对远程NAS存储的吞吐可以提升100%,满足高性能AI训练和基因计算的需求。
  • 利用元数据缓存和独有的lease机制,使得远程文件存储的元数据访问性能,提升了18倍,非常适合Web应用和CI/CD等需要对海量小文件进行访问的场景。
  • 支持文件的透明生命周期管理,可以自动将低频访问的冷数据放置在低成本的NAS低频介质或OSS中,降低存储成本50%以上。

它支持对NAS/CPFS/OSS全链路可观测,帮助开发者更好诊断和优化I/O性能问题。

在这里插入图片描述

企业与个人对数据隐私保护日益关切,机密计算技术应运而生。其中一个重要的技术是通过芯片的可信执行环境(TEE)实现数据保护。在TEE内执行的应用,不用担心来自其他应用、其他租户或者平台方的威胁。

为了进一步推动机密计算的普及,阿里、蚂蚁团队在Kata Container社区与红帽、Intel等公司进行合作,将容器计算与可信执行环境相结合,推出机密容器 Confidential Container 项目,同时为 Intel® SGX、Intel® TDX等不同的TEE实现,提供了一致的容器界面。

基于新一代的机密容器架构,开发者可以确保应用是通过可信软件供应链进行构建和分发的;容器应用运行在可信执行环境中,具备更小的攻击面,而且所有内存中数据是加密的并受完整性保护;应用对数据的访问是基于加密的可信数据存储服务。

机密容器可以在需要隐私数据处理的场景中,如金融风控、医疗健康等,提供高效的隐私增强型算力。

升级2:新平台

在容器编排层,通过智能化、云边端一体的新平台,提升资源利用率和运维效率。

在这里插入图片描述

K8s目前已经成为云时代的操作系统。希望充分利用多种应用负载之间的削峰填谷,提升K8s集群资源利用率。这也是大家常说的“混部”能力。

阿里巴巴早在 2016 年就启动了云原生混部技术研发,历经多轮技术架构升级和双11锤炼,目前已实现全业务规模超千万核的云原生混部,日常CPU利用率在 50% 左右。

阿里云今年开源了云原生混部项目 Koordinator,它包含三大核心能力:

  • 差异化 SLO 保障:在 Kubernetes 之上提供面向QoS 的资源调度机制,比如延迟敏感型的在线类任务,和可抢占的计算任务。通过对不同QoS应用的合理调度,可以在保障应用的稳定性的同时,提升资源利用率。
  • QoS 感知调度:包括 CPU、GPU 拓扑感知、资源画像、热点打散等精细调度能力,帮助应用优化运行时性能效率,提升稳定性。
  • 任务调度:提供了大数据与 AI 相关的任务调度,比如批量调度、优先级抢占以及弹性 Quota等,可以更高效地支持计算任务

Koordinator 项目完全兼容标准的 K8s,无需做任何侵入式修改。ACK也内建了Koordinator产品化支持:

  • 通过混部调度,在典型场景可以提升资源利用率100%;
  • 通过差异化SLO保障,在提升资源利用率的同时,让低优先级的任务对延迟敏感型任务的影响 < 5%。

在这里插入图片描述

Kubernetes的复杂性是阻碍很多客户采用的一个重要因素。为此,ACK发布AIOps套件,通过智能化手段实现故障预防与快速定位。

基于阿里团队10年大规模容器运维经验沉淀,通过专家系统和AI算法相结合的方式,提供了全栈巡检、升级检查,智能诊断等三大功能。

智能诊断目前包含200+诊断项,覆盖90%的常见问题场景。以容器网络问题诊断为例,排查链路长,复杂度高,非常耗时耗力。

在得物的业务场景中,利用智能诊断,可以快速定位由于网络栈异常导致的偶发性抖动问题;再如e签宝,利用智能诊断,可以在分钟级完成对Ingress、容器网络、应用和OS的全链路问题排查。

在这里插入图片描述

ACK One 是面向多地域多集群的分布式容器平台,可以统一管理中心云、本地云、边缘云和客户IDC的K8s集群。今年阿里云在ACK One基础上,发布如下功能:

  • 提供托管的ArgoCD服务,开发者可以通过GitOps方式来实现应用的跨地域自动化交付;
  • 通过弹性感知的调度器实现,为混合云场景提供灵活的弹性算力;
  • 支持对多集群安全策略的统一管理,保障企业系统统一安全基线

来看一个具体案例,在智联招聘的业务高峰期,借助ACK One弹性调度策略可以在数分钟内弹出数万核ECS和ECI等计算资源补充到IDC的在线服务集群,有效应对流量洪峰。

在这里插入图片描述

ACK@Edge 是面向云边端一体协同的容器应用平台,基于阿里云开源的OpenYurt项目,今年对ACK@Edge 进行全新升级:

在云边协同场景, 阿里云推出了增强型网络边缘节点池,实现安全、稳定的云边网络互联方案。国内知名游戏企业,莉莉丝,利用增强型边缘网络节点池,让海外多地域服务器与云上 VPC 安全互通。相比专线网络资源成本降低 30%。

在云端协同场景, 阿里云推出了轻量化接入功能,可以通过K8s管理资源受限的设备上的容器应用。元戎启行是一个自动驾驶Startup公司,通过ACK@Edge管理车载设备应用,接入资源开销占用降低 50 %,发布运维效率提升 60% 以上。

升级3:新架构

在应用架构层,利用服务网格等新架构,提升应用的敏捷性、弹性与韧性。

在这里插入图片描述

服务网格已经成为云原生应用的网络基础设施。阿里云服务网格服务ASM在4个维度进行了全新的升级:

  • 支持多种服务治理框架,可以实现Spring Cloud, Apache Dobbo等微服务应用与服务网格应用的互联互通和平滑迁移;
  • 为应用服务提供统一的身份定义, 简化零信任策略的构建与实施;
  • 提供开箱即用的Envoy插件市场, 可以拓宽服务网格的应用场景, 包括身份认证、AI Serving等场景;
  • 可以基于服务SLA指标,实现更加精准的弹性扩缩容

震坤行工业超市是一家数字化的工业用品服务平台,为众多企业复工复产保驾护航。借助于ASM服务网格, 提升了平台的性能。基于ASM的软硬一体优化技术,提升TLS握手性能 75%,以及QPS 30+%。关于相关技术细节,可以参阅Intel和阿里云一起编写的技术白皮书(点击阅读原文即可下载)。

专注餐饮行业数字化的合阔智云, 其业务中台的核心生产系统100%全部切换到服务网格ASM,提升应用发布效率70%,降低异常排错成本80%。

升级4:新实践

在运营治理领域,将通过一系列最佳实践的产品沉淀,提升企业IT在成本管理、安全治理等方面的管理效率。

在这里插入图片描述

为了帮助企业上好云、用好云、管好云,阿里云本次发布了云原生landing zone,为企业云原生上云提供最佳实践。 它包含架构规划、安全管理、财务管理、自动化运维等等8大模块。

通过云原生landing zone最佳实践,已经帮助众多国内外企业客户构建了上云架构,满足企业对安全、稳定性和成本等多方面的业务诉求。

围绕LandingZone 中财务管理部分,阿里云结合业财一体化实践和 FinOps 理念,推出 ACK FinOps 套件。 通过数字化手段和智能化方法,帮助企业实现成本可视化、可优化、可控制。

在这里插入图片描述

中华保险作为国内互联网金融行业的领导者,通过ACK FinOps套件,将企业 IT 成本治理周期从季度缩短到天级别,资源闲置率从 30% 降低到 10% 以内。

识货团队通过应用混部和弹性等技术优化,将集群的资源利用率提升10%;整体降低计算成本20%以上。

围绕 LandingZone 中安全防护部分,ACK 与 ACR 提供完备的DevSecOps的产品能力,为企业提供安全可信的软件供应链。

在这里插入图片描述

今年,阿里云推出了集群容器安全概览,可以帮助安全管理员对集群安全水位有更好地感知,可以对集群配置、应用镜像、容器运行时的安全风险,及时发现与处置。

全球领先的SaaS厂商Salesforce,在阿里云上提供先进的CRM服务应用。基于云原生 DevSecOps 能力,半年内实现 数 千次风险镜像拦截阻断, 1 万次工作负载部署策略阻断。基于全自动化软件供应链安全流程,应用安全交付效率提升 3倍。

在这里插入图片描述

未来,希望更多的企业能和阿里云一起,利用云原生技术精益用云、增效降本,在云端进行业务创新。

点击此处 ,免费下载《基于英特尔®架构的阿里云服务网格ASM技术加速应用服务加密通》白皮书。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/28680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在Windows7在部署Hadoop+Hbase

0. 准备工作 0.1 电脑上现在没有jdk 0.1 提前准备好文件 1. 现在开始安装jdk 1.8.0_60 安装成功&#xff0c;没啥问题 小疑问&#xff1a;自动配置好了环境变量? 1.1 小记 在安装jdk的时候&#xff0c;有三种小工具&#xff0c;可以根据需要选择性安装 JDKjre源代码 虽…

牛客网语法篇练习基础语法(二)

1.牛牛正在给他的朋友们买电影票&#xff0c;已知一张电影票价是100元&#xff0c;计算 x 位朋友的总票价是多少&#xff1f; x int(input()) a x*100 print(a) 2.给定两个整数a和b (0 < a,b < 10,000)&#xff0c;计算a除以b的整数商和余数。 a,b map(int,input().…

【深入浅出Java并发编程指南】「剖析篇」Fork/Join框架的实战开发和原理探究指南

前提概述 Java 7开始引入了一种新的Fork/Join线程池&#xff0c;它可以执行一种特殊的任务&#xff1a;把一个大任务拆成多个小任务并行执行。 我们举个例子&#xff1a;如果要计算一个超大数组的和&#xff0c;最简单的做法是用一个循环在一个线程内完成&#xff1a; 算法原理…

使用Typora+EasyBlogImageForTypora写博客,无图床快速上传图片

Typora下载 Typora以前都是免费的&#xff0c;自去年开始竟然要收费&#x1f914;&#xff08;不过也能理解&#xff0c;毕竟真心好用&#x1f60a;&#xff09;&#xff0c;在这里给大家提供的是免费的版本&#xff08;免安装&#xff0c;下载即可使用&#xff09;&#xff0…

【密码学篇】(商密)密码算法分析理论知识

【密码学篇】&#xff08;商密&#xff09;密码算法分析理论知识 密码算法分析理论—【蘇小沐】 文章目录【密码学篇】&#xff08;商密&#xff09;密码算法分析理论知识&#xff08;一&#xff09;密码系统安全性1.实际安全性2.无条件安全性&#xff08;二&#xff09;密码算…

干货丨如何开启TiDB集群中的节点通信加密?

笔者在一个银行项目中&#xff0c;费尽千辛万苦&#xff0c;好不容易通过PoC测试。 就当一切就绪&#xff0c;准备正式上线时&#xff0c;突然传来了噩耗&#xff1a;未通过银行内部的漏洞扫描&#xff0c;发现存在高危漏洞&#xff0c;需要马上进行修复。 这可给我吓坏了&am…

Vue-axios的get、post请求

直接在控制台上打印axios会报错&#xff0c;打印fetch就不会&#xff1b; 因为fetch是标准&#xff0c;axios是第三方&#xff0c;要想用axios&#xff0c;就必须引入想应的js文件&#xff1b;axios-js文件下载&#xff1a;npm 搜索axios&#xff0c;点进去&#xff0c;往下找&…

智云通CRM:如何清除销售前被拒绝的怀疑和猜测?

在做CRM销售时&#xff0c;经常遇到被客户拒绝的情况&#xff0c;没有人喜欢被拒绝&#xff0c;因为拒绝辉让人痛苦、难过&#xff0c;但现实中又无法避免被拒绝&#xff0c;尤其是销售人员&#xff0c;对销售人员来说&#xff0c;被拒绝是家常便饭。遭到拒绝后&#xff0c;经常…

基于51单片机pwm调光护眼台灯智能检测光强光控灯设计proteus仿真原理图PCB

功能&#xff1a; 0.本系统采用STC89C52作为单片机 1.LCD1602液晶实时显示当前时间/模式/亮度等级 2.按’切换’键可切换四种不同的模式 a) 自动开关&#xff0c;自动调节亮度 b) 手动开关&#xff0c;自动调节亮度 c) 自动开关&#xff0c;手动调节亮度 d) 手动开关&#xff0…

arthas诊断工具

1.安装 linux: curl -o https://alibaba.github.io/arthas/arthas-boot.jar //是O不是零 浏览直接访问https://alibaba.github.io/arthas/arthas-boot.jar 在运行程序之前,需要运行一个java进程在内存种 java -jar arthas-boot.jar 按序号选择诊断的进程 选择序号回车 2.卸载…

​生成图片并添加文字Image.new()与ImageDraw.drawer.text()方法​

【小白从小学Python、C、Java】 【计算机等级考试500强双证书】 【Python-数据分析】 生成图片并添加文字 Image.new()与ImageDraw.drawer.text()方法 [太阳]选择题 以下python代码表述错误的一项是? from PIL import Image,ImageDraw,ImageFont imgImage.new(modeRGB,…

计算机网络第六章知识点回顾(自顶向下)

第六章知识点回顾1.链路层和局域网1.1网络层、链路层和物理层1.2链路层服务1.3链路层在哪儿实现&#xff1f;1.3.1网络适配器之间的通信1.4检错和纠错1.5如何检测与纠正错误&#xff1f;1.5.1编码集的检错与纠错能力1.5.2差错检测的实施1.5.3奇偶校验1.5.4循环冗余校验&#xf…

图像分割 - 区域生长

目录 1. 介绍 2. 代码详解 3. 代码 1. 介绍 分割的目的是将图像分为多个区域 常用的分割方法基于两个属性&#xff1a;不同区域间的灰度不连续性质&#xff08;Canny边缘检测等等&#xff09;、相同区域灰度的相似特征&#xff08;阈值处理、区域生长等等&#xff09; 区…

牛客网语法篇练习基础语法(一)

1.输出"Hello Nowcoder!"。开始你的编程之旅吧。 print(Hello Nowcoder!) 2.KiKi学会了print在屏幕输出信息&#xff0c;他想输出一架小飞机。请帮他编写程序输出这架小飞机。 print( *5 ** *5) print( *5 ** *5) print(**12) print(**12) print( *4 * * *4) prin…

Arduino操作MPU6050模块

MPU6050是集成三轴陀螺仪&#xff0c;三轴加速度计&#xff0c;温度传感器于一体的模块。本文档基于Adafruit_MPU6050实现MPU6050模块基本操作。 Adafruit_MPU6050库&#xff1a; https://github.com/adafruit/Adafruit_MPU6050 Adafruit_MPU6050依赖以下库&#xff0c;需要在…

Java中的char、Character和CharSequence的区别

char 与 Character char是一种基本的数据类型&#xff0c;Character是char类型的包装类&#xff0c;即通过Character创建出来的是一种对象。 Character是char的包装类&#xff0c;就像Integer和int&#xff0c;以及Long和long一样。 包装类和基本类型可以自动转换&#xff…

安泰测试-同惠TH2827精密LCR数字电桥产品性能特点

同惠(Tonghui)TH2827A/TH2827B/TH2827C型 LCR数字电桥 产品简介&#xff1a; TH2827A/TH2827B/TH2827C是具有多种功能和更高测试频率的新型LCR数字电桥&#xff0c;体积小&#xff0c;紧凑便携&#xff0c;便于上架使用。本系列仪器基本精度为0.05%&#xff0c;测试频率最高1M…

GitLab仓库管理系统安装详细步骤

前言 本案例安装 gitlab、jenkins、并部署springboot应用程序&#xff0c;所以准备了3台服务器。 服务器1&#xff1a;安装gitlab服务器2&#xff1a;安装jdk、maven、git、jenkins 因为jenkins需要jdk、maven、git服务器3&#xff1a;安装jdk。 jenkins自动部署的springboot…

多目标优化生态调度结果的预测方法研究——基于新蝙蝠算法(Matlab代码实现)

&#x1f352;&#x1f352;&#x1f352;欢迎关注&#x1f308;&#x1f308;&#x1f308; &#x1f4dd;个人主页&#xff1a;我爱Matlab &#x1f44d;点赞➕评论➕收藏 养成习惯&#xff08;一键三连&#xff09;&#x1f33b;&#x1f33b;&#x1f33b; &#x1f34c;希…

【CNN】ZFNet——让卷积神经网络不再是一个黑盒模型。

前言 ZFNet在2013年 ILSVRC 图像分类竞赛获得冠军&#xff0c;错误率11.19% &#xff0c;比2012年的AlexNet降低了5%&#xff0c;ZFNet是由 Matthew D.Zeiler 和 Rob Fergus 在 AlexNet 基础上提出的大型卷积网络。ZFNet解释了为什么卷积神经网络可以在图像分类上表现的如此出…