云+AI时代下,Alibaba Cloud Linux 如何进一步演进?

news2024/9/29 19:32:59

编者按:云+AI 浪潮势不可挡,服务器操作系统如何进一步演进?阿里云智能集团高级技术专家张金利在 2024 云栖大会操作系统开源专场上,分享了《Alibaba Cloud Linux 技术路线演进思考》。内容见下:

(图/张金利)

在云+AI 时代下,阿里云服务器操作系统 Alibaba Cloud Linux (以下简称 Alinux)基于一云多芯的技术路线开展软硬件协同优化,同时,Alinux 在阿里云上,已经经过通用计算、智能计算、机密计算等多样化场景的实践检验。

图片

阿里云为什么要做操作系统?一方面最初是基于内部的业务需求。随着阿里云内部业务规模扩大,导致算力越来越强,大规模复杂的算力场景对操作系统提出了优化需求,以确保业务稳定、高效地运行。另一方面,随着时代的进步,软件和硬件也在不断发展,软硬一体的协同创新为我们持续进步提供了动力。最后一方面要想实现可持续发展,操作系统除了实现技术上的不断突破,还需要建立在技术路线上的全面自主演进能力

图片

Alinux 历经三代演进。在过去和现在,Alinux 都支持了大量的内部业务和外部客户,每一代产品随着当时的历史时期有着不同的产品定位,每一代也都有自己的使命。Alinux 第一代为服务内部的业务做技术积累,第二代为大规模的集群场景做优化,开始服务云上客户。演进到第三代,Alinux 已经是一个超大规模的云+AI 综合算力的新场景;同期,龙蜥社区成立。发展至今,龙蜥已推出更安全、更稳定、更 AI 的龙蜥操作系统 Anolis OS 23 官方正式版,采用通用的基于 Linux 6.6 的 ANCK 内核,全面兼容国内外主流 CPU 架构,适配更新、更丰富的 AI 容器服务生态,在操作系统层面首次原生支持 AI 算力调用和应用。Alinux 与 Anolis OS 互相学习、共同进步发展。Alinux 的许多技术创新,经过实践认可与成熟后会经由阿里云贡献到龙蜥社区,而龙蜥社区各成员为 Anolis OS 所做的各种改进和功能,Alinux 也会选择吸收,为自身注入新的活力。截至目前,Alinux 在云上为占比第一的操作系统发行版。

云和 AI 的浪潮势不可挡,服务器操作系统如何进一步演进?接下来分享阿里云在这个问题上的思考。

安全可信:操作系统发展的基石

阿里云在安全方面做了大量工作,这里分享三大点:一是安全合规。今年,阿里云服务器操作系统 V3 通过了国家的安全可靠测评,证明其可以满足政企客户的合规诉求,也可以广泛支撑大规模的关键信息基础设施;第二是供应链安全的平台化建设。操作系统源于开源,是一个庞大的软件包的组合,这个组合里面很多的软件离不开从开源选型。从选型,到过程管理,到修复漏洞、发布 SBOM 都是一个庞大的体系。目前在 SBOM 生成、漏洞修复管理、选型管理上,Alinux 已经可以做到自动化和平台化。第三是安全创新。近期,针对 AI 时代安全可信的需求,Alinux 围绕 AI 做安全可信方面的创新能力,从软硬件协同的角度出发,完成了机密计算在 AI 领域的安全建设。

图片

极致优化:操作系统核心能力的精益求精

操作系统发挥着承上启下作用:“启”动下面的硬件,“承”载上面软件的过程。Alinux 已全面支持国内国外主流 CPU、GPU 芯片硬件,在关键应用上性能再提升 20%,而在数据库这样的关键应用上可达到最多 40% 的性能提升。针对 AI 场景,在训练和推理等通用场景持续积累软件栈(比如 pytorch、tensorflow 等)上的优化技术,单就推理场景而言,在搜推场景的单节点达到 25% 的性能提升,整个集群性能做到了 15% 的性能提升。

图片

AI驱动:操作系统与AI的良性循环

System for AI 是用操作系统来支持 AI 的基础设施,AI for System 则借助 AI 能力优化操作系统功能和体验。过去一年,Alinux 在以下 6 个方面,既通过 Alinux 帮助优化了 AI 基础设施,又通过 AI 给操作系统本身带来操作系统智能化的新机会。

  • OS&Kernel:主要在 RAS、存储、网络等关键技术上提升 AI 基础设施稳定性与性能。

  • AC2:面向 AI 场景的容器镜像。AI 容器镜像是 AI 时代的“RPM 包”,它定义了一种新的开箱即用的分发模式,未来将可成为主流。

  • Confidential AI:AI 机密计算方案,提升AI 场景全链路安全水位。

  • 轻豚(KeenTune):基于 AI 算法与专家的智能调优工具。

  • OS Copilot:操作系统智能助手,提升操作系统使用体验。

  • SysOM:智能运维诊断平台,是与 OS Copilot 结合得很好的实践工具,在运维领域有着出色的专业能力。

技术生态:承接龙蜥社区“三大生态计划”

在 2024 龙蜥操作系统大会上,龙蜥社区重磅发布了“CentOS 替代计划”“Anolis OS 23 生态衍生计划”“AI 应用推广计划”三大计划,致力于推动国产操作系统实现从开源到商业化的良性循环发展。而 Alinux 已基于三大计划率先行动,与社区共建可持续生态。

  • 在 CentOS 停服替代计划里,Alinux 希望通过安全和多算力支持的方式帮助客户平稳度过 CentOS 停服。同时,还推出一年免费安全接管服务。

  • 在 Anolis OS 23 生态衍生计划里,阿里云将会在 2025 年上半年推出第一个技术预览版——V4 版本,这个版本将会是 Anolis OS 23 或者龙蜥社区形成的软硬件技术兼容性规范的落地执行者和坚定推动者。

  • 在 AI 应用推广计划中,阿里云将会继续扮演探索者先行者的角色,也会协同社区,助力社区合作伙伴,在技术上继续增强 Copilot 的领域能力,也将思考如何为客户带来商业上的增值空间。

Alinux 产品家族,支持云+AI时代多样性应用场景

阿里云在操作系统领域坚持长期主义,Alinux 在十余年的发展历程中不断实现自我进化。在云+AI 的趋势下,Alinux 借助安全可信的基础支撑、极致优化的核心能力、AI 驱动的良性循环以及龙蜥社区的开放生态,形成了围绕操作系统发行版+云化扩展形态+智能服务套件的完整产品家族,并针对 AI 场景形成端到端的系统安全解决方案。在云计算发展的第三次浪潮中,Alinux 全方位使能一云多芯算力,高效支持云与 AI 多样性应用场景。

2023 年,龙蜥社区联合阿里云云市场发布了「Alibaba Cloud Linux 伙伴招募计划」,该计划将把来自阿里云基础软件、云市场、计算巢等团队的技术积累和推广资源、商业资源,与龙蜥社区开放强大的生态力量和技术协同相结合,号召服务商伙伴们进行共建,让用户享受更好的体验。欢迎广大企业用户加入,共建云上软件生态繁荣。

可复制下方链接浏览器打开或点击”阅读原文“了解计划:

1.Alibaba Cloud Linux 伙伴招募计划全文:

Alibaba Cloud Linux伙伴招募计划_Alibaba Cloud Linux(Alinux)-阿里云帮助中心

2. Alibaba Cloud Linux 官网:

Alibaba Cloud Linux_aliyun linux_Linux操作系统_计算-阿里云

技术PPT获取:关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。

—— 完 ——

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2177629.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MacOS安装MindSpore(2024年最新)

大家好,我是邵奈一,一个不务正业的程序猿、正儿八经的斜杠青年。 1、世人称我为:被代码耽误的诗人、没天赋的书法家、五音不全的歌手、专业跑龙套演员、不合格的运动员… 2、这几年,我整理了很多IT技术相关的教程给大家&#xff0…

项目管理系统中的风险管理:如何识别和应对项目风险?

在现代项目管理中,风险管理是确保项目成功的关键因素之一。无论是技术、资源还是市场的变化,风险无处不在。有效的风险管理能够帮助团队识别潜在问题并制定应对策略,从而避免项目延误和预算超支。项目管理系统在这一过程中扮演着重要角色&…

从 TCP Reno 经 BIC 到 CUBIC

重读 TCP拥塞控制算法-从BIC到CUBIC 以及 cubic 的 tcp friendliness 与拐点控制 这两篇文章,感觉还是啰嗦了,今日重新一气呵成这个话题。 reno 线性逼近管道容量 Wmax,相当于一次查询(capacity-seeking),但长肥管道从 0.5*Wmax …

试填+组合数学,CF 1648C - Tyler and Strings

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 1648C - Tyler and Strings 二、解题报告 1、思路分析 考虑枚举相同前缀…

MySQL约束:外键约束

下面先创建两张表用来作为实验样例 1.创建dept表 create table dept(id int auto_increment comment ID primary key,name varchar(50) not null comment 部门名称 ) comment 部门表;INSERT INTO dept (id, name) VALUES (1, 研发部), (2, 市场部), (3, 财务部), (4, 销售部…

【C语言软开面经】

C语言软开面经 malloc calloc realloc free动态分配内存malloccalloc函数:realloc 函数:free函数: 堆栈-内存分区栈区(Stack):堆区(Heap):全局(静态&#xff…

哪个待办事项提醒软件推荐?待办事项提醒软件哪个合适?

在快节奏的现代生活中,我们每个人每天都会被各种待办事项所包围。从工作计划到个人生活,从学习任务到家庭琐事,这些事项往往繁杂且紧急,稍不留神就可能错过重要的截止日期。因此,选择一款合适的待办事项提醒软件&#…

Docker-2.如何保存数据退出

在使用Docker时,我们常常需要修改容器中的文件,并且希望在容器重启后这些修改能够得到保留。 0.简介 使用Docker时有一个需要注意的问题:当你修改了容器中的文件后,重启容器后这些修改将会被重置,深入研究这个问题。 …

如何高效运营知识产权,实现企业价值最大化?

知识产权的运营管理是指企业对其所拥有的专利、商标、著作权等知识产权进行规划、运用、保护和管理的一系列活动。这些活动旨在最大化知识产权的价值,促进企业的技术创新和市场竞争力的提升。通过有效的知识产权运营管理,企业可以实现技术成果的快速转化…

猝发传输和非猝发传输

猝发传输和非猝发传输是两种不同的数据传输方式,主要区别在于数据传输的连续性以及数据包的发送方式。 猝发传输 (Burst Transmission): 定义: 猝发传输是指在一段时间内,大量数据包集中发送,然后在一段时间内没有数据传输,这种…

全流程SWAP农业模型数据制备、敏感性分析及气候变化影响技术应用

SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了W…

HAL+M4学习记录_1

一、简介 基于Arm Cortex-M4的STM32F4 MCU系列采用了意法半导体的NVM工艺和ART Accelerator™,在高达180 MHz的工作频率下通过闪存执行时其处理性能达到225 DMIPS/608 CoreMark,这是迄今所有基于Cortex-M内核的微控制器产品所达到的最高基准测试分数。 这…

奖金高达 110 万元,Spatial Joy 2024 全球 AR 应用开发大赛启动

今年是AR应用开发大赛第三届,恰逢Rokid成立十周年,我们推出全新的大赛品牌“Spatial Joy”,引领开发者享受开发乐趣,为其打造充满挑战和惊喜的开发之旅,逐渐成为空间计算时代全球最大AR应用开发大赛。回顾大赛发展&…

MWORKS.Sysplorer 2024b重磅推出同元基础库

一、引言 MWORKS.Sysplorer 是多领域建模与仿真平台,集成了Modelica标准库。该库由Modelica协会开发,是一款开源的通用基础模型库,支持机电、流体、控制等多个专业领域的建模与仿真。随着Modelica标准库的不断发展与更新,目前最新…

自建RustDesk服务器:详细步骤与操作指南

在远程办公和协作日益普及的今天,远程桌面软件成为了不可或缺的工具。然而,许多知名的远程桌面软件,在免费使用一段时间后,会通过限制连接数量、时长或在特定网络环境下的可用性来促使用户付费升级,而且其会员非常昂贵…

第L4周:机器学习|K-近邻算法模型

本文为🔗365天深度学习训练营 中的学习记录博客原作者:K同学啊 任务: ●1. 学习本文的K-邻近算法 ●2. 了解 KNeighborsClassifier 函数 一、基本概念 商业哲学家 Jim Rohn 说过一句话,“你,就是你最常接触的五个人的…

KEIL中出现encountered an improper argument的解决办法

当使用KEIL软件时,有时候会遇见encountered an improper argument的错误提示框。如下图所示: encountered an improper argument翻译为:遇到不恰当的争论。出现该错误的原因一般有以下几种: 1、在我们在调试完结束时候&#xff0c…

跨学科数字教学知识库的建设挑战与解决方案

随着知识经济的不断发展和教育改革的深入,跨学科教学逐渐成为培养具有综合素质和创新能力的关键途径。在这一背景下,搭建跨学科数字教学知识库显得尤为重要。然而,跨学科知识的复杂性和多样性给知识库的建设带来了诸多挑战。本文旨在探讨这些…

JAVA毕业设计185—基于Java+Springboot+vue3+小程序的校园网上商店小程序系统(源代码+数据库)

毕设所有选题: https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringbootvue3小程序的校园网上商店小程序系统(源代码数据库)185 一、系统介绍 本项目前后端分离(可以改为ssm版本),分为用户、商家、管理员三种角色 1、用户…

体验通义灵码高阶能力:代码生成增强

通义灵码提供了基于企业代码库进行行间代码生成检索增强的能力,在开发者使用通义灵码 IDE 插件的行间代码生成时,可以结合企业上传的代码库作为上下文进行行间代码补全,使代码补全更加贴合企业代码规范、业务特点。 开通通义灵码企业版&#…