自从2020年12月CentOS项目宣布 CentOS 8于2021年12月31日停止维护和更新,CentOS 7也将于2024年6月30日停服,就掀起了中国操作系统的替换浪潮。作为基于Red Hat Enterprise Linux的开源操作系统,CentOS广泛应用于企业级服务器和云计算平台。而2022年4月,Ubuntu开发商Canonical公告称对某地停服。在大模型AI开发中,底层操作系统大多选择Ubuntu。重要的国际Linux发行版部分停服,这激发了中国操作系统的蓬勃发展。
从2019年中国迎来第一个开源许可证(木兰)开始,国内开源系统迎来了属于自己的春天。信通院、开放原子开源基金会共同发布《国产服务器操作系统发展报告(2023)》指出,目前龙蜥、欧拉两大开源操作系统根社区,对自主创新操作系统的发展和应用起到推动作用,中国服务器操作系统的市场成熟度已经跨越了从尝试到大规模落地的鸿沟,根据信通院面向用户群体的调研显示,龙蜥操作系统位列用户意愿迁移系统的首位。
(来源:《国产服务器操作系统发展报告(2023)》)
报告称国内已出现多个较为成熟的服务器操作系统,产业步入2.0时代,面向云计算、智能计算等方向进化。以兼容性更好、产品性能和技术能力见长的龙蜥操作系统,产品性能优良在实际应用中得到了用户的广泛认可,是国产操作系统的代表性产品,目前基于龙蜥操作系统发行了超过12款针对下游的衍生版。
向大模型AI前沿挺进
Anolis OS龙蜥操作系统最初是由阿里云服务器操作系统(Alibaba Cloud Linux,简称Alinux)开源贡献而来,Alinux历经十余年发展,在阿里自用场景实现CentOS 全替代,并支撑阿里云达到全球第三、中国第一的市场规模。在开源之后,基于Anolis OS龙蜥操作系统的Alinux更进一步支撑了阿里云在AI特别是大模型AI方面的需求,浪潮信息等整机厂商以及英伟达、英特尔、AMD等AI硬件厂商也广泛参与到龙蜥操作系统的AI 能力研发中,头部云厂商和软硬件厂商的AI技术方案与实践都沉淀到了龙蜥操作系统。
2023年,龙蜥社区将智算场景列为第九大技术方向。今天,数据中心内的AI智算服务器正在快速增长,这要求龙蜥操作系统在完成了CentOS替换后,必须要面向未来承担起通用计算场景和智算场景的技术演进任务。而在AI大模型爆发的前提下,龙蜥操作系统不仅要积极支持AI大模型,甚至可能考虑在未来更激进地用AI将整个操作系统重新演进一遍。当然,在AI大模型时代,也有机会对底层基础设施和操作系统进行重构,因此龙蜥操作系统从多方面进行了相关布局,龙蜥社区的所有SIG和产品都将支撑AI原生应用的技术演进。
面向大模型AI场景,龙蜥操作系统在技术上整体考虑软硬一体的协同优化,包括对DPU、GPU等AI硬件的支持,以及AI硬件发展驱动的操作系统软件迭代,探索通过Copilot将OS与AI结合,以及继续围绕云原生对AI进行演进。在软件栈支持方面,补充操作系统选型时的AI软件栈缺失,包括支持并优化TensorFlow、PyTorch和ONNX等主流框架,过去几个月龙蜥操作系统已经引入了超过150款AI生态软件包。面向AI部署,龙蜥操作系统提供了多种基于硬件优化的基础AI框架容器镜像,支持ModelScope SDK,对接大模型生态。值得一提的是,龙蜥操作系统已经获得英特尔、AMD、英伟达等厂商的原厂支持并形成解决方案,覆盖主流AI加速库和框架,无需预配置即可上手基于Anolis OS 23的大模型镜像。
龙蜥操作系统已经在2023年第二季度Anolis OS 23 GA版本实现了南北向基础覆盖、实现了Linux发行版的基础选型;在2024年上半年Anolis OS 23.1发布的阶段将引入Hygon平台和增强安全性、实现对ModelScope生态的支持与优化等;在2024年下半年Anolis OS 23.2发布的阶段将进一步支持RISC-V架构,实现更广泛的软硬件协同智算生态方案等;在2025年将实现多维度领先的智算生态,进一步完善CVE安全保障能力等。
不断加深云原生布局
随着云原生技术快速发展,云原生的微服务架构、容器化部署等特点对传统服务器操作系统提出新的挑战。云原生是龙蜥操作系统的重要技术方向之一,作为源自公有云大厂的操作系统,龙蜥操作系统自诞生之初就天然具有云原生技术优势。而大模型的推出,更进一步强化了云原生的重要性,同时也对云原生技术提出了更高的要求,包括自动化部署、管理、集群自愈等,都在推进云原生技术的前沿。
龙蜥操作系统面向云原生推出了容器专属的OS,即Lifsea OS。Lifsea OS解决了传统OS在云原生场景下的问题。LifseaOS基于Anolis OS并针对容器场景进行垂直优化,系统中仅保留容器运行所需的必要软件包与系统服务,系统以镜像为粒度进行升级回滚,提供只读根文件系统避免系统被恶意篡改。LifseaOS已经在云服务商云原生服务业务上大规模部署,集群千节点扩容时间小于一分钟。
龙蜥操作系统在Lifsea OS的基础上,持续推进云原生技术的演进。智算浪潮下,Kubernetes 集群在规模和数量上快速增长,使得大规模集群中的节点管理重要性日益突出。云原生节点管理是基于云原生理念,使用ContainerOS和配套基础设施,提供的一种有效的节点管理方案。龙蜥社区推出了《云原生节点管理最佳实践白皮书》,探索和总结了云原生节点管理的新范式。
云原生资源混部隔离技术进一步提升了计算资源利用率。龙蜥操作系统内核在资源隔离技术上深耕多年,主要涉及内核中的调度、内存和IO三大子系统并根据云原生混部场景进行了深入改造和优化。目前,龙蜥操作系统的资源隔离技术已经在手机制造企业、大型国企、互联网企业以及阿里云和蚂蚁集团内部大规模应用。龙蜥社区还推出了AnolisBox云原生节点资源管理解决方案,提供了单机资源混部能力的标准化、归一化、简单化解决方案。
在云原生和AI场景下,容器文件和AI数据存储都是小文件、高并发、多IO型,EROFS是为高性能只读场景量身打造的内核文件系统,之前主要为作为安卓和嵌入式设备的文件系统用于各大终端厂商中,在龙蜥社区的推动下不断突破应用边界,通过技术演进而越来越服务于容器、集群OS甚至是机器学习场景。龙蜥ANCK内核已支持EROFS文件系统,并针对下一代容器镜像项目Nydus做了大量优化,未来会辐射到更多云边端场景,包括用EROFS提高机器学习数据集的访问性能。
从技术研发到产品落地的高效循环
龙蜥社区已经建成了从标准共建到生态合作的开放生态以及全产业链共享的开源社区,硬件厂商、基础软件厂商、应用软件厂商、系统开发商、开发者、用户之间形成产业正循环,打造商业可闭环的良性生态系统。浪潮信息作为龙蜥社区的理事会成员,主导成立了浪潮信息龙蜥联合实验室,整合芯片、整机、板卡、数据库、中间件、ISV等上下游生态力量,打通社区技术创新和产业应用之间的通路,以行业实践反哺技术研发,形成从技术研发到产品落地的高效循环。
为了推动从技术研发到产品落地的高效循环,龙蜥社区提出并实践“分层分类”科学理论,与产业链伙伴共同打造下一代操作系统。例如,龙蜥广泛联合国内外主流芯片厂商,发布了多款同源异构芯片版本,同时确保这些社区衍生版具有良好的兼容性,从而提高用户体验、降低使用成本。与此同时,浪潮信息等更多理事单位加大在社区的投入,当前已经实现主流芯片协同研发机制、主流中间件/数据库、主流整机OEM厂商等的更广覆盖。
为了进一步拉通从社区到市场的通路,浪潮信息发挥整机厂商影响力,邀请了约50家合作伙伴加入龙蜥社区,覆盖硬盘、网卡、内存、 Raid 卡、数据库、中间件、安全、高校、 ISV 等领域;建立了适配认证体系,完成98项硬件与319项软件的兼容认证,覆盖主流CPU、GP、FPGA、网卡、服务器、存储、网络设备等硬件及主流数据库、中间件、虚拟化、容器、云平台、办公软件等软件;还主导龙蜥社区驱动基线建设,推动“一测多证”落地龙蜥社区,提升龙蜥操作系统南北向生态兼容性等。这些举措,都积极促进了从社区到市场的正循环。
如今,龙蜥社区已经成为引导服务器操作系统产业发展的事实领导者——现有24家理事单位,超过600家生态伙伴,基于社区操作系统发行了超过12款针对下游的衍生版。例如浪潮信息KeyarchOS作为龙蜥衍生版之一,面向智算时代需求,具备稳定可靠、高效软硬协同、全天候智能化运维、全栈安全可信四大特性,涵盖业内最全的硬件和服务器部件,通过软硬协同优化释放多元算力。目前,龙蜥操作系统装机量现已超过500万,服务了金融、通信、政务、能源、交通等众多行业超过80多万用户。
在协助用户完成CentOS迁移的同时,浪潮信息也深入到社区技术创新中,通过参与技术创新而加强对于新技术的感知并第一时间将技术创新成果转化到商用产品中。例如,浪潮信息主导成立服务器无感知计算、可信计算等专业技术SIG,牵头编写并发布《龙蜥操作系统可信计算最佳实践白皮书》、《eBPF技术实践白皮书》,推动Serverless、eBPF、可信计算技术发展;参与Anolis迁移SIG、Cloud Kernel、KeenTune(轻豚)、硬件兼容性等10多个SIG的工作和讨论;提交了300余个技术PR,聚焦服务器稳定性、服务器整机兼容性等领域等。
在云智融合的技术前沿,以龙蜥操作系统为代表的中国操作系统,从替换方案到主导全球创新的向上浪潮。以云智融合的前沿实践和中国数字经济的丰富度及体量,在国内最大的服务器供应商浪潮信息,与最大的服务器单体用户阿里云的加持下,龙蜥将打造中国操作系统的黄金时代。
为了进一步推动生态建设,为来自全球的国际组织、产业领军企业、行业协会、学术机构等提供一个充分交流的舞台,共同探讨服务器操作系统在新趋势下的发展,2023年12月17-18日,以开放原子开放基金会为指导单位,由龙蜥社区主办,阿里云、浪潮信息、统信软件、Intel、Arm等24家理事单位共同承办的2023龙蜥操作系统大会·OpenAnolis Conference(简称“OAC”),将在北京嘉瑞文化中心首次隆重举行,届时将邀请超300家企业和逾千位开发者,集聚政、产、学、研等各方力量,打造聚焦产业升级的年末盛典。读者可到龙蜥操作系统开源社区官网报名。(文/宁川)