新一代AI软件基础设施 | ZStack AIOS平台“智塔”发布

news2024/9/20 22:30:02

新一代 IT 基础设施,将从通用算力+云平台转型为AI算力+AIOS平台。

AI正在重构世界。正如世界是立体的,AI重构也正从多维度开启:基础设施重构,业务应用重构,交互模式重构,数据价值重构,生态系统重构……

2023年6月,英伟达市值首次突破万亿美元,率先引爆基础设施重构的全球化浪潮。随着数据中心转向智算中心,硬件基础设施从通用算力走向AI算力,软件基础设施也将转型为新一代AI基础设施——AI操作系统(AIOS)平台。


 

新一代AI基础设施AIOS平台

AI企业级商用的道路并不平坦。

2022年11月,‌OpenAI ChatGPT-3‌开启了生成式AI(GenAI)走向商用的新时刻。据IDC预测,到2025年仅仅三年时间,全球2000强企业就会把超过40%的核心IT支出用于AI相关计划,千亿级企业AI大市场已徐徐拉开。但另一方面,‌OpenAI ChatGPT企业版收入占比仅为21%,且有外媒报道2024年OpenAI或将面临50亿美元巨额亏损。


中国AI企业级市场则面临更多挑战。

算力层

与国外以英伟达为主的AI算力不同,中国市场呈现多架构多品牌的AI算力格局。企业不仅仍旧面临算力稀缺,如果各异构算力之间无法互通,还会形成硬件算力竖井。

模型层

产品导向必将转向场景导向。随着训推模型向场景化发展,不同场景下模型分工将更为专业,大模型呈垂直化趋势,在企业侧部署易于发展为模型生态竖井。

运营层

“百模大战”迅速走向推理应用,亟待在解耦算力竖井和模型竖井的基础上,实现跨平台的计量计费,迅速提升企业AI普及率。

“AI任务的多样性要求不同的模型处理,数据的多样性要求多模态能力,算力的异构性要求分布式多架构并行,模型的不断演进要求企业灵活更迭新的AI模型……面对企业AI的复杂与困境,亟待能够破局的新一代AI基础设施。”云轴科技ZStack创始人兼CEO张鑫认为,“一个能够同时解耦算力竖井和模型竖井、全域感知动态调度、实现自服务运营的新一代AI基础设施AIOS平台,成为提升企业AI渗透率的关键一环。”

作为AI生态系统中的新型形态,AIOS平台应该如何定义,包括哪些关键要素?

与模型即服务(MaaS)不同,AIOS是专门为AI应用而设计的操作系统平台,它不仅可以高效管理硬件算力资源,还内置AI引擎解耦不同模型、调度不同算力、执行各种AI任务,通过自服务运营模式降低AI应用门槛,提高AI应用效率。ZStack张鑫认为,作为新一代AI基础设施,AIOS平台需要在安全可控、持续迭代的基础上,同时在算力层、模型层、运营层三大层面实现以AI为核心的重构:


 

算力层

从运维视角,以AI为核心进行算力资源预测、精分、调度,降低AI应用成本;

模型层

从开发视角,以AI应用框架进行AI训推模型无缝集成与生命周期管理,优化AI应用性能;

运营层

从业务视角,提供多智算中心、多集群、多租户的按量计费运营,实现AI自服务化。

8月6日,云轴科技ZStack正式发布首个AIOS平台“智塔“,期望通过同时解耦算力竖井和模型竖井,优化AI应用性能和成本,解锁千亿级企业AI市场。

算力层

ZStack AIOS平台“智塔“的算力精分调度平台,支持Nvdia、AMD、Intel、海光、华为昇腾、寒武纪、燧原、天数智芯、太初元碁、壁仞、摩尔线程、沐曦等中国市场上的主流品牌和几十种AI芯片型号,实现异构算力协同不同AI 模型之间的优化路由。

模型层

ZStack AIOS平台”智塔”的动态模型自适应平台,可以支持生成式AI(GenAI)、自然语言处理 (NLP)、计算机视觉、机器学习(ML)、深度学习(DL)以及多模态AI,并支持Llama、Gemma、通义千问Qwen、智谱ChatGLM、百川Baichuan、零一万物Yi、OLMo、GPT-NeoX等数百种开源大模型,实现模型压缩与性能优化,模型选型与生命周期管理,训推高效部署与自适应调度,达到跨软硬件的全面性能优化。

运营层

ZStack AIOS平台”智塔”的全域感知自服务平台,可以进行多租户隔离和动态资源配额管理,实现跨智算中心、跨集群的全域感知统一调度,提供按量计费的动态训推服务,具备可视化统一门户,弹性跨域容错,实现精细化的自服务运营体系。


算力层:提升异构算力效率,破局算力稀缺难题

“AI的尽头是电力。“这一观点其实是AI芯片全球性规模扩张的展现。随着训推竞赛展开,千卡规模、万卡规模不断升级,AI算力资源稀缺且成本高昂。

在中国企业AI应用中,面对异构算力与多种模型选择,企业首要的需求是快速部署和高效运维AI模型。目前,AI算力池化替代异构算力竖井已成趋势,企业需要一个AIOS平台解决模型高效部署运维难题,避免为单个模型部署单一AI算力形成竖井架构,将异构算力池化并实现协同调度,使得企业在模型快速部署的同时,高效利用异构算力资源,显著降低算力成本。

ZStack AIOS平台“智塔”具备裸金属、虚机与容器多引擎能力,通过GPU切割精分量化,对异构AI算力实现可达1%的量化管理,大幅降低算力成本。算力层的另一大核心在于,在AI算力精分量化基础之上,通过分布式协同调度能力,实现异构算力的统一管理和动态调度,达到算力的精细化资源复用,进一步降低算力成本。

模型层:多模型框架集成,MaaS服务灵活高效

《IDC FERS Survey Wave》2024年发布的最新调研显示,48%的GenAI都将在企业本地部署,随着AI从训练走向推理,行业企业应用成为真正加速AI商用化进程的关键。


在中国企业AI训推实践中,完整完成一个AI任务往往需要多个专业模型协同工作。另一方面,各大领域开源模型的大量涌现,也助推企业使用不同模型解决不同业务问题。ZStack张鑫认为:“类似数据库应用,企业会同时使用Oracle、MongDB、MySQL、Redis等不同类型数据库来解决不同场景的问题,未来,企业同时使用多个模型将成为常态。“

面对多种模型应用,企业AI应用的一个重要需求是模型选型、精调、推理、MLops/LLMops的调度与性能优化。企业需要一个AIOS平台集成模型框架来实现多个模型的协同能力,并同时通过模型压缩加速、数据感知编排等实现AI模型的性能优化。

ZStack AIOS平台“智塔”一方面通过动态模型自适应平台,提供从模型训练、评估、推理到更新的全生命周期管理,高效实现模型服务优化;另一方面通过将AI任务智能解构,动态优化路由、分布式并行训推,自适应负载均衡等能力,结合算力层的算力精分协同调度平台,显著提升模型训推性能和模型服务体验。

运营层:全域感知自服务化,提升企业AI渗透率

作为新一代AI基础设施,AIOS平台在模型层和算力层通过优化资源分配和模型部署,降低企业AI应用门槛,提升企业AI应用效率;另一方面,如果企业还具备AI自服务运营能力,将在提升企业AI渗透率的进程中起到四两拨千斤的作用。

ZStack AIOS平台“智塔”以AI为核心提供更全面更直观的可视化统一视图,实现精细化管理;在动态调度资源方面,跨多智算中心、多集群全域调度自适应模块,可以根据需要实现跨平台的自动扩缩和调度功能;在训推服务高可用方面,弹性容错自愈模块具备快速故障定位与故障自愈能力,可以实现跨平台的容错与灾备;在安全与隐私方面,将融合敏感数据检测能力,实现端到端的数据安全保障作为运营基础;在系统运营方面,可实现多租户隔离和资源配额管理,训推计量计费服务。

作为新一代AI基础设施,ASOS平台通过算力层、模型层、运营层三大方向以AI为核心进行重构,解耦异构算力竖井降低AI应用成本;解构模型生态竖井优化AI应用性能;全域计量计费实现AI自服务化,加速企业AI渗透率,解锁千亿企业AI市场。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1987040.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

移动IP:让你的设备随时随地保持连接

随着无线网络技术的迅猛发展,在移动中进行数据通信已成为可能。成千上万的人正在使用移动设备畅享互联网,无论是在火车上、汽车内,还是在其他移动场景中。本文将带你了解移动IP(Mobile IP)的工作原理及其对网络应用的影…

LLM在线理解;神将网络理解;transform架构

目录 LLM在线理解 神将网络理解 transform架构 模型的子结构: 三个计算 计算1 计算2 计算3 LLM在线理解 LLM Visualization 神将网络理解 transform架构 模型的子结构: 词向量(Embedding) 前馈神经网络(Feed Forward) 残差连接(Add)和层标准化(Norm) 线性层(Linear…

Python版本和cuda版本不匹配解决办法

一、检查版本是否匹配 使用Python进入控制台,然后执行: >>>print(torch.cuda.is_available())如果输出为 False,则说明不匹配 退出Python环境,再检查系统版本: exit()nvcc -V 二、安装 去官网 PyTorch …

转载一篇关于对Linux磁盘部分mount和挂载的解释

转载自: http://t.csdnimg.cn/V3lgahttp://t.csdnimg.cn/V3lga

3_stm32_pwm呼吸灯

到目前已经可以进行基础的Led亮灭控制、使用定时器中断控制Led的亮灭。但是发现Led只有“亮”和 “灭”两种状态,那是否可以有更多状态?如何有更多状态呢?更进一步的想法,Led亮是有了电压差,其中一端是地,那…

C#:具体类=>抽象类=>接口的变化过程详解

文章目录 简单复习继承与多态具体类抽象类及成员使用语法 接口抽象类到接口的进化 简单复习继承与多态 下面,我用一个交通工具的例子来快速复习一下. 1.首先我定义一个基类Vehicle,代表交通工具的总称.里面定义了一个可被重写的成员方法Run. class Vehicle{public virtual voi…

Python Flask+Echarts实现葡萄酒质量的影响因素分析可视化

提示:本文章参考了哔哩哔哩的python课程李巍老师的 视频教程 文章目录 前言一、相关技术1.Flask2.Echarts3.词云 二、代码部分1.5个前端页面:2.代码 效果图 前言 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总…

代码随想录算法训练营第六天(一)|242.有效的字母异位词

LeetCode 242 有效的字母异位词 题目: 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。 示例 1: 输入: s "anagram&q…

韦东山嵌入式linux系列-mmap

应用程序和驱动程序之间传递数据时,可以通过read、 write函数进行。这涉及在用户态 buffer 和内核态 buffer 之间传数据,如下图所示 应用程序不能直接读写驱动程序中的buffer,需要在用户态 buffer 和内核态 buffer 之间进行一次数据拷贝。这种…

6.1.面向对象技术-面向对象相关概念

基本概念 对象:基本的运行实体,为类的实例,封装了数据和行为的整体(数据和行为就是属性和方法),如学生、汽车等真实存在的实体。对象具有清晰的边界、良好定义的行为和可扩展性。 学生有张三、李四等。张三就是具体的个体&#xf…

Java哈希算法

哈希算法 哈希算法1.概述2.哈希碰撞3.常用的哈希算法4.哈希算法的用途4.1校验下载文件4.2存储用户密码MD5加密5.SHA-1加密小结: 哈希算法 1.概述 哈希算法(Hash)又称摘要算法(Digest),它的作用是&#xf…

OrangePi AIpro学习3 —— vscode开发昇腾DVPP程序

目录 一、VScode配置 1.1 下载和安装 1.2 安装和配置需要的插件 二、构建项目 2.1 项目架构 2.2 解决代码高亮显示 2.3 测试编译 2.4 总结出最简单的代码 2.5 vscode报错找不到头文件解决方法 三、代码简单讲解 3.1 初始化部分 3.2 拷贝数据到NPU显存中 3.3 准备裁…

Leetcode每日一题之仅仅反转字母(C++)

在学习之余对于知识的巩固也尤为重要,不论难度高低,都会对代码的理解有所加深,下面我们开始练习 思路解析 关于本题的核心思路就是如何判断字符串中元素是否为字母以及如何遍历字符串以达到仅反转的目的,这里用到的知识就是关于 s…

【数据结构与算法 | 二叉树篇】AVL树

1. 前言 AVL树是一种自平衡的二叉搜索树。为什么会出现AVL树。众所周知,虽然普通的二叉搜索树的平均时间复杂度为O(logn),但最差的情况的时间复杂度为O(n)。为了避免最差的这种情况,出现了AVL树。 我们规定:如果树有个节点它的左…

大模型LLM——微调的七种方法

大模型的七种微调方法 文章目录 大模型的七种微调方法1. LoRA2. QLoRA3. 适配器调整4. 前缀调整5. 提示调整6. P-Tuning7. P-Tuning v2 1. LoRA LoRA的主要步骤包括: 选择微调目标权重矩阵:首先在大型模型(如GPT)中识别需要微调…

学习vue3 五,传送,缓存组件以及过渡和过渡列表

目录 Teleport传送组件 keep-alive缓存组件 transition动画组件 1. 过渡的类名 2. 自定义过渡class名 3. transition的生命周期 4.appear transition-group 1. 过渡列表 2. 列表的移动过渡 3. 状态过渡 Teleport传送组件 Teleport Vue 3.0新特性之一。 Teleport 是一…

AI技术如何重塑企业EHS安全健康环保体系,附实践案例

随着人工智能技术的快速发展,其在环境、健康和安全(EHS)管理领域的应用日益广泛。AI技术通过大数据分析、模式识别和预测建模等手段,为EHS管理提供了新的视角和工具。这一变革不仅提升了风险评估和事故预防的效率,同时…

Can‘t use Subversion command line client:svn不能使用Subversion命令行客户端:svn

1、导入idea中会报Can’t use Subversion command line client… 2、在提交svn代码的时候,出现这样的错误:Can’t use Subversion command line client: svn Probably the path to Subversion executable is wrong. Fix it. 问题原因:在安…

实验8-1-4 拆分实数的整数与小数部分

本题要求实现一个拆分实数的整数与小数部分的简单函数。 函数接口定义&#xff1a; void splitfloat( float x, int *intpart, float *fracpart );其中x是被拆分的实数&#xff08;0≤x<10000&#xff09;&#xff0c;intpart和fracpart分别是将实数x拆分出来的整数部分与…

sqli-labs1-24通关教程

目录 前置知识 第一关 1、第一关是单引号字符型注入,输入id1‘会报错 2、输入注释符正常显示 3、爆出列数为联合做准备 4、使用联合查询爆出数据库名 5、使用information_schema爆出表名 6、猜测用户名再users表中&#xff0c;爆出列名 ​编辑 7、利用查出来的表名数据…