科技云报道:青云科技打出“AI算力牌”,抢跑“云+AI”新增市场

news2024/12/25 15:59:25

科技云报道原创。

近三年,中国云计算市场在多个维度同时发生着剧烈变化——疫情极大加速了全社会对于数字化的认知和接受程度;一系列云原生技术依托着开源和蓬勃的市场而迅速发展演变,更多产品和技术名词同时涌向市场;国际关系复杂化下的信创云浪潮扑面而来…

在这里插入图片描述

在这样一个技术和需求都在快速演变的供需环境中,云计算市场竞争走向存量市场的较量,留给所有玩家的空间都更加逼仄。

对于已经穿越过十余年风浪的青云科技而言,如何在这些剧烈的变化中寻找新航道,再一次对其战略眼光提出了考验。

在9月19日的“AI算力发布会”上,青云科技宣布了全新的战略方向——发力AI算力,与生态圈共建,以满足企业复杂的AI需求。
在这里插入图片描述

令人好奇的是,打出的“AI算力牌”,能否成为青云科技备战下一个10年的重要支撑?

AI是云计算竞争的新机会

当下最火热的技术莫过于AI,随着ChatGPT成功带来的新一代AI浪潮,引发了全球科技巨头在AI大模型层面的“军备竞赛”。

作为AI大模型的发展基石,AI算力的需求也得到大幅提升——无论是基于通用大模型微调的行业应用,还是垂直行业的大模型训练,都需要大量的AI算力进行支撑,其规模还在随着大模型的成熟落地而不断攀升。

而在AI大模型热潮涌现之前,AI作为一种新的生产力工具已经在各行业场景中发挥作用。伴随AI技术的迅速发展,算力基础设施由通用算力为主,向通算、智算、超算一体化演进,市场对AI算力乃至多元算力的需求愈加强烈。

一个明显的变化是,在国家政策的大力倡导下,全国各地都在积极打造大型智算中心,以推动国家新一代人工智能公共算力开放创新平台的建设。

同时,“东数西算”工程也推动着各地包括智算中心、超算中心在内的算力中心建设,以提升国家整体算力水平。

中国信通院《中国综合算力指数(2023年)》显示,近5年我国人工智能算力在整个算力结构中的占比已经超过25%,同比增加60%。未来算力仍会保持高速发展,尤其是智能算力将成为未来算力增长的主要动力。

毫无疑问,云计算作为AI算力不可或缺的基础设施,AI算力需求的爆发正在为云计算市场带来更多增量。有业内人士认为,随着企业对AI投入占比的持续增加,对于底层算力的需求,会带来10倍乃至100倍的市场规模增长。

在青云科技总裁林源看来,AI为云计算打开了全新的增量市场,并且会带来一波长达10年以上的市场需求,这正是青云新一轮竞争的机会。

但机会总是伴随着挑战,AI技术催生的新市场,从客户需求到对算力、应用、底层架构的要求,都发生了巨大的变化:

过去数字化转型,企业应用以传统应用为主,如今以云原生和AI应用为主;过去企业对于底层算力以CPU为主,如今变成了CPU、GPU异构多元算力;过去互联网业务主要是延迟敏感型应用,但如今企业会兼顾成本型应用,业态变得更加丰富。

这些变化对技术和平台挑战越来越多,也让几乎所有的云服务商重新回到同一起跑线,争夺AI算力这一新增市场。

那么对于青云科技来说,发力AI算力,到底有多少胜算?

“AI算力调度平台” 抢跑AI算力赛道

自2022年国务院发布《“十四五”数字经济发展规划》以来,重点提到要推进云网协同和算网融合发展,促进智能计算中心构建,目前智算中心已成为各地政府的重点项目。据不完全统计,全国至少有30座城市已经建成或正在建设智算中心,这还不包括企业自主建设的智算中心。

可以说现阶段是一个算力集中建设的时期,但无论是地方政府、国央企,还是地方AI集成商,想要建设好一个智算中心都面临着巨大的挑战。

一方面,智算中心投资巨大,能否盈利取决于运营效率和平台能力;另一方面,相比于建设,中后期的运营则更为复杂,要面对更为现实的技术和应用落地问题,比如:云计算、超算、智算等多元算力如何统一调度?

传统应用、云原生应用、AI应用如何同时兼顾?如何支持异构CPU/GPU、提供高效的网络与存储?大规模智算中心如何高效的运维和运营?

在智算中心高速扩张的早期阶段,由于缺少统筹规划和技术经验,项目失败不在少数。某大厂斥巨资建设的智算中心,由于只支持国产GPU,上线时发现很多应用根本无法支撑,导致整个智算中心无法投入运营。

与之类似的还有超算中心想要兼顾智算中心的功能,虽然超级计算机提供高精度算力,但却是为科学计算、超算等场景而生的,对于AI所需要的大规模、低精度算力并不适用,因此这一想法也并不现实。

不难发现,智算中心并不缺建设者,关键挑战反而是在建设后的运营阶段,谁能更好地解决这一难题,谁就能优先拿到AI算力的门票,而青云科技无疑是其中的佼佼者。

2019年,国家超级计算济南中心实施规划——打造全新的百亿亿次异构融合算力平台,以满足日益旺盛的“新基建”需求。

青云科技作为唯一的算力调度平台供应商,为国家超算济南中心提供了“一个平台纳管多种算力服务、一站式统一管理、跨平台便捷应用部署”的算力运营服务。

作为当时全亚洲最大的计算中心之一,国家超算济南中心拥有1000P的算力、超 300 PB的存储,打造的算力服务包括HPC超算、传统云计算(以CPU为主)、智算(兼顾国外及国产 GPU),是一个名副其实的多元且异构的算力中心。

这样一个庞大的复杂体系,必然对平台建设方和运营方提出了极高的要求。据林源回忆,当时从底层的芯片、服务器、存储、交换机、安全设备到上层的云平台,业内几乎所有顶尖的厂商都参与其中,但整个项目的算力调度运营平台是由青云独家供应的。

在算力调度上,青云科技屏蔽了超算服务器、AI服务器、通用服务器等多种异构基础设施的差异,向下接驳异构化的算力和硬件平台,实现对算力的统一纳管、调度、配给和全生命周期管理,进而向上支撑各种行业应用,为传统HPC科学计算、政务云、智慧城市等AI应用提供完整的算力服务。

如今,国家超算济南中心已稳定运营3年,且已经开始盈利,成为国内多元算力中心成功运营的典范。尽管这种成功看起来毫不费力,但背后其实凝结了青云科技长期以来的技术积累和运营经验。

作为中国最早一批推出公有云服务的云服务商,青云科技在算力的调度、运维、运营等方面,已历经了十多年的大规模市场验证。

2020年在洞察到国家“新基建”政策背后的算力中心和多元算力的需求后,青云科技提前三年就开始布局算力领域,从而具备了服务算力中心建设三要素(架构/能耗管理、多元算力操作系统以及多算力集群运营)的能力。

据青云科技产品经理苗慧介绍,青云AI算力调度平台具备九大关键能力——多区多业务资源整合、高速并行存储、混合组网、分布式调度与管理、灵活调度、容器推理服务平台、算法开发支持、模型仓库(MaaS)、AI训练平台。
在这里插入图片描述

例如,在资源调度上,青云科技在多个方面进行了优化:为了适应AI行业特点,实现了立即调度扩容数万卡资源;在通信链路上,所有的节点、服务器、存储都打上了路径标签,可计算调度最短链路,让数据不绕路;支持异构平台,加速国产GPU芯片替代;使用“K8s+Slurm”对作业感知的管理,实现最大系统利用率;广泛的调度选项、动态灵活的资源调度可配置,使得运营管理员可以通过排队、调度、手动调度等方式,解决AI系统中最具挑战性的优先事项。

在混合组网上,青云科技也基于传统的云计算领域,增加了高速网络,在多区域(AZ)构建了统一服务计算平台,能够支持跨区域高速网络互联、不同类型资源池互联、独立计算和存储IB网、专属访问存储高速网络、业务网络互连下发任务等。

用户在申请资源时,无论是按卡还是按节点申请,都能保证数据的安全隔离。

在AI训练平台上,青云科技集成了常用的训练模型框架,并提供GPU服务器在线申请、自动调度的集群,使得AI训练的所有网络和环境都可以一键生成。

整体而言,青云科技在AI算力领域的成功并非偶然,而是在AI算力调度和运营方面下了“狠功夫”的必然结果。

目前,除了国家超算济南中心,青云AI算力调度平台还应用在清华天津电子院智算科研教学平台、上海科发SciPlus科研云等算力融合创新场景中,成为各类算力中心运营者的关键工具,助力算力中心建立从建设到运营的闭环。
在这里插入图片描述

AI算力云服务走向AI共赢

事实上,不仅是智算中心的运营者需要面对AI算力的挑战,AI作为一个非常宽泛的领域,产业链各方对于AI算力都有着复杂且多样的需求。

从最终用户角度看,企业、科研机构在进行AI大模型训练和推理时需要巨大的计算量,他们渴望更低成本的AI算力资源。

同时,AI训练和推理的响应效率,会影响业务应用实时响应和决策的速度,他们渴望稳定的、优质的底层基础设施,提供更加高效便捷的AI算力资源;AI的高技术门槛,让很多企业对技术的使用产生了极大阻力,他们渴望AI算力服务能够进一步降低AI技术的使用门槛…

对此,青云科技依然发挥了自身在云服务上的优势,打造和持续升级了一系列高性能、弹性敏捷、安全可靠的算力产品及服务,以满足企业通算、超算、智算等多样化的算力需求。

目前,青云科技已基于完整的算力基础设施,能够为工业仿真、大气环境、医疗医药、教育科研、交通物流、自动驾驶、智慧政务等领域企业提供蓬勃算力,驱动业务创新。

青云科技2023年半年度报告显示,归属于云服务业务的AI算力云服务,上半年已经成为公司非常重要的新增长点,实现收入突破,收入规模为2651万元。

有别于互联网大厂在AI大模型和算力建设上的“高举高打”,青云科技反其道而行之,在AI算力云服务上走出了一条“轻资产”的道路。

众所周知,公有云服务一向是投入高、盈利难的业务,但青云科技在过去几年已确立了“精品化创新,高质量发展”的长期战略,更加注重盈利能力的建设。

因此,重金自建公有云不再是青云科技的选择,对于AI算力云服务的建设也同样遵循这一原则:一是不自建AI大模型;二是通过“生态同盟”的方式共同建设和运营AI算力云服务。

在青云科技总裁林源看来,“生态同盟”是AI时代的必然产物,企业一定是通过算力服务、算法和模型、高价值的数据来实现智能化,这也是AI生态体系的价值所在。
在这里插入图片描述

“最终用户要的是一个完整的解决方案,包括:机房、底层算力基础设施、算力调度平台、模型驱动、上层应用等等,每一层都需要专业的供应商投入大量的技术和时间才能建设好,所以我们认为AI领域会比以往更需要生态,而不是依靠一家独立的公司从下至上全部自建”,林源表示。

因此,在青云科技AI算力的生态同盟中,从底层算力基础设施方、中层大模型资源方、数据资源方,到上层算力运营方、行业应用方一应俱全,生态里的每位参与者都是专业且彼此需要的,大家以开放合作的心态一起实现整体能力的整合,从而走向AI共赢。

比如,青云科技会与专业的大模型厂商或AI团队联合,针对客户AI相关业务提供场景化方案,协助客户完成数据采集、算力平台建设、模型训练和推理、定制化模型、公私混合云部署等,最终构建或落地符合真实需求的AI应用。

AI算力“双轮驱动”备战下一个十年

整体来看,青云科技以AI算力调度平台和AI算力云服务为“双轮驱动”,共同支撑其“AI算力战略”的发展。

在AI算力运营方面,青云科技基于开放的、成熟的、可运营的AI算力调度平台,与大型政企、科研机构、运营商等智算中心建设方与运营方相互配合,扮演好算力运营技术服务商的角色。

在AI算力云服务方面,青云科技基于公有云能力打造了全面的算力基础设施,与生态同盟一起通力合作,为企业提供多样化的算力服务支撑,承担起AI算力云服务商的责任。

在青云科技总裁林源看来,AI算力未来一定会成为青云科技主营的业务模式,这是由市场决定的,“不管是互联网客户,还是传统行业客户,大家都在转向AI,所以我们的生意模式也是这么驱动的”。

而打造AI算力恰恰是青云科技最为擅长的。在过去云计算十余年的发展浪潮中,青云科技从公有云、私有云、混合云到云原生、信创云,一次次历练着自身云平台的能力。

随着AI时代来临,与青云云平台一脉相承的AI算力调度平台得以乘风而上,多年积累的技术实力让对手难以望其项背,很大程度上成为抢跑AI算力赛道的“杀手锏”。

同时,青云科技作为一个中立的服务商,既能满足客户不被绑定、赋能其独立运营的核心需求,也拥有大规模市场验证过的技术实力。

即便众多厂商都想进入AI算力运营这一赛道,但青云科技凭借自身清晰的定位和过硬的技术实力,在AI算力运营上拥有了无可比拟的差异化竞争优势。

如今,坚持“轻资产”路线、拥抱生态的青云科技,再次轻装上阵,全力奔向下一个十年。在走向AI星辰大海的路上,青云科技或将迎来自己新的黄金时代。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1023047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins+Gitee+Docker+Ruoyi项目前后端分离部署

前言 描述:本文主要是用来记录 如何用标题上的技术,部署到云服务器上通过ip正常访问。 一、总览 1.1、Docker做的事 拉取 mysql 镜像拉取 redis 镜像拉取 jdk 镜像拉取 nginx 镜像 解释说明:前端项目的打包文件放在 nginx容器运行。后端…

时间在情绪周期视角来看也是不存在的

在交易软件里我们会发现有交易周期,分钟级别,小时级别,天,周,月,年等。对于超短线而言这些周期没有任何意义,换言之时间这个东西不是一个维度,所以你去用时间选出来的股票那代表什么…

以“窖主节”之名,泸州老窖邀你赴一场“浓烈”的约会

“永远不要低估一颗浓烈的心。” 最近,在河北秦皇岛海边沙滩上,一座“双手碰杯”的艺术装置吸引了不少来自天南海北的游客打卡拍照。原来,这是泸州老窖“窖主节”秦皇岛站的活动主题打卡点。 9月15日—17日,为期三天的泸州老窖“…

【VisualStudio】NuGet包管理器下载缓存packages文件夹过大怎么清理

使用Visual Studio 开发工具时间长了,会发现整个项目的总大小越来越大,默认是存放在电脑系统盘里的,随着Windows11系统常常更新重启,导致系统盘闲置空间越来越小,该怎么办呢。 描述问题 整个解决方案项目会越变越大&…

MURD560-ASEMI超快恢复二极管MURD560

编辑:ll MURD560-ASEMI超快恢复二极管MURD560 型号:MURD560 品牌:ASEMI 封装:TO-252 正向电流:5A 反向电压:600V 引线数量:3 芯片个数:1 芯片尺寸:74MIL 漏电流…

Spring Cloud Alibaba Ribbon负载均衡器

文章目录 Ribbon 负载均衡器环境搭建1.依赖2.配置3.修改其默认的负载均衡策略3.1 验证 4.创建自定义的Rule4.1 MyRule()4.2 在配置config类中配置 5.饥饿加载6.我只想访问不想被别的访问 Ribbon 负载均衡器 背景 Ribbon 是一个用于客户端负载均衡的开源…

云原生容器平台——新华资产数字化转型加速器

新华资产管理股份有限公司(以下简称“新华资产”)于2006年5月经中国保险监督管理委员会批准、7月3日正式挂牌成立,是国内首批专业保险资产管理机构。2020年上半年,公司管理的资产规模突破万亿元人民币,投资收益水平居行…

Gin学习记录4——Controller和中间件

一. Controller 用不同的Controller可以实现业务的分类,不同类型的请求可以共用同一套中间件 1.1 单文件Controller 几乎等同于函数封装,直接将ctrl的代码写入到一个文件里然后调用: package adminimport ("net/http""git…

天猫健康“小补点”掀起养生新趋势,燕窝、自在水搭着喝双倍补

长时间对着电脑、一坐就是一天、想运动却挤不出时间……这几乎是大部分职场人的常态。为了守护健康,许多职场人开始探索便捷、有效的养生方式。 顺应这一需求,天猫健康发起“带薪养生小补点”活动,携手新加坡健康品牌余仁生、元气森林旗下品…

爬虫 — Scrapy 框架(二)

目录 一、Scrapy 核心文件1、spider2、Request3、构造 post 请求4、response 二、案例三、Scrapy 下载中间件1、执行顺序2、使用方法3、Download Middlewares 默认方法4、代理 IP4.1、工作原理4.2、分类4.3、查看 IP 地址4.4、常用代理 四、Scrapy 爬虫中间件五、Scrapy 下载图…

基础课-解析几何

1.平面直角坐标系 两点A(x1,y1)与B(x2,y2)之间的距离: 2.两点斜率公式 3.点到直线的距离 平行线之间的距离 4.平面直线方程的几种形式 点斜式 点P(x0,y0),斜率为k的直线方程:y-y0k(x-x0) 5.圆

会员管理系统H5-01会员开卡

我们前边7篇文章讲解的是PC端的功能,还需要为商家提供一套移动端的后台管理程序。在微搭中,移动端的后台程序我们可以使用H5进行开发,开发完毕后可以启用登录,这样管理员就可以在手机上进行操作。 01 创建应用 登录微搭后台&…

企业选择预测性维护解决方案的常见问题和PreMaint的策略

预测性维护技术在现代制造业中扮演着越来越重要的角色,有助于提高设备可靠性、降低维护成本并最大程度地减少停机时间。然而,一些企业在选择预测性维护解决方案时仍存在一些常见问题和误解。在这篇文章中,我们将探讨一些常见问题,…

Python与数据分析--Matplotlib-1

目录 1.Matplotlib库函数导入 2.简单尝试绘图 3.绘制多条折线图 4.绘制多种颜色风格曲线 5.图片内容文本操作实例 6.图例设置实例 7.坐标轴设置实例 1.Matplotlib库函数导入 #导入matplotlib库 import matplotlib as mpl import matplotlib.pyplot as plt #平常一般用第…

手把手教你前端 NodeJs 常用技术和第三方库使用详细教程(每周更新中)

dotenv 加载环境变量 dotenv是一个用于在Node.js项目中加载环境变量的库。它允许你将环境变量存储在一个名为.env的文件中,并在你的应用程序中轻松访问这些变量。 dotenv 官方网站:https://www.dotenv.org/docs 要使用dotenv,你需要首先在你…

(2023,微调节,多纵横比训练,细化模型)SDXL:用于高分辨率图像合成的改进的潜在扩散模型

SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis 公众号:EDPJ(添加 VX:CV_EDPJ 或直接进 Q 交流群:922230617 获取资料) 目录 0. 摘要 1. 简介 2. 改进稳定扩散 2.1 架构与规模 …

Python基础数据结构入门必读指南

更多资料获取 作者主页:涛哥聊Python 个人网站:涛哥聊Python 大家好,我是涛哥,今天为大家分享的是Python中常见的数据结构。 1.数组 含义:数组是一种有序的数据结构,其中的元素可以按照索引来访问。数组…

DMNet复现(二)之模型篇:Density map guided object detection in aerial image

以前用Swin Transformer Tiny训练了40epoch的,官方用的Faster RCNN,这里先用Swin Transformer Tiny进行测试。 模型训练 采用基于MMDetection的框架Swin Transformer Tiny进行训练,训练方法可参考官方教程。 融合检测 Global Image 检测 …

无涯教程-JavaScript - SEC函数

描述 SEC函数返回Angular的割线。 语法 SEC (number)争论 Argument描述Required/OptionalNumberNumber is the angle in radians for which you want the secant.Required Notes 数字的绝对值必须小于2 ^ 27 如果Angular为度,则将Angular乘以PI()/180或使用RADIANS函数将…

彻底学会Unity中UGUI中UI元素自适应问题

彻底学会Unity中UGUI中UI元素自适应问题 包会的简单版教程 狂飙模式: 经过自我进化学习,终于参悟。看完这个教程,你也可以! 1.扫盲UGUI的理解: Unity3d 中的UI都是画在画布上的。就像画一幅画,首先我们需…