机器学习平台 PAI 支持抢占型实例,模型服务最高降本 90%

news2024/11/18 19:35:39

助力模型推理服务降本增效,适用于推理成本敏感场景,如:AIGC 内容生成异步推理、批量图像处理、批量音视频处理等。

在 AI 开发及服务不断追求效率的背景下,阿里云机器学习平台 PAI 宣布支持抢占型实例(Spot Instance)。在模型推理环节,用户可以通过 PAI-EAS 模型在线服务平台灵活选择抢占型实例来运行推理时延相对不敏感的任务,进而节省服务成本,同等机型的抢占型实例与按量付费实例相比,最高可实现 90% 的成本优化。

什么是抢占型实例

抢占型实例(Spot Instance)是计算资源的一种购买方式。与传统的包年包月实例、按量付费实例不同,抢占型实例的售价跟随市场需求与库存的供需关系实时浮动。PAI-EAS 抢占型实例基于公共资源组内空闲的计算资源提供服务,可以为用户提供低价资源,价格最低可至按量付费实例的 10%。各类实例购买方式的单价比较为:无保护抢占型实例 < 有保护抢占型实例 < 预付费实例 < 按量付费实例。

用户在使用 PAI-EAS 抢占型实例前,首先需要设置出价上限,并选定是否设置 1 小时保护期。当成功部署服务时,PAI-EAS 会自动竞价抢占相应资源。

购买抢占型实例:

  • 当实例库存充足且用户配置的出价上限不低于当前抢占型实例市场价,则成功抢占资源。

使用抢占型实例:

  • 若用户设置 1 小时保护期,购买抢占型实例成功后,默认至少保障使用 1 小时该实例资源。在 1 小时保护期内,若实例市场价超出用户设定的出价上限,仍将按照出价上限计费。超过 1 小时后,当出现实例库存不足或出价上限低于市场价的情况,实例会立刻释放。
  • 若用户未设置 1 小时保护期,购买抢占型实例成功后,当出现实例库存不足或出价上限低于市场价的情况,实例会立刻释放。

多实例部署

  • 在使用抢占型实例部署服务时,若只指定单一规格的计算资源,会出现由于出价不高或库存不足导致服务长时间无法拉起的情况;或者因 spot 价格上浮导致资源释放,从而造成服务处于 pending。针对该问题,PAI-EAS 部署环节支持多规格实例选择,通过遍历服务资源配置中的规格列表来拉起资源,从而极大降低因抢占型实例释放带来的部署风险,保证服务的稳定运行。

通过这张图对 PAI-EAS 抢占型实例(Spot Instance)的计价规则进行简要示意。如图所示,该实例按量付费实例价格为 13.98 元/小时,用户的出价上限为 5 元/小时并设置了 1 小时保护期。通过抢占型实例,用户得以以较低的价格使用计算资源。
在这里插入图片描述

注:以 2023 年 4 月 23 日 PAI-EAS 公共资源组抢占型实例价格进行示例,机型为 8vCPU+30GB+1*A10

PAI-EAS 抢占型实例适用场景

PAI-EAS 抢占型实例(Spot Instance)适用于对价格非常敏感、但对推理服务实时性及稳定性相对不敏感的场景,如:

  • AIGC 内容生成的异步推理场景
  • 图像识别、OCR 等批量后处理的图像分析
  • 视频分割、视频分类等批量后处理的视频分析
  • 语音分割、语音转文字等异步推理或批量推理的的语音分析
  • Stable Diffusion 等 AI 绘画的异步批量处理场景

当用户不需要实时拿到推理返回的结果,而是可以接受一段时间(例如 1 小时内)的延迟,这些情况就适合采用抢占型实例优化服务成本。

在实际业务场景中,客户可以先购买一定量的预付费资源作为保底资源,保障服务可以顺利运行;而对于弹性部分,可以根据业务场景搭配使用不同机型的抢占型实例,并通过 PAI-EAS 提供的自动弹性伸缩功能来自动扩缩抢占型实例,当因价格原因无法通过抢占型实例扩容时,PAI-EAS 也提供多规格实例选择让用户使用普通按量付费实例进行扩容,从而以较低的组合成本保障服务稳定运行。

如何配置使用 PAI-EAS 抢占型实例

1、进入 PAI-EAS 控制台,点击“部署服务”,进入详细配置界面;

2、在 “资源部署信息”区块,“资源组种类”勾选“公共资源组”,“资源配置方法”切换至“高级资源配置”,即可配置模型服务部署的抢占型实例资源(spot instance);
在这里插入图片描述

3、选择抢占型实例的保留时长:

设置 1 小时保护期:部署成功后,默认至少可以使用 1 小时,即抢占成功后有 1小 时的保护期,保护期内可以保障您可以使用资源。超过 1 小时的保护期后,如抢占式资源实例库存充足,且您之前设置出价上限不低于当前抢占式实例市场价,您也可以继续使用抢占式实例。

无确定保护期:不保证有固定时长的保护期来保障资源使用。如抢占式资源实例库存充足,且您设置出价上限不低于当前抢占式实例市场价,您也可以继续使用抢占式实例。价格上也会比有 1 小时保护器的更便宜。

4、选择机器型号,可以看到当前该机型抢占型的价格和原价的对比,从而进行出价。当抢占型资源的价格低于出价且库存充足时,您可以一直保有该机型的使用。

点击“+”新增实例规格,服务上线后 PAI-EAS 会通过遍历服务资源配置中的规格列表来拉起资源,降低因抢占型实例释放带来的风险。

5、完成其他配置后,点击“部署”按钮即可上线服务。

参考文档

EAS 抢占型实例 Spot Instance 概述
https://help.aliyun.com/document_detail/52088.htm?spm=a2c6h.12873639.article-detail.4.23cd4fe1amQ1Rz

高级配置:多规格实例选择
https://help.aliyun.com/document_detail/602247.html?spm=a2c6h.12873639.article-detail.5.23cd4fe1amQ1Rz

机器学习平台 PAI 支持抢占型实例,模型服务最高降本 90%

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/545849.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023逆向分析代码渗透测试flag0072解析(超详细)

一、竞赛时间 180分钟 共计3小时 1.从靶机服务器的FTP上下载flag0072,分析该文件,请提交代码保护技术的类型。提交格式:XXXX。 2.提交被保护的代码所在地址。提交格式: 0xXXXX。 3.提交代码解密的密钥。提交格式: 0xXX。 4.请提交输入正确flag时的输出。提交格式: XXXX。…

Python入门(十二)while循环(二)

while循环&#xff08;二&#xff09; 1.使用while循环处理列表和字典2.在列表之间移动元素3.删除为特定值的所有列表元素4.使用用户输入来填充字典 作者&#xff1a;xiou 1.使用while循环处理列表和字典 到目前为止&#xff0c;我们每次都只处理了一项用户信息&#xff1a;获…

建站教程:腾讯云轻量服务器安装宝塔面板搭建网站流程

腾讯云轻量应用服务器镜像选择宝塔Linux面板&#xff0c;然后在宝塔面板上安装LNMP网站所需的Web环境&#xff0c;在宝塔面板上新建站点&#xff0c;上床网站程序安装包到根目录&#xff0c;并安装网站全流程。腾讯云百科来详细说下腾讯云轻量应用服务器搭建网站全流程&#xf…

百果园ESG:围绕“好吃”二字,勾勒水果行业未来蓝图

当一场可持续绿色变革开始&#xff0c;ESG&#xff08;环境、社会与治理&#xff09;已经成为企业发展战略的重要组成部分。 然而&#xff0c;如何实现ESG和企业发展的协同却是一大问题。根据毕马威《2022年中国首席执行官展望》&#xff0c;一些企业家也表示ESG投资对提升财务…

SpringBoot配置文件3种格式、配置文件读取方式、多环境配置、配置文件优先级分类

文章目录 1 配置文件格式1.1 环境准备1.2 不同配置文件演示1.3 三种配合文件的优先级 2 yaml格式2.1 语法规则 3 yaml配置文件数据读取3.1 环境准备3.2 读取配置数据方式1 使用 Value注解方式2 Environment对象方式3 自定义对象 4 多环境配置4.1 yaml文件4.2 properties文件4.3…

H.265/HEVC编码原理及其处理流程的分析

H.265/HEVC编码原理及其处理流程的分析 H.265/HEVC编码的框架图&#xff0c;查了很多资料都没搞明白&#xff0c;各个模块的处理的分析网上有很多&#xff0c;很少有把这个流程串起来的。本文的主要目的是讲清楚H.265/HEVC视频编码的处理流程&#xff0c;不涉及复杂的计算过程。…

自定义线程池 ThreadPoolExecutor

ThreadPoolExecutor 自定义线程池 public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue<Runnable> workQueue) {this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,Executors.defaultT…

Arduino ESP8266+RC522+阿里云 物联网入户控制RFID门禁系统

前言 根据项目结课报告改编而成&#xff0c;可能更适合作为一份文档而不是一篇记录类型的博客&#xff0c;没有留存接线图和运行图片&#xff0c;感到抱歉。 使用的板子是YwRobot的ESP8266板子&#xff0c;使用Arduino IDE开发&#xff0c;用到了舵机、按钮、人体感应传感器、…

Unity UI -- (4)用图像创建菜单背景

添加一个基础的设置菜单背景 设置菜单的元素会安放在一个简单的矩形区域上。我们用一个Image对象来创建这个矩形。 1. 首先&#xff0c;我们暂时停用Title Text和Settings Button游戏物体。这样会让我们的Canvas看起来更清爽。 2. 在Hierarchy中&#xff0c;点击右键&#xff0…

探索云原生世界:当前最受欢迎的技术和趋势

文章目录 探索云原生世界&#xff1a;当前最受欢迎的技术和趋势引言&#xff1a;一、云原生概述&#xff1a;1. 什么是云原生&#xff1f;2. 为什么云原生重要&#xff1f;3. 云原生的核心原则和特征。4. 云原生的优势和挑战。 二、核心技术与工具&#xff1a;1. Kubernetes&am…

C语言qsort函数、活字印刷、cmd窗口

一、qsort函数 qsort函数就是快排&#xff0c;可以不用写那么一长串的代码了qvq&#xff0c;要用到stdlib.h库文件 那么具体用法就是 oid qsort(void* base,size_t num,size_t width,int(__cdecl*compare)(const void*,const void*)); 当然我们还要用一个比较函数来确定快排…

手机APP性能测试工具PerfDog性能狗安装教程及简单使用

一、前言 PerfDog是一个由腾讯研发的主流性能测试软件。可以提高软件和游戏的运行效率&#xff0c;支持iOS/安卓在移动平台上的性能测试和分析&#xff0c;快速定位和分析性能问题等。无需安装&#xff0c;即插即用&#xff0c;减少繁琐的测试障碍&#xff0c;安卓设备不需要RO…

PCB基础~PCB介质,Vias

PCB介质 • 一般的介质材料 – FR-4&#xff08;玻璃纤维和环氧基树脂交织而成&#xff09; • 最常和最广泛使用&#xff0c;相对成本较低 • 介电常数&#xff1a;最大4.7&#xff0c; 4.35500Mhz,4.341Ghz • 可承受的最高信号频率是2Ghz(超过这个值&#xff0c;损耗和串扰…

IDEA中怎么把jar包导入项目中

大作业让生成一个pdf&#xff0c;查找资料发现可以通过pdfbo相关函数调用&#xff0c;但本地缺少这个文件&#xff0c;以这个文件为例子。 一、下载 下载去Apache上下载&#xff0c;Apache PDFBox | Download&#xff0c;&#xff0c;结合自己的java版本啥的下载就行。 我是…

java中使用java8的stream报错java.lang.IllegalStateException: Duplicate key

一、java.lang.IllegalStateException: Duplicate key报错的原因 map的key重复导致的报错Duplicate key 二、java.lang.IllegalStateException: Duplicate key报错的解决方式 list.stream().collect()就是把一个List的查询数据集合转为一个Map&#xff0c;java8的stream方式…

UE5 C++类如何打印日志?

UE5 插件开发指南 前言0. 什么是日志?1.在哪里可以查看日志呢?2. 日志有哪些等级?3. 如何打印到屏幕上?4. 如何更专业的记录日志?4.0 UE_LOG宏语法4.1 自定义日志类别4.2 插件中的日志类别定义前言 在回答这个问题之前,先要给萌新科普一下:什么是日志?以及,在哪里查看日…

自己动手写一个加载器

前言 当在 linux 命令行中 ./ 运行一个程序时&#xff0c;实际上操作系统会调用加载器将这个程序加载到内存中去执行。为了探究加载器的行为&#xff0c;今天我们就自己动手写一个简单的加载器。 工作原理 加载器的工作原理&#xff1a; 从磁盘读取 bin 文件到内存&#xf…

【Python html常用标签】零基础也能轻松掌握的学习路线与参考资料

学习路线 要深入了解Python html常用标签&#xff0c;需要遵循以下学习路线&#xff1a; 1.1 HTML基础知识&#xff1a;了解HTML语言的起源&#xff0c;HTML文档结构和基本标签。学习HTML标签包含但不限于文本标签&#xff0c;图像标签&#xff0c;链接标签&#xff0c;表格标…

canvas的HTML和JavaScript

文章目录 一、canvas元素二、前期准备1. 坐标系2. canvas属性① 获取canvas元素② 把canvas实例化为2D③ 设置路径颜色④ 设置路径宽度⑤ 设置路径末端形状⑥ 设置路径相连时的相连部分形状⑦ 透明度⑦ 虚线 三、绘制图行1. 绘制线段2. 绘制三角形① 空心三角形② 实心三角形 3…

大学四年,我建议你这么学网络安全

在所有关注我的朋友中&#xff0c;大致分为两类&#xff0c;一类是社会人士&#xff0c;有的是安全老手&#xff0c;有的是其它工作但对安全感兴趣的朋友&#xff0c;另一类应该就是大学生了。 尤其随着国家的号召和知识的普及&#xff0c;越来越多的人开始对网络安全感兴趣&a…