重新定义 AI 部署效率与性能!ZOLOZ 如何借助 AC2 实现低成本高性能的提优?| AI 案例推荐

news2025/1/12 23:44:27

AI 容器镜像——面向云上全容器场景

王坚院士提到,算力是人工智能发展的三要素之一,而云计算是最好的提供算力的技术手段,英伟达的黄仁勋也表达过类似的观点。可以说,大模型时代下的 AI,天然就是在云场景里的

容器镜像是云时代软件和应用分发、部署的事实标准,在容器引擎、集群管理系统的加持下,容器镜像可以让应用快速达到大规模分发、便捷部署的目的,并且提供了整个集群下应用的一致性保障,方便系统管理员进行应用运维。而在当前的 AI 和云计算的融合之下,如何复用容器镜像在分发和部署上的成熟能力,还能提供面向 AI 软硬件技术栈开箱即用的产品能力,是很多云上客户的需求。

用户在整个 AI 应用场景下,除了数据获取和经验积累外还存在大量前置准备和后端优化工作,而对于新入门的 AI 用户,前置准备阶段就会消耗较多的时间和精力。以 AI 系统镜像部署为例——用户想要部署自己的 AI 应用就需要进行以下操作:先获取操作系统基础镜像,然后在基础镜像上部署 runtime、AI 框架(TensorFlow、pytorch 等),最后再部署模型。这些基础环境的部署需要花费大量的精力,而针对镜像本身的安全性、维护也都存在一些问题,都在占用用户的时间和人力。

另外,针对后期的推理和训练部分,大部分用户都是直接使用开源软件和云厂商 PaaS 平台,对于推理和训练的性价比就只能交给开源和云厂商了。这里就需要厂商能够提供更好的性能,并且通过统一的 AI 容器运行环境来保障系统的兼容性和稳定性。

基于这类需求,已经有一些企业推出了面向 AI 场景的系列容器镜像产品。今天推荐的是龙蜥社区理事长单位阿里云的AI 容器镜像 ——Alibaba Cloud AI Containers(简称 AC2)。Alibaba Cloud AI Containers(AC2)通过提供开箱即用的 AI 应用环境,包括内置 CUDA AI 库、AI 框架 PyTorch 等,内置Intel、AMD、NVIDIA 等硬件厂家在 AI 生态上原生适配,并结合阿里云基础设施进行性能优化、兼容性和稳定性保障,让用户可以在阿里云上全容器场景下有更好的使用体验。

更多介绍可进入官网查看:

阿里云AI容器镜像

AC2 于 2024 年 4 月份正式上线。截止目前,已帮助数十家企业解决了 AI 场景下的不同问题,涵盖金融、券商、电商、自动驾驶等领域。其中具有代表性的是 助力 ZOLOZ (世界领先的身份认证和安全解决方案的公司)解决在视觉 AI 认证领域的算力与成本问题,本文将详细介绍——ZOLOZ 如何借助 Alibaba Cloud AI Containers(AC2),实现低成本高性能的完美提优。

图片

(图/Alibaba Cloud AI Containers 产品架构)

案例推荐:ZOLOZ,视觉 AI 推理的算力和成本问题求解

ZOLOZ 是蚂蚁数科的身份安全品牌,致力于提供世界领先的身份认证和安全解决方案,核心产品囊括可信身份认证、反洗钱、终端安全等,为中国、印尼等 14 个国家和地区的 70 余家合作伙伴提供技术服务。其中 ZOLOZ RealId 产品采用大量深度学习模型提供实人认证、人脸识别、证件核验等组合能力,帮助客户解决数字化渠道下实人认证相关的体验和安全问题,应用于金融业务核身、人证核验、人脸注册/登录等多种场景。

(图/视觉 AI 技术在ZOLOZ RealID产品中的典型应用)

项目挑战:算力和成本等

为了提升视觉 AI 推理效率,给用户提供更加安全、实时性的实人认证服务,提升竞争优势,ZOLOZ 希望重点解决视觉 AI 推理在算力和成本等层面的挑战

  • 在保证视觉 AI 推理精度的同时,提升吞吐率。ZOLOZ 核心模型不仅需要在单位时间内处理海量的请求,还必须确保处理时间在严格的时延阈值范围内,以实现出色的用户体验。

  • 采用 CPU 进行小模型推理服务,获取更高的成本效益。通过软件优化充分释放硬件潜力,有效利用服务器资源,从而降低认证服务的总体拥有成本(TCO)。

  • 提升视觉 AI 服务敏捷性,高效部署模型。简化应用部署流程,提升 AI 服务开发效率。

项目方案:AC2+Intel OpenVINOTM

面对如上挑战,ZOLOZ 与阿里云、Intel 展开合作。通过 Alibaba Cloud AI Containers(AC2)产品并利用 Intel 的开源 AI 工具套件 OpenVINO™,在第五代英特尔® 至强® 可扩展处理器构建端到端的深度学习应用流程,提升推理性能优化效果,在 CPU 上实现高效的深度学习模型推理。

图片

针对视觉 AI 推理服务成本较高的挑战,ZOLOZ 选择了小模型推理服务 CPU 化的策略,即采用英特尔® 至强® 可扩展处理器处理负载压力与时延要求相对较低的模型推理服务。这种方式有助于 ZOLOZ 高效利用现有的 CPU 资源,降低在 GPU 部署与运维方面的高昂成本。为了进一步加速视觉 AI 推理服务的性能表现,ZOLOZ 采用了第五代英特尔® 至强® 可扩展处理器,并利用处理器集成的英特尔® AMX 加速引擎,以及英特尔® OpenVINO™ 等软件套件进行优化。在多个视觉 AI 模型中,ZOLOZ 通过采用英特尔® AMX 加速技术,动态将模型数据类型从 FP32 转换为 BF16,从而在可接受的精度损失下,增加吞吐量并加速推理。为了验证优化后的性能提升,ZOLOZ 将使用英特尔® AMX 加速技术转换后的 BF16 模型,与基准 FP32 模型的推理性能进行了比较。在将模型转化为 BF16 之后,模型推理性能可实现 3.12-4.03 倍的提升,同时精度损失大部分可以控制在 0.01%-0.03%

图片

针对视觉 AI 推理服务部署难的挑战,ZOLOZ 选择了Alibaba Cloud AI Containers(AC2)产品。AC2 预先安装了各种流行深度学习框架和库,最大程度释放来自 CPU、GPU 硬件能力,降低用户在 AI 场景下的使用难度。AC2  设计为即插即用,非常方便快速将 AI 服务部署到阿里云托管服务上,如 PAI、ECI、ACK 或者自定义的 ECS 实例。AC2 将 ZOLOZ 常用的软件技术栈都内置在镜像中,并为阿里云的计算优化实例以及 ECS 实例进行优化,确保在 AI 推理时能获得最高性能。同时阿里云基础软件团队会定期更新 Alibaba Cloud AI Containers(AC2),修复安全漏洞,极大减少了 ZOLOZ 维护容器相关负担,让 ZOLOZ 能够更专注于 AI 能力的构建。而非环境的搭建和配置,也简化了 ZOLOZ 应用部署流程,在提升开发效率方面起到了重要的作用。

图片

在 ZOLOZ 的 AI 推理优化过程中,通过 Alibaba Cloud AI Containers(AC2)产品,利用 Intel 的开源 AI 工具套件 OpenVINO™充分加速释放第五代英特尔® 至强® 可扩展处理器在处理 AI 推理工作负载方面的巨大潜力,从而帮助ZOLOZ 显著提升端到端推理性能,并解决实际的业务问题。对于用户而言,该解决方案有助于降低部署专用加速器(例如独立显卡)时的开销,以及更有效地控制地址标准化的总体拥有成本 (TCO)。

项目成果:便捷、高效、低成本

  • ZOLOZ 采用 Alibaba Cloud AI Containers(AC2)镜像后,更加便捷安全部署 AI 服务,加速 DL 模型的应用,最大限度地发挥技术的价值。

  • ZOLOZ 能够在保证视觉模型符合推理时延 <= 100 毫秒的同时,将推理的吞吐量提升到 3.4 倍。同时在将模型量化到 BF16 之后,AI 推理精度依然能够满足需求。

  • 基于 CPU 的推理方案具备媲美高端 GPGPU 的性能表现,同时在成本、灵活性等方面具备更强的优势。通过软件优化充分释放了硬件潜力,有效利用服务器资源,从而降低了实人认证服务的 TCO。

此次 ZOLOZ 与 Alibaba Cloud AI Containers(AC2)、 Intel 的深度合作,不仅是技术融合的典范,更是推动全球智能化进程的重要里程碑。三方将各自的专长与资源紧密结合,共同探索AI技术的无限可能。未来,我们期待这一联盟合作能够持续推动行业创新,也希望更多的企业牵手 Alibaba Cloud AI Containers(AC2),探讨更多合作可能性,共同为全球用户带来更安全、更高效、更具成本效益的智能解决方案,一起开启智能时代的新篇章。

附:

Alibaba Cloud AI Containers (AC2):作为阿里云官方精心打造的一系列AI容器镜像集合,正引领行业迈向AI应用的新高度。AC2 集成了多种硬件加速库、优化的 AI 运行时环境以及广泛适用的AI框架,全方位满足用户多样化的场景需求。通过与阿里云ECS(Elastic Compute Service)、ACK(Container Service for Kubernetes)和ECI(Elastic Container Instance)等基础设施的深度整合与优化,AC2 不仅显著提升了云上AI应用的性能表现,更确保了用户能够享受到流畅无阻的AI体验,加速业务创新步伐。

Intel 大模型优化团队:Intel 是全球计算创新的领导者,其大模型优化团队专注于为高性能计算和人工智能应用提供前所未有的性能提升。在本次合作中,Intel 针对 AC2 容器镜像进行了深度优化,特别是在人脸认证与证书认证等关键业务场景下,为 ZOLOZ 量身定制了优化方案。这一系列优化工作不仅助力 ZOLOZ 在香港和印尼两地顺利部署 AI 模型业务,实现了业务性能的翻倍提升,还有效降低了用户的使用成本,为全球用户提供更加高效、安全的认证体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1897416.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-第一天学习

SpringBoot介绍-约定大于配置 SpringBoot是在Spring4.0基础上开发的&#xff0c;不是替代Spring的解决方案&#xff0c;而是和Spring框架结合并进一步简化Spring搭建和开发过程的。 如何简化&#xff1f;就是通过提供默认配置等方式让我们更容易&#xff0c;集成了大量常用的…

景区智能厕所系统,打造智能化,人性化公共空间

在智慧旅游的大潮中&#xff0c;景区智能厕所系统正逐渐成为提升公共空间智能化、人性化水平的关键载体。作为智慧城市建设的重要组成部分&#xff0c;智能厕所系统不仅解决了传统公厕存在的诸多问题&#xff0c;更通过科技的力量&#xff0c;为游客创造了更加舒适、便捷的如厕…

StreamSets: 数据采集工具详解

欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;欢迎订阅相关专栏&#xff1a; 欢迎关注微信公众号&#xff1a;野老杂谈 ⭐️ 全网最全IT互联网公司面试宝典&#xff1a;收集整理全网各大IT互联网公司技术、项目、HR面试真题. ⭐️ AIGC时代的创新与未来&a…

c/c++ 程序运行的过程分析

c/c编译基础知识 GNU GNU&#xff08;GNU’s Not Unix!&#xff09;是一个由理查德斯托曼&#xff08;Richard Stallman&#xff09;在1983年发起的自由软件项目&#xff0c;旨在创建一个完全自由的操作系统&#xff0c;包括操作系统的内核、编译器、工具、库、文本编辑器、邮…

渲染农场渲染真的很贵吗?如何正确使用云渲染农场?

作为渲染行业主流的技术服务“渲染农场"&#xff0c;一直都是备受大家关注&#xff0c;渲染农场最核心的在于充足的计算机算力&#xff0c;结合3D软件支持多台机器渲染的特点&#xff0c;租用渲染农场的机器帮助你快速的解决你的渲染项目。 虽然说渲染农场需要支付一定的…

Astro新前端框架首次体验

Astro新前端框架首次体验 1、什么是Astro Astro是一个静态网站生成器的前端框架&#xff0c;它提供了一种新的开发方式和更好的性能体验&#xff0c;帮助开发者更快速地构建现代化的网站和应用程序。 简单来说就是&#xff1a;Astro这个是一个网站生成器&#xff0c;可以直接…

MinIO:开源对象存储解决方案的领先者

MinIO:开源对象存储解决方案的领先者 MinIO 是一款开源的对象存储系统&#xff0c;致力于提供高性能、可伸缩、安全的数据存储解决方案。 官方解释&#xff1a;MinIO 是一个基于Apache License v2。0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口&#xff0c;非常适…

因版本冲突导致logback的debug日志不打印

因框架调整&#xff0c;降级了logback的版本号&#xff0c;由1.3.12降级为1.2.11&#xff08;因框架限制&#xff0c;只能采用1.2版本&#xff09;&#xff0c;降级后发现debug日志无法打印出来&#xff0c;logback.xml配置文件不生效。后排查发现是与slf4j的版本兼容问题 依赖…

以某头部基金实践为例,验证深信服超融合对TA系统承载能力

TA&#xff08;Transfer Agent&#xff09;开放式基金登记过户系统是交易管理系统的重要组成部分&#xff0c;是登记注册机构向投资者提供账户管理、份额登记、交易清算、红利发放、持有人名册保管的综合服务系统。 作为开放式基金运作的核心系统之一&#xff0c;承担着投资者…

Qt 加载图片的几种方式 以及加载 loading

项目中经常使用加载图片&#xff1a; 常用有两种方式&#xff1a; 1.使用 QWidget 加载图片&#xff1a; 效果&#xff1a; 样例源码&#xff1a; int pict_H ui->widgetImage->height();int pict_W ui->widgetImage->width();ui->widgetImage->setFixe…

【车载开发系列】GIT安装详细教程

【车载开发系列】GIT安装详细教程 【车载开发系列】GIT安装详细教程 【车载开发系列】GIT安装详细教程一. GIT软件概念二. GIT安装步骤三. GIT安装确认三. GIT功能使用1&#xff09;Git Bash2&#xff09;Git CMD3&#xff09;Git FAQs4&#xff09;Git GUI 一. GIT软件概念 G…

comsol随机材料参数赋值

comsol随机材料参数赋值 在comsol中定义外部matlab函数 在comsol中定义外部matlab函数 首选项&#xff0c;安全性&#xff0c;允许 材料中&#xff0c;将杨氏模量更改为变量函数 计算 应力有波动&#xff0c;可见赋值成功 也可以看到赋值的材料参数&#xff1a;

针对 LLM 应用程序优化 RAG

前言 大型语言模型 (LLM)&#xff08;如 GPT-4&#xff09;在生成类似人类的文本方面表现出了令人印象深刻的能力。然而&#xff0c;在保留事实知识方面&#xff0c;它们仍然面临挑战。这就是检索增强生成 (RAG) 的作用所在——将 LLM 的生成能力与外部知识源相结合。RAG 已成…

TAPD项目管理软件无法与企业微信进行关联

TAPD一段时间未使用后&#xff0c;需要重新启动&#xff0c;此时会出现你的企业微信尚未与TAPD账号关联的提示 解决方案&#xff1a;找到TAPD应用&#xff0c;先删除应用&#xff0c;然后再解除禁用即可

【anaconda】—“conda info“命令后conda配置和环境信息的理解

文章目录 conda配置和环境信息的理解 conda配置和环境信息的理解 安装anaconda成功后&#xff0c;打开cmd&#xff0c;输入"conda info"命令&#xff0c;结果显示如下&#xff1a; conda的配置和环境信息的输出。以下是对每个字段的解释&#xff1a; active environm…

【MySQL】详解

SQL语句的分类&#xff1a; 1.DDL&#xff08;Data Definition Languages&#xff09;语句&#xff1a; 数据定义语言 &#xff0c;这些语句定义了不同的数据段&#xff0c;数据库&#xff0c;表&#xff0c;列&#xff0c;索引等数据库对象的定义。常用的语句关键字主要包括…

spark shuffle写操作——BypassMergeSortShuffleWriter

创建分区文件writer 每一个分区都生成一个临时文件&#xff0c;创建DiskBlockObjectWriter对象&#xff0c;放入partitionWriters 分区writer写入消息 遍历所有消息&#xff0c;每一条消息都使用分区器选择对应分区的writer然后写入 生成分区文件 将分区writer的数据flu…

强烈建议!所有Python基础差的同学,死磕这本64页的背记手册!

Python背记手册是一份非常实用的学习资料&#xff0c;它涵盖了Python语言的基础知识、语法规则、常用函数和模块等内容&#xff0c;对于初学者和有一定基础的Python程序员来说都非常有用。通过背诵这份手册&#xff0c;可以加深对Python语言的理解和记忆&#xff0c;提高编程能…

百度云智能媒体内容分析一体机(MCA)建设

导读 &#xff1a;本文主要介绍了百度智能云MCA产品的概念和应用。 媒体信息海量且复杂&#xff0c;采用人工的方式对视频进行分析处理&#xff0c;面临着效率低、成本高的困难。于是&#xff0c;MCA应运而生。它基于百度自研的视觉AI、ASR、NLP技术&#xff0c;为用户提供音视…

RFID电子锁在物流货运智能锁控管理的创新方案

物流货运锁控的现实挑战 易损性&#xff1a;传统锁具易受物理破坏&#xff0c;无法抵御恶意撬锁。 低效率&#xff1a;依赖人工操作&#xff0c;开锁速度慢&#xff0c;影响作业效率。 高成本&#xff1a;钥匙的制作、管理和丢失替换成本高昂。 监控缺陷&#xff1a;缺乏实…