用亚马逊云科技Graviton高性能/低耗能处理器构建AI向量数据库(下篇)

news2025/1/19 2:58:03

简介:

今天小李哥将介绍亚马逊推出的云平台4代高性能计算处理器Gravition,并利用该处理器构建生成式AI向量数据库。利用向量数据库,我们可以开发和构建多样化的生成式AI应用,如RAG知识库,特定领域知识的聊天机器人等。我们今天将手把手带大家在亚马逊云科技上,搭建一个目前大热的Milvus开源向量数据库,并利用VectorDBBench软件对向量数据库进行基准测试,了解Graviton如何提升AI向量数据库的性能、优化成本。

在本系列上偏中,我们介绍了如何在云平台上创建Graviton芯片基础设施,并在Graviton芯片服务器上安装Milvus开源向量数据库。在本系列下篇中,我们将利用数据库基准测试软件VectorDBBench,比较不同芯片服务器上的向量数据库性能,并查看、分析基准测试结果。

方案所需基础知识

什么是Graviton4代芯片?

Amazon Graviton 4 处理器由亚马逊云科技定制设计的第四代高性能、低功耗处理器,旨在为 Amazon 计算服务中的工作负载提供最佳性价比,相对于传统计算类工作负载(Graviton2)提供高达40%的性价比提升。与常见的 x86 处理器相比,基于 Graviton 4 的 EC2 实例具有以下特性:

  • 每个 vCPU 独占一个物理核心的计算资源,而非通过 SMT 技术获得一个线程;
  • 每个 vCPU 拥有更大的 L1/L2 Cache 容量;
  • 更快的内存带宽和更低的内存延时。
  • Graviton 处理器支持众多 Linux 操作系统,包括 Red Hat Enterprise Linux、SUSE 和 Ubuntu 等。
  • Graviton 兼容众多云原生服务和开源软件,兼容亚马逊云科技上的开发工具,数据库,容器,分析,无服务器等服务,拥有丰富的应用生态。

最新发布的第 4 代 Graviton 处理器(基于 Arm Neoverse-V2,ARMv9.0-a);主频提升,L2 缓存翻倍,L3 缓存容量提升,支持 SVE2; 内存:12*DDR5-5600(前代采用 8*DDR5-4800),内存带宽提升 75%;

什么是Milvus开源向量数据库? 

Milvus 是全球最流行的开源向量数据库之一。Milvus 是一个高度灵活、可靠且速度极快的云原生开源向量数据库。它为 embedding 相似性搜索和 AI 应用程序提供支持,并努力使每个组织都可以访问向量数据库。 Milvus 可以存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的十亿级别以上的 embedding 向量。

什么是VectorDBBench基础测试软件? 

VectorDBBench 是一个开源的向量数据库基准测试工具,专为评估向量数据库系统的性能而设计。它能够帮助用户测试和比较不同的向量数据库,以确定最适合其特定用例的数据库系统。通过 VectorDBBench,开发者可以基于实际的向量数据库性能做出明智的决策,提供性能对比参数有查询每秒(QPS)、延迟、成本等关键指标,基于综合对比结果,可以帮助开发者选择最合适的开源向量数据库。

本实践包括的内容 

1. 创建安装开源向量数据的云基础设施(Intel芯片服务器)

2. 安装向量库基准测试软件VectorDBBench

3. 对运行在Graviton和Intel芯片服务器上的Milvus开源数据库进行基础测试,并比较测试结果

项目实操步骤

创建Intel基础设施服务器

1. 首先我们进入亚马逊云科技控制台,进入EC2服务

2. 点击Launch Instance创建一台EC2服务器

3. 在芯片架构处,我们选择实例类型为r6i.xlarge(4vCPU和32GiB内存)实例用于创建Intel芯片服务器。

4.创建SSH登录秘钥对

5. 为密钥对命名,并选择pem类型,点击右下角创建。

6. 运行以下命令为密钥对授权,用于SSH登录服务器

chmod 400 test-only.pem

7. 为EC2服务器添加VPC和子网配置

8. 选择配置防火墙安全组,在防火墙入站规则中添加允许SSH从0.0.0.0/0 IP范围访问

9.并选择服务器存储,我们选择gp3类型的80GiB的磁盘存储。

通过SSH连接进入服务器

10. 通过以下命令SSH登录到EC2服务器中,将创建好的EC2服务器IP地址替换到命令中“EC2实例公网 IP 地址”字段

ssh -i /path/key-pair-name.pem ec2-user@EC2实例公网 IP 地址

安装VectorDBBench自动化测试软件

11. 在控制台中运行以下命令,安装Python必要依赖,并通过Pip安装VectorDBBench测试软件,并通过nohup后台运行该软件

sudo su - root

## 安装 Python 3.11 
dnf install -y python3.11 python3.11-pip python3.11-devel
python3.11 -V

## 安装 VectorDBBench
pip3.11 install vectordb-bench
which init_bench

## 设置一个临时文件目录
mkdir -p /mnt/vectordb_bench
ln -s /mnt/vectordb_bench /tmp/vectordb_bench

## 修改超时时间
sed -i "s/OPTIMIZE_TIMEOUT_DEFAULT    = 30 \* 60/OPTIMIZE_TIMEOUT_DEFAULT    = 300 \* 60/g"   /usr/local/lib/python3.11/site-packages/vectordb_bench/__init__.py
sed -i "s/OPTIMIZE_TIMEOUT_768D_1M    =  30 \* 60/OPTIMIZE_TIMEOUT_768D_1M    =  300 \* 60/g" /usr/local/lib/python3.11/site-packages/vectordb_bench/__init__.py

## 启动 benchmark 工具,提示可以进入 Web 页面
nohup init_bench &

## 查看 Web 页面地址
tail nohup.out 

12. 安装成功后会在控制台得到如下输出,External URL的键值记录了该测试软件的网页管理平台,我们复制URL在浏览器中打开

执行基准测试

13. 打开URL后我们可以看到软件的操作控制台,我们在控制台上点击“Run Your Test”按钮进入基准测试开始配置测试

14. 选择数据库类型为“Milvus”,在uri部分填入我们在上篇中安装Milvus服务器的私有IP地址,db_label填写“r8g.xlarge”

 15. 选择基准测试场景,我们选择一百万(1M)向量数量的数据集,向量维度为768。768是 BERT等NLP预训练模型常用的隐藏层维度之一。

16. 我们填写测试任务标签为“r8g.xlarge”,对应着Graviton4芯片服务器。作为对比我还要运行另外一个对Intel芯片服务器的测试,标签名起名为”r6i.xlarge“。再点击“Run Your Test”开始测试。

17. 我们回到安装VectorDBBench软件的服务器控制台中,输入以下命令输出软件的测试运行应用日志。

tail -f nohup.out 

输出以下结果,展示基准性能测试的测试进度

结果展示

18. 在测试完成后,我们在VectorDBBench的网页操作控制台添加我们刚运行的两个测试标签r6i.xlarge(Intel)和r8g.xlarge(Graviton4),页面会自动添加数据显示结果。可以得到以下结论:基于 Graviton4的r8g.xlarge实例上的向量数据库基准测试结果中,关键参数每秒查询数据:QPS=819,相比 r6i.xlarge Intel芯片服务器的QPS=665.3提升了23% 。

 

以上就是利用亚马逊云科技自研Graviton4代芯片构建高性能、低成本AI向量数据库的下篇内容。欢迎大家关注小李哥的亚马逊云科技AI服务深入调研系列,关注小李哥未来不要错过更多国际前沿的AWS云开发/云架构方案。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2109912.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Unity中使用四元数限制旋转

前言 在处理旋转相关的内容的时候,如果使用unity提供的欧拉角描述旋转,会出现一下两种问题 同一旋转的表示不唯一万向节死锁 绕轴90旋转与绕轴90+360旋转的表现是一致的 当某个特定轴达到某个特殊值时,绕一个轴旋转可能会覆盖另一…

Python 学习笔记(一)

input 函数 input():将输入数据的类型都转化为字符串 range 函数 自定义函数 函数与方法 列表 字符串 切片 集合 字典 函数的参数 匿名函数 文件操作 异常处理

JavaScript 21个常用数组使用方法

前言 在 JavaScript 中,数组是一种特殊类型的对象,用于存储和组织多个值。数组使您可以将值分组到单个变量名下,从而方便管理和操作数据集合。以下是更详细的解释: 在 JavaScript 中,一对方括号 [] 表示数组。数组中…

Kafka【第一篇】Kafka集群搭建

Kafka初识 1、Kafka使用背景 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位我想对用户的搜索关键词进行统计&#xff…

Nexpose 6.6.268 发布下载,新增功能概览

Nexpose 6.6.268 for Linux & Windows - 漏洞扫描 Rapid7 Vulnerability Management, release Sep 04, 2024 请访问原文链接:https://sysin.org/blog/nexpose-6/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.or…

JVM系列(五) -内存相关的调优参数

一、摘要 在上篇文章中,我们详细介绍了 JVM 的内存布局。 今天这篇文章,并结合之前的介绍知识,一起了解一下 JVM 内存相关的调优参数。 二、内存设置相关的命令 所有内存溢出的问题,除了代码可能存在问题以外,更直观的问题是内存空间不足,如何通过参数来控制各区域的…

【数据结构】排序算法篇二

【数据结构】排序算法篇二 1. 快速排序(hoare版本)(1)基本思想:(2)动态图解:(3)代码实现:(4)特性总结: 2. 快速…

《Few-shot Object Counting with Similarity-Aware Feature Enhancement》CVPR2023

摘要 论文提出了一种新颖的学习模块,该模块包含一个相似性比较模块(Similarity Comparison Module, SCM)和一个特征增强模块(Feature Enhancement Module, FEM)。通过比较支持图像和查询图像的投影特征,生…

运维变革:迎接数字化转型的挑战

在数字化转型的浪潮中,我们的技术架构和实现方式正经历着前所未有的变革。这一变革不仅重塑了业务形态,也对运维体系和运维组织模式产生了深远影响。近期,在与众多客户探讨“十四五”规划时,运维变革成为一个无法回避的重要话题。…

海外广告投放矩阵:如何选择合适的平台?

跨境电商的旺季即将来临,对于卖家们来说,如何进行有效的营销推广至关重要。在多渠道广告覆盖的策略下,选择合适的平台成为关键。那么,哪些平台是跨境旺季营销的首选呢? 一、社交媒体平台 1、Instagram 以图片和短视频…

React 通用后台管理项目

React 通用后台管理项目 项目介绍 本项目是基于React的通用后台管理系统,整体系统有数据可视化展示,数据基本的增删改查功能。项目使用 Create React App创建,主语言为JavaScript。在使用React框架过程中通过hook进行页面逻辑编写。后端接口…

使用SQL语句查询MySQL数据表

6.1 创建单表基本查询 1&#xff0e;Select 语句的语法格式及其功能 &#xff08;1&#xff09;Select 语句的一般格式。 Select < 字段名称或表达式列表 > From < 数据表名称或视图名称 > [ Where < 条件表达式 > ] [ Group By < 分组的字段名称…

web前端-HTML常用标签案例

体育新闻&#xff1a; 代码: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title&g…

轻翼AI 1.1版本发布!多轮对话、多模态等等你期待的全都有

轻翼 AI 是一款低门槛的 AI 智能体搭建平台。即便是没有任何编程基础的人&#xff0c;也可以通过轻翼 AI 快速搭建出各种由LLM&#xff08;大语言模型&#xff09;驱动的企业级AI智能体。 智能体&#xff1a;拥有独立人设和岗位职责&#xff0c;熟悉企业知识且能够调用技能&…

下载Mongodb 4.2.25 版本教程

1、MongoDB 安装包的下载链接 Download MongoDB Community Server | MongoDB 进入如下截图&#xff1a; 2、查找历史版本 往下拉&#xff0c;点击“...”,找到”Archived releases”,点击进入 、 3、下载Mongodb 4.2.25 版本 找到如下图4.2.25版本下载链接&#xff0c;点击就可…

Python爬虫使用实例-漫kzhan

环境配置 pip install shutil parsel pillow pypdf1/ 单个章节 singleChapter 需要获取参数&#xff1a;chapter_id与comic_id&#xff0c;可能要sign和uid 获取请求地址 urlhttps://comic.mkzhan.com/chapter/content/v1/ # 请求地址获取请求参数 data{chapter_id:499…

LiveQing视频点播流媒体RTMP推流服务功能-支持大疆等无人机RTMP推流支持OBS推流一步一步搭建RTMP视频流媒体服务示例

LiveQing支持大疆等无人机RTMP推流支持OBS推流一步一步搭建RTMP视频流媒体服务示例 1、流媒体服务搭建2、推流工具准备3、创建鉴权直播间4、获取推流地址5、配置OBS推流6、推流及播放7、获取播放地址7.1 页面查看视频源地址7.2 接口查询 8、相关问题8.1、大疆无人机推流花屏 9、…

湖南(竞品调研)源点咨询 品牌进行有效竞争对手分析之浅见

在做品牌竞品调研时&#xff0c;首先在选择对标品牌的时候定要选择同赛道的&#xff0c;其次要深入地做好调研&#xff0c;搜集同品类、同赛道的品牌、门店调研。 同时&#xff0c;对竞品的调研一定要全面的分析他们的优势、劣势&#xff0c;充分学习他们身上的优点&#xff0…

2024 年全国大学生数学建模竞赛论文资料

获取比赛资料&#xff0c;请关注WX&#xff1a;“小何数模”&#xff01; &#xff08;需要完整B、C和E题资料请关注WX&#xff1a;“小何数模”&#xff01;&#xff0c;获取资料链接&#xff01;&#xff09; 经过团队努力&#xff0c;今年国赛数学建模B、C和E题完整论文资…

【mysql】mysql之主从部署以及介绍

本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》&#xff1a;python零基础入门学习 《python运维脚本》&#xff1a; python运维脚本实践 《shell》&#xff1a;shell学习 《terraform》持续更新中&#xff1a;terraform_Aws学习零基础入门到最佳实战 《k8…