如何选择向量数据库|Weaviate Cloud v.s. Zilliz Cloud

news2025/1/12 21:07:32

随着以 Milvus 为代表的向量数据库在 AI 产业界越来越受欢迎,传统数据库和检索系统也开始在快速集成专门的向量检索插件方面展开角逐。

例如 Weaviate 推出开源向量数据库,凭借其易用、开发者友好、上手快速、API 文档齐全等特点脱颖而出。同样,Zilliz Cloud/Milvus 向量数据库因为能够高性能、低时延处理海量数据而备受瞩目。

二者都是专为向量数据打造,但适用于不同场景。Weaviate 更适合需要快速集成向量数据库的开发人员。如果应用系统更注重可扩展性、高性能、低时延,Zilliz Cloud/Milvus 是更合适的选择,因为其架构更灵活,性能更佳,更稳定,适用于对性能指标有着严格要求的场景。

本文将撇开这些表面差异,通过比较二者的性能基准测试结果和 Weaviate Cloud 的相关特性,深入探究 Weaviate Cloud 和 Zilliz Cloud 的差异。

01.Weaviate Cloud v.s. Zilliz Cloud:性能大比拼

最近,随着检索增强生成系统(RAG)的持续火爆,开发者对于“如何选择一个向量数据库”的疑惑也越来越多。过去几周,我们从性能和特性能力两个方面对 Weaviate Cloud 和 Zilliz Cloud 进行了详细的对比。在对比过程中,我们使用了开源的性能基准测试套件 VectorDBBench,围绕诸如每秒查询次数(QPS)、每美元查询次数(QP$)以及时延等关键指标展开测试。

测试用数据集

以下为测试中使用的两类数据集:

  • 数据集 1 包含 1,000,000 条 768 维的向量数据。

  • 数据集 2 包含 500,000 条1,536 维的向量数据。

测试对象

以下为测试时使用的实例。这些实例在硬件配置上基本相近:

  • Zilliz Cloud (1cu-perf):Zilliz Cloud 1 CU 性能型实例

  • Zilliz Cloud (1cu-cap):Zilliz Cloud 1 CU 容量型实例

  • Zilliz Cloud (2cu-cap):Zilliz Cloud 2 CU 容量型实例

  • Weaviate Cloud (Standard)

  • Weaviate Cloud (Business Critical)

注意:关于 Zilliz Cloud 计算单元(CU)的更多信息,可以参考适配各类大模型应用!手把手教你选择 Zilliz Cloud 实例类型。

每秒查询次数(QPS)

测试结果显示,在 1,000,000 条 768 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 QPS 分别是 Weaviate Cloud (Business Critical) 实例的 9 倍、8 倍和 5 倍。

alt

在 500,000 条 1,536 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 QPS 分别是 Weaviate Cloud (standard) 实例的 8 倍、6 倍和 3 倍。

alt

下图展示了各实例在不同用例下的性能评分(百分制)情况,分数越高,性能越强。具体的可参考https://github.com/zilliztech/VectorDBBench/tree/main#leaderboard。

alt

由此可以看出,Zilliz Cloud 在该指标上全面碾压 Weaviate Cloud。

每美元查询次数(QP$)

在 1,000,000 条 768 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 QP$ 分别是 Weaviate Cloud (Standard) 实例的 520 倍、332 倍和 292 倍。

alt

在 500,000 条 1,536 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 QP$ 分别是 Weaviate Cloud (Standard) 实例的 403 倍、258 倍和 194 倍。

alt

下图展示了各实例在不同用例下的性能评分(百分制)情况,分数越高,性能越强。

alt

由此可以看出,Zilliz Cloud 在该指标上全面碾压 Weaviate Cloud。

时延

在 1,000,000 条 768 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 P99 时延分别是 Weaviate Cloud (Business Critical) 实例的 26 倍、20 倍和 19 倍。

alt

在 500,000 条 1,536 维的向量数据中进行检索时,Zilliz Cloud 三款实例的 P99 时延分别是 Weaviate Cloud (Business Critical) 实例的 32 倍、18 倍和 7 倍。

alt

下图展示了各实例在不同用例https://zilliz.com/vector-database-benchmark-tool#comparison-section下的性能评分(>1 分制)情况,分数越接近 1,性能越强。

alt

由此可以看出,Zilliz Cloud 在该指标上全面碾压 Weaviate Cloud。

上述性能基准测试结果由开源的 VectorDBBench https://github.com/zilliztech/VectorDBBench工具提供。在工具的 GitHub 主页上,还可以看到向量数据库的排行榜。VectorDBBench 为主流的向量数据库和相关云服务提供了公正的性能测试基准。该工具有着良好的易用性,帮助开发者轻而易举地在众多的向量数据库云服务和开源向量数据库中找到最佳选择。

02.Weaviate Cloud 特性对比

随着向量数据库可以存储的数据量呈几何级数的增长,性能也成为了向量数据库的重大挑战。为了保障数据检索性能,数据库的跨节点横向扩展能力至关重要。另外,数据插入速率、检索速率以及底层硬件的不同可能会衍生出不同的应用需求,这也让全局参数调节能力成为向量数据库的必备能力之一。

向量数据库为何而生

向量数据库是用来存储通过机器学习模型生成的非结构化数据的向量表征,为其创建索引,并在其中进行检索的一套全托管解决方案。它应该提供如下特性:

  • 可扩展性和参数调节能力

  • 多租户和数据隔离

  • 完整的 API 套件

  • 直观的用户界面和控制台

可扩展性

alt

功能

alt

专门打造

alt

关于更多详情,参见比较页面https://zilliz.com.cn/comparison/milvus-vs-weaviate。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1137315.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用AOP切面实现日志记录功能

系列文章 1.SpringBoot整合RabbitMQ并实现消息发送与接收 2. 解析JSON格式参数 & 修改对象的key 3. VUE整合Echarts实现简单的数据可视化 4. Java中运用BigDecimal对字符串的数值进行加减乘除等操作 5. List<HashMap<String,String>&…

【Javascript】函数(变量作用域)

变量:全局变量,局部变量 全局变量 挂载到window对象上的 var a全局变量;console.log(a);var a全局变量;console.log(window.a);var a全局变量;在控制台里输入a也能打印a的值 局部变量 函数体内部声明的变量 var a全局变量;function test(){var b局部…

软考高级之系统架构师系列之UP、RUP、4+1视图、JAD、JRP、RAD

概述 软件工程是一个很庞杂的系统工程,而我们面对的软件需求也很复杂: 面对不同规模(复杂度,模块量,用户量,开发周期等等)的软件项目,人员储备不尽不同的开发团队也会采用不同的软…

数据可视化在行业解决方案中的实践应用 ——华为云Astro Canvas大屏开发研究及指南

本文主要探讨华为云Astro Canvas在数据可视化大屏开发中的应用及效果。首先阐述Astro Canvas的基本概念、功能和特性说明,接着集中分析展示其在教育、金融、交通行业等不同领域实际应用案例;之后,详细介绍使用该工具进行大屏图表创建的开发指…

22年下半年上午题

计算机指令集 cpu的构成 存储器 决策表 原型模型 白盒测试 活动图 构件图 半圆是需接口,满圆是供接口,上图有小错误。 故障类型 b-树 排序算法复杂度 二分查找平均比较次数 成功查找比较平均次数 失败查找平均比较次数 如有 OSI 模型层次对应典型机器…

Vue+ElementUI项目打包部署到Ubuntu服务器中

1、修改config/index.js中的assetsPublicPath: /,修改为assetsPublicPath: ./ assetsPublicPath: ./2、在build/utils.js中增加publicPath: ../../ publicPath: ../../3、打开终端,在根目录下执行npm run build进行打包,打包成功后会生成dist npm run…

前端使用 printJS 插件打印多页:第一页空白问题解决

printJS({printable: [data:image/jpg;base64,${this.printData.url}],type: image,style: media print { page {size: auto; margin: 0; } body{margin:0 5px}} // 解决出现多页打印时第一页空白问题 })

java基础 集合2

9.List遍历方式: 10.Arraylist底层原理: 11.Linklist底层原理: 1.LinkedList做队列和栈: package day01;import java.util.ArrayList; import java.util.Iterator; import java.util.LinkedList; import java.util.List;publ…

Vue3 + Tsx 集成 ace-editor编辑器

Ace Editor介绍 Ace Editor(全名:Ajax.org Cloud9 Editor)是一个开源的代码编辑器,旨在提供强大的代码编辑功能,通常用于构建基于Web的代码编辑应用程序。它最初由Cloud9 IDE开发,现在由开源社区维护。 主…

计算机网络 第四章网络层

文章目录 1 网络层的功能2 数据交换方式:电路交换3 数据交换方式:报文交换4 数据交换方式:分组交换5 数据交换方式:数据报方式6 数据交换方式:虚电路方式及各种方式对比7 路由算法及路由协议8 IP数据报的概念和格式9 I…

数据存储成本降低50%!图匠数据搭载OceanBase全新出发

近日,AI 技术公司 ImageDT 图匠数据(以下简称“图匠”)上线 OceanBase。目前,公司两大核心业务“数货宝”、“数智柜”已全面接入 OB Cloud 云数据库,保障图匠一站式全渠道销售数字化闭环作战平台的每一笔「数据」都算…

浮动面试题

浮动元素特点:

找不到mfc100u.dll怎么解决,总结了多种修复方法帮你解决

首先,让我们来了解一下mfc100u.dll文件是什么?其实,mfc100u.dll是Microsoft Foundation Class(MFC)库中的一个动态链接库文件,它包含了一些常用的类、函数和变量等资源,用于支持Windows应用程序的开发。 那么&#xf…

顺序表的查找(按位查找、按值查找)(数据结构与算法)

顺序表的基本操作:按位查找、按值查找 顺序表的按位查找 GetElem(L, i) :按位查找,获取表L中第 i 个位置元素的值 #define MaxSize 10 //定义最大长度 typedef struct{ElemType data[MaxSize]; //用静态的“数组”存放数据元…

大模型如何商业变现?小i机器人发布华藏大模型生态

华藏通用大模型生态体系由“113”三部分组分,即:一个能力基座一项产品支撑三项服务保障。 今年以来,市场上各类人工智能大模型如雨后春笋,但如何将大模型进行科学的商业变现,成为摆在行业面前的一道难题。在刚刚召开的…

Nginx+cpolar实现内网穿透多个Windows Web站点端口

文章目录 1. 下载windows版Nginx2. 配置Nginx3. 测试局域网访问4. cpolar内网穿透5. 测试公网访问6. 配置固定二级子域名7. 测试访问公网固定二级子域名【总结】: 1. 下载windows版Nginx 进入官方网站(http://nginx.org/en/download.html)下载windows版的nginx 下载…

Postman如何导出接口的几种方法?

本文主要介绍了Postman如何导出接口的几种方法,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 前言: 我的文章还是一贯的作风,简确用风格(简单确实有用)&a…

Apifox创建团队 项目 接口 邀请成员步骤演示

我们打开Apifox 找到 个人空间 然后 点击新建团队 然后这里 我们输入名字 点击确定 我们的团队就出来了 然后 我们点击新建项目 然后肯定是 http 项目名称输入一下 然后 语言 我们中国肯定是中文的 然后点击确定 建好之后 我们就会进入自己的项目啦 然后 我们可以新建个接…

VScode中配置python环境

声明:本文出自B站UP主---火星动力猿 下载教程点击下面链接 【文档包】VScode配置Python【发布】.zip - 蓝奏云文件大小:2.4 M|https://wwn.lanzouh.com/iG5tn03iqwwh

单例模式及其使用场景

单例模式(Singleton):指在一个系统中某个类只存在一个实例,类中自行实例化,实例向该系统提供统一的访问接口。 单例模式有两种表现形式,饿汉式:类加载时,就进行实例化;懒…