ModaHub魔搭社区：向量数据库Milvus性能优化问题（一）

news2025/11/3 13:43:03

目录

性能优化问题

为什么重启 Milvus 服务端之后，第一次搜索时间非常长？

为什么搜索的速度非常慢？

如何进行性能调优？

应如何设置 IVF 索引的 nlist 和 nprobe 参数？

性能优化问题

为什么重启 Milvus 服务端之后，第一次搜索时间非常长？

重启后第一次搜索时，会将数据从磁盘加载到内存，所以这个时间会比较长。可以在 server_config.yaml 中开启 preload_collection，在内存允许的情况下尽可能多地加载集合。这样在每次重启服务端之后，数据都会先载入到内存中，可以解决第一次搜索耗时很长的问题。或者在查询前，调用方法 load_collection() 将该集合加载到内存。

为什么搜索的速度非常慢？

请首先检查 server_config.yaml 的 cache.cache_size 参数是否大于集合中的数据量。

如何进行性能调优？

确保配置文件中的参数 cache.cache_size 值大于集合中的数据量。
确保所有数据文件都建立了索引。
检查服务器上是否有其他进程在占用 CPU 资源。
调整参数 index_file_size 和 nlist 的值。
如果检索性能不稳定，可在启动 Milvus 时添加参数 -e OMP_NUM_THREADS=NUM，其中 NUM 为 CPU 逻辑核数的 2/3。

详见性能调优。

应如何设置 IVF 索引的 nlist 和 nprobe 参数？

IVF 索引的 nlist 值需要根据具体的使用情况去设置。一般来说，推荐值为 4 × sqrt(n)，其中 n 为 segment 内的 entity 总量。

nprobe 的选取需要根据数据总量和实际场景在速度性能和准确率之间进行取舍。建议通过多次实验确定一个合理的值。

以下是使用公开测试数据集 sift50m 针对 nlist 和 nprobe 的一个测试。以索引类型 IVF_SQ8 为例，针对不同 nlist/nprobe 组合的搜索时间和召回率分别进行对比。

因 CPU 版 Milvus 和 GPU 版 Milvus 测试结果类似，此处仅展示基于 GPU 版 Milvus 测试的结果。

在本次测试中，nlist 和 nprobe 的值成比例增长，召回率随 nlist/nprobe 组合增长呈现上升的趋势。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/706786.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

如何创建你的第一个西门子200PLC程序

如何创建你的第一个西门子200PLC程序

更多关于西门子S7-200PLC内容请查看：西门子200系列PLC学习课程大纲创建西门子200PLC程序分五步：1.打开Micro/WIN软件；2.新建工程；3.打开程序编辑器；4.输入程序指令；5.保存程序。我们以下图程序为例讲解西…

阅读更多...

Unable to reload Maven project

Unable to reload Maven project

原因就是IDEA的版本与Maven的版本冲突。 IDEA的日志报错如下： 我当时IDEA是2020版，Maven是3.8.5. 后来把Maven换成3.6.3版本就可以了。

阅读更多...

途乐证券|沪深两市震荡整理机器人概念成市场新热点

途乐证券|沪深两市震荡整理机器人概念成市场新热点

周四，A股三大指数维持窄幅震荡整理走势，沪深两市成交额仍维持在9000亿元下方，北向资金净卖出超70亿元。盘面上，减速器、机器人概念持续爆发，煤炭、电力板块领跌。香港途乐证券有限公司（191883.com&#xf…

阅读更多...

【每日一题】Leetcode - 剑指 Offer 43. 1～n 整数中 1 出现的次数

【每日一题】Leetcode - 剑指 Offer 43. 1～n 整数中 1 出现的次数

题目 Leetcode - 剑指 Offer 43. 1～n 整数中 1 出现的次数解题思路分解数字中的每一位，判断记录结果 class Solution {public int countDigitOne(int n) {int count 0;for (int i 1; i < n; i) {int localI i;while (localI / 10 ! 0) {in…

阅读更多...

Leetcode-每日一题【143.重排链表】

Leetcode-每日一题【143.重排链表】

题目给定一个单链表 L 的头节点 head ，单链表 L 表示为： 请将其重新排列后变为： 不能只是单纯的改变节点内部的值，而是需要实际的进行节点交换。示例 1： 输入：head [1,2,3,4,5]输出：[1,5,2,…

阅读更多...

Ubuntu 23.10 现在由Linux内核6.3提供支持

Ubuntu 23.10 现在由Linux内核6.3提供支持

对于那些希望在Ubuntu上尝试最新的Linux 6.3内核系列的人来说，今天有一个好消息，因为即将发布的Ubuntu 23.10（Mantic Minotaur）已经重新基于Linux内核6.3。 Ubuntu 23.10的开发工作于4月底开始，基于目前的临时版本Ubu…

阅读更多...

光模块封装类型有哪些？光模块“皮肤”大揭秘

光模块封装类型有哪些？光模块“皮肤”大揭秘

什么是光模块？ 光模块（Optical Transceiver）全称为光收发一体模块，它是光通信中的核心器件，能够完成信号的光-电/电-光转换过程，它由光电子器件、功能电路和光接口等部件组成，其中的光电子器件…

阅读更多...

【STL】iterator adapters_反向迭代器的实现

【STL】iterator adapters_反向迭代器的实现

放在专栏【C知识总结】，会持续更新，期待支持本章相关文章： 【STL】容器适配器【STL】list的模拟实现【STL】vector的模拟实现 1、反向迭代器介绍 1.1、前言在前文中我们已经讲过STL中的适配器概念，即在底层将一个类的接口转…

阅读更多...

centos7卸载自带jdk(openjdk)

centos7卸载自带jdk(openjdk)

前提：root模式 1、查看自带jdk 首先确定我们有自带的jdk，然后搜索jdk java -version rpm -qa | grep jdk 2、使用如下命令卸载openjdk rpm -e --nodeps [name] 复制带有openjdk的那两行，有的人可能有多行。一条条执行。最后java -ver…

阅读更多...

win10/11环境解决fastboot模式看不到设备

win10/11环境解决fastboot模式看不到设备

问题描述： C:\Users\good>adb devices * daemon not running. starting it now on port 5037 * * daemon started successfully * List of devices attached ? device C:\Users\good>fastboot devices fastboot devices 不是内部或外部命令&#xff0…

阅读更多...

茶油生产加工MES质量溯源平台源码（spring boot+mybatis+easyui+mysql+h5）

茶油生产加工MES质量溯源平台源码（spring boot+mybatis+easyui+mysql+h5）

一、生产加工MES（Manufacturing Execution System，简称MES）是一种面向车间的生产过程管理与实时信息系统。它主要负责监控生产过程，管理生产资源，优化生产流程，提高生产效率和质量。MES系统需要与ERP系统、…

阅读更多...

【阻塞队列】阻塞队列DelayedWorkQueue源码详解

【阻塞队列】阻塞队列DelayedWorkQueue源码详解

目录一、前言二、ScheduledThreadPoolExecutor线程池三、DelayedWorkQueue延迟阻塞队列四、工作原理五、源码分析 5.1 定义 5.2 成员属性 5.3 构造函数 5.4 入队方法 5.4.1 offer添加元素 5.4.2 扩容grow() 5.4.3 向上堆化siftUp 5.5 出队方法 5.5.1 take()…

阅读更多...

LangChain 基于 ChatGPT 构建本地知识库问答应用

LangChain 基于 ChatGPT 构建本地知识库问答应用

一、使用本地知识库构建问答应用上篇文章基于 LangChain 的Prompts 提示管理构建特定领域模型，如果看过应该可以感觉出来 ChatGPT 还是非常强大的，但是对于一些特有领域的内容让 GPT 回答的话还是有些吃力的，比如让 ChatGPT 介绍下什么是 L…

阅读更多...

二重积分的解题技巧

二重积分的解题技巧

计算方法本节内容一般都应该先画图再思考后续内容较为直观基本口诀是：后积先定限，限内画条线，先交写下限，后交写上限（且下限必须小于上限） 结合下图进行解释，后积先定限，对于X-型来…

阅读更多...

Java基础-多线程JUC-多线程实现的三种形式

Java基础-多线程JUC-多线程实现的三种形式

1. 第一种继承Thread，重写run方法 public class demo1 {public static void main(String[] args) {/*** 多线程的第一种启动方式* 1. 定义一个类继承Thread* 2. 重写run方法* 3. 创建子类的对象，并启动线程*/MyThread myThread new MyThread();MyThrea…

阅读更多...

受检异常和非受检异常

受检异常和非受检异常

所谓的受检异常，表示在编译的时候强制检查的异常，这种异常需要显示的通过 try/catch 来捕捉，或者通过 throws 抛出去，否则从程序无法通过编译。而非受检异常，表示在编译器可以不需要强制检查的异常，这种异…

阅读更多...

Java基础---如何理解Java中的多态

Java基础---如何理解Java中的多态

目录所谓多态方法的重载与重写重载和重写的区别所谓多态多态的概念比较简单，就是同一操作作用于不同的对象，可以有不同的解释，产生不同的执行结果如果按照这个概念来定义的话，那么多态应该是一种运行期的状态为了实现运行…

阅读更多...

VScode 配置Orbslam debug调试环境（ubuntu18.04）

VScode 配置Orbslam debug调试环境（ubuntu18.04）

如果没有安装VScode的话，可以去点击官网下载如果已经安装了VScode，可以直接把ORBSLAM的工程文件夹拖到VScode中，系统会提示是否添加C/C编译工具，直接安装即可，安装过程中也可以安装一下cmake 将ORBSLAM的工程文件夹拖…

阅读更多...

obs编译

obs编译

源码地址： GitHub - obsproject/obs-studio: OBS Studio - Free and open source software for live streaming and screen recording windows 编译： Build Instructions For Windows obsproject/obs-studio Wiki GitHub https://www.cnblogs.co…

阅读更多...

app自动化测试（Android）--App 控件定位

app自动化测试（Android）--App 控件定位

客户端的页面通过 XML 来实现 UI 的布局，页面的 UI 布局作为一个树形结构，而树叶被定义为节点。这里的节点也就对应了要定位的元素，节点的上级节点，定义了元素的布局结构。在 XML 布局中可以使用 XPath 进行节点的定位。 App的布…

阅读更多...

推荐文章

最新文章