ModaHub魔搭社区:向量数据库MIlvus服务端配置(三)

news2024/9/30 13:16:44

目录

gpu 区域

logs 区域

metric_config 区域


gpu 区域

在该区域选择是否在 Milvus 里启用 GPU 用于搜索和索引创建。同时使用 CPU 和 GPU 可以达到资源的最优利用,在特别大的数据集里做搜索时性能更佳。

若要切换到 CPU-only 模式,只要将 enable 设置为 false。

| 参数 | 说明 | 类型 | 默认值 | | ———————————— | —————————————————————————————— | ——————————————————————————————- | ——————————————————————————————- | | enable | 是否开启 GPU 用于搜索和索引创建。

  • true:开启 GPU。
  • false:不开启 GPU。

| Boolean | false | | cache_size | 显存中用于驻留搜索数据的缓存空间大小。该值不能超过显存总量。格式请见 空间大小的格式。 | String | 1GB | | gpu_search_threshold | 使用 GPU 查询的阈值。用 nq 表示单批次查询的向量数,则搜索计算方式如下:

 

  • nq ≥ gpu_search_threshold:搜索计算只在 GPU 上进行。
  • nq < gpu_search_threshold:搜索计算将在 CPU 和 GPU 上协同进行。

| Integer | 1000 | | search_devices | 用于搜索的 GPU 设备,格式为“gpux”。其中“x”是 GPU 的序号,例如“gpu0”。 | DeviceList | gpu0 | | build_index_devices | 用于创建索引的 GPU 设备,格式为“gpux”。其中“x”是 GPU 的序号,例如“gpu0”。 | DeviceList | gpu0 |

在 Milvus 里,创建索引和搜索是两个独立分开的过程,可以只在 CPU,或同时在 CPU 和 GPU 里进行。通过将 GPU 添加至 search_devices 或者 build_index_devices 下方,你可以指定多个 GPU 设备来进行创建索引或搜索。请参考下面的 YAML 示例代码:

 

logs 区域

| 参数 | 说明 | 类型 | 默认值 | | ———————————— | —————————————————————————————— | ——————————————————————————————- | ——————————————————————————————- | | level | 日志打印的最低级别。日志级别:debug < info < warning < error < fatal。 | String | debug | | trace.enable | 是否开启 trace 级别日志打印。

  • true:开启 trace 级别日志打印。
  • false:不开启 trace 级别日志打印。

| Boolean | true | | path | 日志存储路径。 | String | /var/lib/milvus/logs | | max_log_file_size | 单个日志文件的大小限制,范围:1024MB ~ 4096MB。格式请见 空间大小的格式。 | Integer | 1024MB | | log_rotate_num | 每个日志级别最多保存的文件数量,范围:[0, 1024]。0 代表日志文件数无限制。 | Integer | 0 |

 

metric_config 区域

| 参数 | 说明 | 类型 | 默认值 | | ———————— | ———————————————————— | ————————————————————- | ———————————————————— | | enable | 是否开启 Prometheus 监控。

  • true:开启 Prometheus 监控。
  • false:不开启 Prometheus 监控。

| Boolean | false | | address | 访问 Prometheus Pushgateway 的 IP 地址。 | IP | 127.0.0.1 | | port | 访问 Prometheus Pushgateway 的端口号。范围:[1025, 65534]。 | Integer | 9091 |

在 Milvus 配置文件中,空间大小的格式为“数字+单位”,如“4GB”。

  • 数字和单位之间没有空格。
  • 数字必须是整数。
  • 可选单位为 GB、MB、KB。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687357.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【敬伟ps教程】色彩基础

文章目录 在通道内发现色光吸管工具与颜色面板在RGB通道创造色彩色彩三要素选择方式CMYK模式详解 在通道内发现色光 RGB基于色光的混合模式&#xff0c;是最常见的色彩模式 我们新建一个 RGB 画布&#xff0c;前景色改为黑色&#xff0c;AltDelete填充前景色。我们查看图像–…

实验篇(7.2) 18. 星型安全隧道 - 分支互访(IPsec) ❀ 远程访问

【简介】Hub-and-Spoke&#xff1a;各分支机构利用VPN设备与总部VPN设备建立VPN通道后&#xff0c;除了可以和总部进行通讯&#xff0c;还可以利用总部VPN设备互相进行数据交换&#xff0c;而各VPN分支机构不需要进行VPN的隧道连接。 实验要求与环境 OldMei集团深圳总部部署了域…

C# 线程基础 二

目录 八、前台线程和后台线程 九、线程参数的传递 十、线程中的 lock 关键字 十一、Monitor类锁定 结束 八、前台线程和后台线程 默认情况下&#xff0c;显式创建的线程是前台线程&#xff0c;通过手动的设置 Thread 类的属性 IsBackground true 来指示当前线程为一个后…

让GPT-3、ChatGPT、GPT-4一起做脑筋急转弯,GPT-4一骑绝尘!

作者 | python 一个烙饼煎一面一分钟&#xff0c;两个烙饼煎两面几分钟&#xff1f; 让你来回答&#xff0c;是不是一不小心就掉到沟里了&#xff1f;如果让大语言模型来做这种脑筋急转弯会怎样呢&#xff1f;研究发现&#xff0c;模型越大&#xff0c;回答就越可能掉到沟里&a…

VScode连接远程服务器

VScode连接远程服务器 文章目录 VScode连接远程服务器下载扩展通过扩展连接服务器在输入框中输入usernameip进行连接通过已保存的配置信息进行连接 连接成功之后访问服务器文件访问文件 下载扩展 下载以下三个扩展 Remote-SSH Remote - SSH: Editing Configuration Files R…

Docker Network 基础

一、是什么 Docker网络是Docker容器之间和容器与外部网络之间的通信和连接的一种机制。在Docker中&#xff0c;每个容器都可以有自己的网络栈&#xff0c;包括网络接口、IP地址和网络配置。Docker网络提供了一种灵活且可定制的方式&#xff0c;使得容器之间可以相互通信&#x…

【单元测试】Junit 4(二)--eclipse配置Junit+Junit基础注解

目录 1.0 前言 1.1 配置Junit 4 1.1.1 安装包 1.1.2 创建Junit项目 1.2 Junit 4 注解 1.2.1 测试用例相关的注解 1.2.1.1 Before 1.2.1.2 After 1.2.1.3 BeforeClass 1.2.1.4 AfterClass 1.2.1.5 Test 1.2.1.6 Ignore 1.2.1.7 示例 1.2.2 打包测试Suite相关的注解…

JAVA工程打包

目录 一、工程代码和第三方依赖包分开 二、工程代码和第三方依赖包打入同一个jar包 1、工程的class文件和依赖的第三方jar包所包含的class文件打进同一个jar包中。部署时&#xff0c;直接部署该jar包即可。 2、如果是springboot工程&#xff0c;可以将工程的class文件和依赖…

iOS多语言解决方案全面指南

本文以及相关工具和代码旨在为已上线的iOS项目提供一种快速支持多语言的解决方案。由于文案显示是通过hook实现的&#xff0c;因此对App的性能有一定影响&#xff1b;除了特殊场景的文案显示需要手动支持外&#xff0c;其他任务均已实现自动化。 本文中的部分脚本代码基于 Chat…

OpenShift 4 - 可观测性之用 Network Observability Operator 对网络流量进行监控观测(视频)

《OpenShift / RHEL / DevSecOps 汇总目录》 说明&#xff1a;本文已经在支持 OpenShift 4.12 Loki Operator 5.7.2 Network observability 1.2.0 的环境中验证 文章目录 Network Observability 相关组件和架构安装 Network Observaility 功能安装 Operator配置对象存储配置 …

Scrapy的基本使用

目录 Scrapy是什么 安装 使用 获取更多页面信息 写入数据库 图片下载 文件下载 更改文件名称以及路径 更改图片名称以及路径 循环获取页面信息时&#xff0c;item的数据重复或者对不上 下载文件时获取文件流直接上传到某个地方 Scrapy是什么 Scrapy 是一个基于 Pyth…

园区自然人代开果真那么好?可以解决成本票缺失吗?

园区自然人代开果真那么好&#xff1f;可以解决成本票缺失吗&#xff1f; 《税筹顾问》专注于园区招商、企业税务筹划&#xff0c;合理合规助力企业节税&#xff01; 自然人代开也就是指个人跟公司发生业务往来的时候&#xff0c;公司要求个人开具发票&#xff0c;进行入账&am…

open-mmlab/mmocr 环境搭建、推理和训练入门教程【一】

文章目录 博文基础信息Linux 搭建 open-mmlab/mmocr 运行环境准备数据集准备必要的预训练模型推理训练测试可视化输出 &#x1f4d9; 预祝各位 前途似锦、可摘星辰 博文基础信息 https://mmocr.readthedocs.io/zh_CN/dev-1.x/get_started/quick_run.html显卡&#xff0c;11G 1…

【Pytorch】梯度裁剪——torch.nn.utils.clip_grad_norm_的原理及计算过程

文章目录 一、torch.nn.utils.clip_grad_norm_二、计算过程三、确定max_norm 众所周知&#xff0c;梯度裁剪是为了防止梯度爆炸。在训练FCOS算法时&#xff0c;因为训练过程出现了损失为NaN的情况&#xff0c;在github issue有很多都是这种训练过程出现loss为NaN&#xff0c;作…

RISCV Reader笔记_3 RISCV汇编

RISC-V 汇编语言 函数调用的步骤在计算机组成与设计中也有过涉及&#xff1a; 指定寄存器存入参数&#xff1b;跳转到函数开始位置&#xff08;jal&#xff09;&#xff1b;在callee中按需保存寄存器&#xff1b;执行函数&#xff1b;恢复保存的寄存器&#xff1b;把返回值存入…

使用传统图像处理算法+机器学习进行shadow detection

前言 阴影是图像中常见的现象&#xff0c;它们对于场景理解和分析非常重要。由于阴影区域通常比较暗淡&#xff0c;而且与周围物体区别较大&#xff0c;因此在图像处理和计算机视觉领域中&#xff0c;阴影检测是一个重要的研究方向。传统的阴影检测算法通常基于阈值或边缘检测…

深入理解 kernel panic 的流程

我们在项目开发过程中&#xff0c;很多时候会出现由于某种原因经常会导致手机系统死机重启的情况&#xff08;重启分Android重启跟kernel重启&#xff0c;而我们这里只讨论kernel重启也就是 kernel panic 的情况&#xff09;&#xff0c;死机重启基本算是影响最严重的系统问题了…

180_Power BI 新卡片图计算组与同环比应用

180_Power BI 新卡片图计算组与同环比应用 一、背景 在 2023 年 6 月&#xff0c;Power BI 更新了新的视觉对象&#xff1a;Card(new) 。 当前还需要在预览功能中将其打开。 我们在实际的应用中将新卡片图做了一些应用&#xff0c;先来看看具体效果。 Power BI 公共 web 效果…

安全区域内活动UWB标签,高精度UWB定位监测,室内厘米级测距应用

随着人们对于室内安全和定位需求的增加&#xff0c;相应的技术应运而生&#xff0c;超宽带&#xff08;UWB&#xff09;标签定位技术应用于室内定位领域&#xff0c;并获得了快速的发展和应用。 UWB技术是一种基于极窄脉冲的无线技术&#xff0c;它的主要特点是无载波&#xf…

软件测试技能,JMeter压力测试教程,setUp线程组批量登录(九)

前言 前面一篇已经实现了在 setUp 线程组实现单个用户先登录后提取token给其它线程组使用&#xff0c;在压测的时候&#xff0c;单个用户登录很显然不能满足我们的压测需求 我们在压测接口的时候&#xff0c;需批量获取多个用户登录后返回的token值&#xff0c;那么在setUp 线…