Milvus 介绍

news2025/1/4 19:33:30

Milvus 特点

  • 在万亿矢量数据集上实现惊人的搜索速度:在万亿矢量数据集上,矢量搜索和检索的平均延迟可达毫秒级。
  • 简化的非结构化数据管理: Milvus 拥有专为数据科学工作流程设计的丰富 API。
  • 可靠、始终在线的矢量数据库: Milvus 内置的复制和故障转移/故障恢复功能可确保数据和应用程序始终保持业务连续性。
  • 高度可扩展和弹性: 组件级可扩展性使按需扩减成为可能。
  • 混合搜索: 除了向量之外,Milvus 还支持布尔、字符串、整数、浮点数等数据类型。标量和向量可以混合过滤。
  • 统一的 Lambda 结构: Milvus 将流式处理和批式处理相结合进行数据存储,平衡时效性和效率。
  • 时间旅行: Milvus 维护所有数据插入和删除操作的时间线。它允许用户在搜索中指定时间戳以检索指定时间点的数据视图。
  • 社区支持和行业认可:拥有超过 1,000 名企业用户、 GitHub 上超过 10,500 颗星以及活跃的开源社区,以及商业公司支持。

Milvus 架构

Milvus 独立版

Milvus 独立版包含三个组件:

  • Milvus: 核心功能组件。
  • etcd: 元数据引擎,访问并存储 Milvus 内部组件的元数据,包括 proxy、indexnode 等。
  • MinIO: 存储引擎,负责 Milvus 的数据持久化。

在这里插入图片描述

Milvus 集群版

Milvus 集群版包含 8 个微服务组件和 3 个第三方依赖项。所有微服务都可以部署在 Kubernetes 上,彼此独立。

微服务组件

  • Root coord: 负责处理数据定义语言(DDL)和数据控制语言(DCL)请求,管理 TSO(timestamp Oracle),并发布时间刻度消息。
  • Proxy: 代理是用户访问 Milvus 的入口,负责不同请求的转发。
  • Query coord: 负责管理查询节点的拓扑结构和负载均衡,以及从 growing segment 到 sealed segment 的转换操作。
  • Query node: 负责对增量数据和历史数据执行向量和标量数据的混合搜索。
  • Index coord: 负责管理索引节点的拓扑结构,并维护索引元数据。
  • Index node: 负责为向量构建索引。
  • Data coord: 负责管理数据节点的拓扑结构,维护元数据,触发 flush、compact 等后台数据操作。
  • Data node: 数据节点通过订阅日志代理来获取增量日志数据,处理 mutation 请求,并将日志数据打包成日志快照存储在对象存储中。

第三方依赖项

  • etcd: 存储集群中各个组件的元数据。
  • MinIO: 负责集群中大文件的数据持久化,比如索引、二进制日志文件。
  • Pulsar: 管理近期变异操作的日志,输出流式日志,并提供日志发布订阅服务。

在这里插入图片描述

集群版分层详细架构

Milvus 采用共享存储架构,存储和计算分离,计算节点可水平扩展。Milvus 遵循数据平面和控制平面分离的原则,包括四层:接入层、协调服务层、计算层和存储层。

在这里插入图片描述

接入层

访问层是整个系统的入口,将客户端连接的端点暴露给用户。它负责处理客户端连接、进行静态验证、对用户请求的基本动态检查、转发请求以及收集结果并将结果返回给客户端。代理本身是无状态的,可以借助负载均衡组件(Nginx、Kubernetes的Ingress、NodePort、LVS)向外界提供统一的访问地址和服务。

协调服务层

协调服务是系统的大脑,负责集群拓扑节点管理、负载均衡、时间戳生成、数据声明和数据管理。

计算层

包含所有的 QueryNode 和 DataNode,执行协调器服务发出的指令和代理启动的数据操作语言 (DML) 命令。Milvus 中的工作节点类似于 Hadoop 中的数据节点。

存储层

存储层是 Milvus 的基石,负责数据持久化。存储层分为三部分:

  • Meta store: 负责存储元数据的快照,如集合 schema、节点状态、消息消费检查点等。Milvus 依赖 etcd 来实现这些功能,Etcd 还承担服务注册和健康检查的责任。
  • 日志代理: 支持播放的 pub/sub 系统,负责流数据持久化、可靠的异步查询执行、事件通知和返回查询结果。当节点进行停机恢复时,日志代理通过回放机制来保证增量数据的完整性。Milvus 集群使用 Pulsar 作为日志代理,独立模式使用 RocksDB。Kafka、Pravega 等流存储服务也可以用作日志代理。
  • 对象存储: 存储日志的快照文件、标量/向量索引文件以及中间查询处理结果。Milvus 支持 AWS S3 和 Azure Blob,以及轻量级开源对象存储服务 MinIO。

数据模型

在 Milvus 中,所有数据都是按照集合(collection)、分片(shard)、分区(partition)、段(segment)和实体(entity)来组织的。

在这里插入图片描述

集合(collection)

Milvus 中的集合可以比作关系存储系统中的表。集合是 Milvus 中最大的数据单元。

分片(shard)

为了在写入数据时充分利用集群的并行计算能力,Milvus 中的集合必须将数据写入操作分散到不同的节点。默认情况下,单个集合包含两个分片。根据您的数据集量,您可以在集合中拥有更多分片。Milvus 默认使用哈希方法进行分片。

分区(partition)

一个分片中也有多个分区。Milvus 中的分区是指集合中标记有相同标签的一组数据。常见的分区方式包括按日期、性别、用户年龄等分区。创建分区可以有利于查询过程,因为可以通过分区标签过滤大量数据。

相比之下,分片更多的是在写入数据时的扩展能力,而分区更多的是在读取数据时增强系统性能。

段(segment)

在这里插入图片描述

每个分区内都有多个小段。段是 Milvus 中系统调度的最小单位。有两种类型的段:增长段(GrowingSegment)和密封段(SealedSegment)。增长段由查询节点订阅,Milvus 用户不断将数据写入增长段中。当增长段的大小达到上限(默认为512 MB)时,系统将不允许向该增长段写入额外的数据,从而密封该段。索引建立在密封段上。

为了实时访问数据,系统会读取增长段和密封段中的数据。

实体

每个段都包含大量的实体。Milvus 中的实体相当于传统数据库中的一行。每个实体都有一个唯一的主键字段,该字段也可以自动生成。实体还必须包含时间戳(ts)和向量场——这是 Milvus 的核心。

Milvus 架构中的 Knowhere

狭义上,Knowhere 是一个操作接口,用于访问系统上层的服务和系统下层的 Faiss、Hnswlib、Annoy 等向量相似搜索库。此外,Knowhere 还负责异构计算。更具体地说,Knowhere 控制在哪个硬件(例如 CPU 或 GPU)上执行索引构建和搜索请求。这就是 Knowhere 名字的由来——知道在哪里执行操作。未来版本将支持更多类型的硬件,包括 DPU 和 TPU。

广义上,Knowhere 还整合了其他第三方索引库,例如 Faiss。因此,从整体上看,Knowhere 被公认为 Milvus 向量数据库中的核心向量计算引擎。

从 Milvus 2.0.1 开始,Knowhere 已独立于 Milvus 项目。

在这里插入图片描述

Knowhere 优点

Knowhere 不仅进一步扩展了 Faiss 的功能,还优化了性能。更具体地说,Knowwhere具有以下优点。

支持 BitsetView

最初,Milvus 中引入 bitset 的目的是为了软删除。软删除的向量仍然存在于数据库中,但在向量相似性搜索或查询期间不会被计算。位集中的每个位对应于一个索引向量。如果一个向量在位集中被标记为 1,则意味着该向量被软删除,并且在向量搜索期间不会涉及该向量。目前,Bitset 参数被添加到 Knowhere 中所有公开的 Faiss 索引查询 API 中,包括 CPU 和 GPU 索引。

支持更多相似度指标来索引二进制向量

除了 Hamming 之外,Knowhere还支持 Jaccard、Tanimoto、Superstruct、Substruct。Jaccard 和Tanimoto 可用于衡量两个样本集之间的相似性,而 Superstruct 和 Substruct 可用于衡量化学结构的相似性。

支持 AVX512 指令集

Faiss本身支持多种指令集包括 AArch64、SSE4.2、AVX2。Knowhere 通过添加 AVX512 进一步扩展了支持的指令集,与 AVX2 相比,可以将索引构建和查询的性能提高 20% 至 30% 。

自动 SIMD 指令选择

Knowhere 旨在在具有不同 SIMD 指令(例如 SIMD SSE、AVX、AVX2 和 AVX512)的各种 CPU 处理器(本地和云平台)上良好运行。因此,挑战在于,给定一个软件二进制文件(即 Milvus),如何使其在任何 CPU 处理器上自动调用合适的 SIMD 指令。Faiss 不支持自动 SIMD 指令选择,用户需要在编译期间手动指定SIMD 标志(例如 -msse4)。然而,Knowhere 是通过重构 Faiss 的代码库构建的。依赖 SIMD 加速的常见功能(例如相似性计算)被排除在外。然后,对于每个功能,实现四个版本(即SSE、AVX、AVX2、AVX512),并将每个版本放入单独的源文件中。然后使用相应的 SIMD 标志进一步单独编译源文件。因此,在运行时,Knowhere 可以根据当前 CPU 标志自动选择最适合的 SIMD 指令,然后使用挂钩链接正确的函数指针。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/716485.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MA35D1测试-记录

1.查看拨码开关的启动设定 找到开发板:拨码快关,复位按键、电源开关的位置! 2.三根线和软件(一根5V/2A电源适配线、两根usb线) 三根线:一根5V/2A电源适配线、两根usb线 电源线插上,确保可以波…

kafka入门,节点服役和退役(新增节点和删除节点)(十二)

1、节点服役 1、克隆准备其中一台节点 2、如果新节点的kafka有被log和datas文件夹要删除 3、修改/etc/hosts 配置新节点映射 1.1 执行负载均衡操作 vim topics-to-move.json{"topic": "主题名称"} {"topics": [{"topic": "fi…

提高学习效率:必备学习软件推荐

在当今数字化的学习环境中,选择适合自己的学习软件是提高效率和获取知识的关键。 分享一:伙伴云 伙伴云是一款强大的数据协作工具,它利用仪表盘进行数据分析,并实现了月度报表的自动汇总功能。 伙伴云的仪表盘集合了大数据分析…

Leetcode 445. 两数相加 II

原题链接:Leetcode445. Add Two Numbers II You are given two non-empty linked lists representing two non-negative integers. The most significant digit comes first and each of their nodes contains a single digit. Add the two numbers and return the…

代码冗余太多?给新人Code Review头都大了?

一、前言 开发过程中,只是觉得前端后端合起来,有很多冗余信息,被代码一遍遍重复表达,是一件很枯燥、无聊的事情。这些枯燥的重复工作,完全可以由机器来做,以便解放出我们的时间,来做更有价值的工…

vue实现复制文本

方法一: 原理:浏览器本身提供了一个copy命令,利用它可以复制选中的内容:如果是输入框,我们可以利用select()方法来选中输入框中的内容,然后调用copy命令,将文本复制到剪切板,但是se…

菱形继承及菱形虚拟继承

复杂的菱形继及菱形虚拟继承 单继承:一个子类只有一个直接父类时称这个继承关系为单继承 多继承:一个子类有两个或以上直接父类时称这个继承关系为多继承 菱形继承是多继承的一种特殊状态 菱形继承的问题:从下面的对象成员模型构造&#xff…

【Linux】指令与权限

Yan-英杰的主页 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 目录 一、Xshell配置 会话配置 日志 二、指令 date指令 cal指令 find指令(极其重要) -name grep指令…

【python pip 安装错误 ModuleNotFoundError: No module named pip._internal 解决办法】

🚀 零基础入门学习Python🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜…

【OpenGL】读取视频并渲染

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍读取视频并渲染。 学其所用,用其所学。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下,下次更新不迷路&#…

数据中心动环监控系统分析与应用

摘要:介绍了数据中心动环监控系统,并结合原理图详细分析。本系统主要对数据中心的电源设备和环境参数 进行监控,如 UPS、蓄电池、配电柜、温湿度、漏水监测等,将实现多机房、微模块远程联网集中监管, 从而为提高数据中…

Redis 三种模式-------主从复制、哨兵及集群

目录 一、主从复制1.1 主从复制的概念1.2 主从复制的作用1.3 redis 主从复制流程1.4 搭建Redis 主从复制1、 环境准备2、 安装Redis3、 修改redis配置文件(master节点配置)4、 修改redis配置文件(slave节点操作)5、 验证主从效果 …

7.1.3 Linux的EXT2文件系统(inode)

inode 的内容在记录文件的权限与相关属性,至于 block 区块则是在记录文件的实际内容。 而且文件系统一开始就将 inode 与 block 规划好了,除非重新格式化(或者利用 resize2fs 等指令变更文件系统大小),否则 inode 与 b…

JAVA开发(JAVA视频监控接口相关)

一、背景 最近在做视频监控接口相关的开发,需要调用视频的接口获取直播地址,回放地址,然后集成到web里查看。 二、涉及的接口 1、获取卡口的id 2、通过卡口id获取通道(设备的id) 3、通过设备的id获取到直播地址 4…

阿拉德之怒手游架设教程

阿拉德之怒是一款大型多人在线角色扮演游戏(MMORPG),在全球范围内拥有庞大的玩家群体。该游戏以其精美的画面、丰富多样的职业和任务系统而闻名,让玩家可以沉浸在一个充满冒险和挑战的奇幻世界中。对许多玩家而言,阿拉…

vue有意思的图片动画插件direction-reveal

功能:操作简单好上头,动画特效很丝滑,有很多种供选择 1.下载插件 npm install direction-reveal --save-dev 2.使用 导入到需要使用动画的单页面 import DirectionReveal from direction-reveal; 使用样式 mounted() {this.query();},m…

【深度学习笔记】浅层神经网络

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记,视频由网易云课堂与 deeplearning.ai 联合出品,主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习,视频的链接如下: https://m…

GoLand live template自定义模板失效问题解决

目录 问题背景原因分析问题解决 问题背景 我希望在goland自定义一个注解模板,输入/**Enter可以补全如下图所示 /** * description TODO * param null * return * author user * date 2023/7/4 15:24*/ func main() {print("hello world\n") }于是我在Fi…

Vue指令案例

案例需求&#xff1a; 将Vue数据模型中的数据以表格的形式渲染展示 具体代码如下&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-wid…

1、CCeisum简介

CCesium是c版本的cesium桌面端程序&#xff0c;底层基于opengl实现的c框架&#xff0c;本质上依赖于opengl的api进行渲染。与web端cesium基本一致&#xff0c;只需简单的几行代码即可实现桌面端的三维地图&#xff0c;通过api接口实现三维地图的基本功能&#xff0c;初始化地图…