ModaHub魔搭社区:向量数据库Zilliz Cloud向量搜索和查询教程(一)

news2024/9/27 17:28:03

目录

概述

开始前

单向量搜索


本文介绍如何在 Zilliz Cloud 中执行近似最近邻(Approximate Nearest Neighbour,ANN)搜索和查询。搜索是指在 Collection 中查找与指定查询向量最接近的向量,查询是基于指定条件筛选出满足条件的数据。

概述

Zilliz Cloud 采用 ANN 算法来处理向量搜索请求,支持搜索并返回与指定查询向量最相似的前 K 个 Entity。为优化性能和吞吐,Zilliz Cloud 支持批量搜索,即同时指定多个查询向量并行搜索。您可以定义布尔表达式来缩小 ANN 搜索的范围。

开始前

执行 ANN 搜索或查询前,请确保已完成以下步骤:

  • 已连接到创建了 Collection 的目标集群。详情请参见连接集群和创建 Collection。
  • 已下载示例数据集并已将数据插入到 Collection 中。详情请参见示例数据集和插入 Entity。
  • 阅读本指南系列时,建议下载代码示例。

说明

本指南系列中创建的 Collection 包含 id 主键和 vector 向量字段。如果您希望完全自定义 Collection,请参见定制 Schema、开启动态 Schema 和 JSON。

单向量搜索

单向量搜索是指搜索并返回与指定的某个查询向量最相似的前 K 个Entity。

以下是单向量搜索的示例代码:

  • Python
  • NodeJS
with open("path/to/downloaded/medium_articles_2020_dpr.json") as f:
    data = json.load(f)

# 'client' 是 MilvusClient 实例。
res = client.search(
    collection_name="medium_articles_2020",
    data=[data["rows"][0]["title_vector"]],
    output_fields=["title"]
)

print(res)

# 输出:
# [
#     [
#         {
#             "id": 0,
#             "distance": -1.0,
#             "entity": {
#                 "title": "The Reported Mortality Rate of Coronavirus Is Not Important"
#             }
#         },
#         {
#             "id": 70,
#             "distance": -0.7525784969329834,
#             "entity": {
#                 "title": "How bad will the Coronavirus Outbreak get? \u2014 Predicting the outbreak figures"
#             }
#         },
#         {
#             "id": 160,
#             "distance": -0.7132074236869812,
#             "entity": {
#                 "title": "The Funeral Industry is a Killer"
#             }
#         },
#         {
#             "id": 111,
#             "distance": -0.6888885498046875,
#             "entity": {
#                 "title": "The role of AI in web-based ADA and WCAG compliance"
#             }
#         },
#         {
#             "id": 196,
#             "distance": -0.6882869601249695,
#             "entity": {
#                 "title": "The Question We Should Be Asking About the Cost of Youth Sports"
#             }
#         },
#         {
#             "id": 51,
#             "distance": -0.6719912886619568,
#             "entity": {
#                 "title": "What if Facebook had to pay you for the profit they are making?"
#             }
#         },
#         {
#             "id": 178,
#             "distance": -0.6699185371398926,
#             "entity": {
#                 "title": "Is The Environmental Damage Due To Cruise Ships Irreversible?"
#             }
#         },
#         {
#             "id": 47,
#             "distance": -0.6680259704589844,
#             "entity": {
#                 "title": "What Happens When the Google Cookie Crumbles?"
#             }
#         },
#         {
#             "id": 135,
#             "distance": -0.6597772836685181,
#             "entity": {
#                 "title": "How to Manage Risk as a Product Manager"
#             }
#         }
#     ]
# ]

您可以在搜索请求中引用搜索参数,并指定查询向量、向量字段名称、返回结果限制以及其他相关参数。以上代码搜索与指定查询向量最相近的 10 条 Entity,并返回各 Entity 的主键、距离等信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/731106.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文看懂ChatGPT与存算一体化

ChatGPT开启大模型“军备赛”,存储作为计算机重要组成部分明显受益: ChatGPT开启算力军备赛,大模型参数呈现指数规模,引爆海量算力需求,模型计算量增长速度远超人工智能硬件算力增长速度,同时也对数据传输速度提出了…

mysql练习---对表进行插入、更新与删除

环境: 第一题 (1) 创建表 create table pet( name varchar(20) not null comment 宠物名称, owner varchar(20) comment 宠物主人, species varchar(20) not null comment 种类, sex char not null comment 性别, birth year not null comment 出生日期, death …

HTML转EXE工具(23.7.7.0)使用说明

目录 一、注册账号和不注册有什么区别? 二、如何注册账号? 三、如何自定义about框? 四、如何选择打包网站还是Web项目? 五、如何设置程序基本信息? 六、什么是程序启动最大化和无标题? 七、程序生成…

Android之内存泄漏与内存溢出

Android之内存泄漏与内存溢出 概览 内存泄漏(memory leak):是指程序在申请内存后,无法释放已申请的内存空间,导致系统无法及时回收内存并且分配给其他进程使用。通常少次数的内存无法及时回收并不会到程序造成什么影响…

快讯|​2023 FOX Upfront 主打 Tubi

在每月一期的 Tubi 快讯中,你将全面及时地获取 Tubi 最新发展动态,欢迎关注【比图科技】,一起成长变强! 2023 FOX Upfront 主打 Tubi 2023 年 5 月 15 日,FOX 在纽约曼哈顿中心举行一年一度的 FOX Upfront&#xff0c…

行业追踪,2023-07-03,汽车零部件开始调整,继续跟踪等待参与第二波行情吧

自动复盘 2023-07-03 成交额超过 100 亿 排名靠前,macd柱由绿转红 成交量要大于均线 有必要给每个行业加一个上级的归类,这样更能体现主流方向 rps 有时候比较滞后,但不少是欲杨先抑, 应该持续跟踪,等 macd 反转时参与…

【通览一百个大模型】FLAN(Google)

【通览一百个大模型】FLAN(Google) 作者:王嘉宁,本文章内容为原创,仓库链接:https://github.com/wjn1996/LLMs-NLP-Algo 订阅专栏【大模型&NLP&算法】可获得博主多年积累的全部NLP、大模型和算法干…

pytorch学习指南---安装anaconda ,pytorch

pytorch 和tenserflow并驾齐驱,但是,pytorch更好理解。所以选择学习pytorch。 安装anaconda: https://blog.csdn.net/fan18317517352/article/details/123035625 教程:bilibili up主:一只小土堆 构建pytorch空间 py…

密码学学习笔记(九):Public-Key Encryption - 公钥加密2

Rivest-Shamir-Adleman (RSA) - 经典非对称加密算法 如果我们知道𝑝, 𝑞 (即𝑁 𝑝𝑞) 我们可以在mod N中进行反幂运算。 比如: 我们有一个单向陷门函数,非常适合加密。 “教科书式”…

【2023年成都七中NOIP联赛】游记

Day 1: 8:30: 睡懒觉,一觉睡到 8:30,“嘟嘟嘟”的电话声响起,迷迷糊糊睁开眼睛,快点,去成都七中…… 没错,我连今天要考试都不知道(其实昨天老师给我发了消息的&#…

算法 | 滑动窗口算法笔记

滑动窗口:核心思想 核心思想:维护一个窗口(又叫做子区间),通过调整窗口的起始位置(start)和终止位置(end),来寻找符合特定条件的子区间。 滑动窗口算法常常…

包管理器 | 浅谈几个常用的包管理工具

目录 🖥️ 前言 ◼️ npm ◼️ cnpm ◼️ yarn ◼️ pnpm ◼️ Bower 🖥️ 参考文献 🖥️ 参考资料 🖥️ 前言 如果你是前端开发者,或多或少都会接触到一些包管理工具,包管理工具是用于持续自动化…

17.OpenCV中的GFTTDetector类

文章目录 GFTTDetector功能OpenCV中GFTTDetector类reference 欢迎访问个人网络日志🌹🌹知行空间🌹🌹 这是使用imgproc.hpp中的goodFeaturesToTrack函数封装的类,其使用和goodFeaturesToTrack函数基本相似。 GFTTDetec…

wps如何加载mathtype和Endnote

为了支持国产化软件,弃用office套装,现在改用wps办公软件,但是写作科技论文的时候还是会出现很多的不方便,比如文献引用、公式排版编号等等。尽管wps自带了公式编辑器,然鹅这可太不方便了,因此把几个技巧总…

由于找不到libmmd.dll,无法继续执行代码有什么好的解决办法修复?

其实要解决由于找不到libmmd.dll,无法继续执行代码这个问题还是比较简单的,因为这类问题不外乎就是丢失了dll文件,我们只要下载安装回来就可以了,但有朋友还是会好奇,libmmd.dll到底是什么文件,那我们就来详细说说吧&a…

paddlenlp安装教程

一、安装cuda和cuDNN 1、安装paddlepaddle之前,要确保电脑已经安装了对应版本的cuda和cuDNN (1)安装CUDA 进入官网选择合适版本下载: 按照步骤安装完成即可。安装完成后进行验证,打开cmd命令窗口,输入nv…

Floyd算法学习笔记

Floyd算法学习笔记 前言 同步于 c n b l o g s cnblogs cnblogs 发布 如有错误,欢迎各位 dalao 批评指出。 前置芝士: 1.邻接矩阵(Floyd要用邻接矩阵存图) 2.动态规划思想(最好学过,没学过也没有太大影响&#…

无线视频传输方案|远距离无人机图传应用,+28dBm大功率wifi图传模块

针对无人机远程图片、视频传输需求,市面上就有无线模块研发厂家推出了基于大功率图传WiFi模块SKW77的无人机远程视频传输解决方案。在无人机和地面的中继器内加入串口WiFi模块,手机通过与无人机和地面的中继器内置的串口WiFi模块给无人机传递控制信号&am…

深度理解 JAVA 动态代理

本文篇幅比较长,在确定您是否需要仔细阅读本文前,可以先思考一下下面几个问题: 动态代理是什么?如何实现动态代理?所有类都能实现动态代理吗?非目标方法是否会被代理?为什么 JDK 实现动态代理必…

平安养老险广东分公司积极开展“7·8全国保险公众宣传日”系列活动

2023年是全面贯彻落实党的二十大精神的开局之年,是实施“十四五”规划承上启下的关键之年。在国家金融监督管理总局指导、中国保险行业协会组织下,平安养老保险股份有限公司广东分公司(以下简称“平安养老险广东分公司”)以“78全…