【Milvus的以图搜图】

news2025/1/18 7:04:18

0. 介绍

Milvus官方在bootcamp项目中给开发者提供多种解决方案,包含常见的以图搜图、人脸检索、DNA相似性检索、视频检索等等,具体可以参考bootcamp项目。

本文主要就bootcamp中以图搜图reverse_image_search的代码介绍如何运行该样例,进而了解如何打造自己的图像搜索engine。

 参考连接:

  • https://github.com/milvus-io/bootcamp/tree/master/solutions/reverse_image_search
  • https://fastapi.tiangolo.com/zh/
  • 搭建自己的Milvus以图搜图服务_在平凡生活中挣扎的博客-CSDN博客
  • 虹软人脸识别SDK接入Milvus实现海量人脸快速检索_Memory2414的博客-CSDN博客
  • 【pymysql的基本使用】_hello_dear_you的博客-CSDN博客
  • 【Milvus的安装和使用】_hello_dear_you的博客-CSDN博客

1. 启动Milvus和MySQL容器

在Milvus的系列文章,【Milvus的安装和使用】和【pymysql的基本使用】两篇文章介绍了如何安装Milvus、pymvilus的基本使用,以及如何通过pymysql库来操作MySQL。

在这一部分,主要是确认Milvus和MySQL容器处于启动状态下,以及两个容器的基本信息。首先,在milvus的docker-compose.yml文件的同级目录下,通过如下命令插入milvus容器的状态。

# 启动
docker-compose up -d

# 查看
docker-compose ps -a

# 停止
docker-compose down

 大致的过程如下图所示:

 然后确认MySQL容器的状态,具体过程如下图所示:

 此外,需要在MySQL中建立一个milvus的db来存放后续实验的数据内容。

2. 项目内容

本文此次以reverse_image_search的quick_deploy工程进行讲解,milvus中以图搜图的例子主要思路如下图所示。

 整个过程可以如下两个阶段:

  • 构建数据样本库阶段
  1. 准备用于构建样本库的图像数据;
  2. 使用目标分类网络ResNet50提取图像特征信息;
  3. 将每个图像的特征embedding信息插入到Milvus中,同时将Milvus对每个图像生成index和对应的图像名信息存储到MySQL数据库中;
  • 目标样本检索阶段
  1. 输入目标样本文件名;
  2. 目标样本经过目标分类网络提取特征得到对应embedding信息;
  3. 执行搜索;
  4. milvus返回与该样本相似的topK个图像名;

接下来,主要介绍一些需要用户配置的参数以及相关的一些改进。

2.1 特征提取网络修改

在该项目的server端的encode.py文件是图像特征提取的实现,通过towhee库调用resnet50网络提取图像特征,部分代码如下图所示:

 由于本人没有用过towhee库,所以基于pytorch重写了特征提取的过程,同时支持single图像和batch图像推理,在构建样本库使用batch推理可以极大节省时间。部分代码如下图所示。

 2.2 配置信息

以图搜图项目中,主要是milvus和MySQL容器的相关参数需要配置,具体如下图所示:

 首先分析一下miluvs的相关参数:

  • MILVUS_HOST和MILVUS_PORT:miluvs容器的IP地址和端口
  • VECTOR_DIMENSION:特征提取网络输出的维度,在pytorch中,resnet50的输出为1000维
  • DEFAULT_TABLE:默认存放特征embedding数据的collection名称

  • TOP_K:即检索时,输出前K个相似的图像名

然后,MySQL相关参数含义如下:

  • MYSQL_HOST和MYSQL_PORT:MySQL的IP地址和端口
  • MYSQL_USER和MYSQL_PWD:用户名和密码

  • MYSQL_DB:存放数据的database名称

3. 运行服务端

在配置好上述参数和确认milvus和MySQL容器处于启动状态之后,此时就可以来启动项目的服务端。以图搜图使用fastapi库来构建服务端,启动服务的命令如下:

uvicorn main:app --reload

对于fastapi库的内容本人不是特别熟悉,如果想要了解具体了解fastapi可以参考其官方文档。

运行上述命令,看到如下截图信息即可表示,服务启动成功。 

 如同所提示的一样,此时可以在浏览器中输入地址127.0.0.1:8000,可以看到如下页面内容。

 然后输入FastAPI - Swagger UIicon-default.png?t=M85Bhttp://127.0.0.1:8000/docs

 即可看到,该服务定义的一些接口,大致的含义,已经在图上描述出来。

 接下来对其中重要接口调用功能和使用方法进行介绍。

3.1 构建样本检索库

img/load条目的作用是输入collection名称和图像路径从而构建样本检索库,通过点击/img/load条目,然后点击try it out,输入相应的collection名称和图像路径,最后点击execute。然后图像路径下的图像会经过resnet50提取特征,得到embedding,最后插入到指定的collection中。具体过程如下图所示。

3.2 加载数据

/embedding/load条目的作用是将collection中的数据加载到memory中,输入collection名称即可。

3.3 执行检索

 /img/search条目的作用是执行目标样本的搜索,需要输入collection名称,选择目标样本的路径和topK的值。

 该操作会返回topK个相似的图像路径,如下图所示。

 

4. 运行客户端

milvus提供了一个以图搜图项目对应的客户端,通过如下命令拉取客户端的镜像。

docker pull milvusbootcamp/img-search-client:1.0

 然后,通过如下命令启动客户端容器。

#!/bin/bash

# Modify API_URL to the IP address and port of the server.
export API_URL='http://127.0.0.1:8000'
docker run -d -p 8001:80 \
-e API_URL=${API_URL} \
milvusbootcamp/img-search-client:1.0

 在浏览器中输入127.0.0.1:8001,进入到客户端,如下图所示:

到这里就完成milvus以图搜图实例如何运行的描述,替换图像样本库路径就能打造属于自己的以图搜图工具。在milvus的reverse_image_search中除了本文所说的使用目标分类网络来提取特征之外,还有一种以目标检测+分类的object_detection样例。同样也可以将特征提取网络替换为人脸识别模型,这样就可以打造属于自己的人脸搜索引擎✌。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/18697.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文献阅读-VSE++:使用困难负样本来改经视觉语义嵌入

Title:《VSE: Improving Visual-Semantic Embeddings with Hard Negatives》 Authors:Fartash FaghriDavid FleetJ. KirosS. FidlerJournal:ArXiv (2017)Date:2017 code:GitHub - fartashf/vsepp: PyTorch Code for t…

Java基础38 面向对象三大特征之多态

OOP之多态 多态1.多态的具体体现2.向上转型3.向下转型4.属性重写5.instanceOf6.动态绑定机制(核心)● Java的动态访问机制7.多态数组8.多态参数)多态 ● 多【多种】态【状态】 方法或对象具有多种形态。 是建立在封装和继承之上的面向对象的第三大特征…

一文带你学会Vue3基本语法

Vue3 起步1.通过 CDN 使用 Vue32.Vue3 模板语法文本Html属性表达式指令参数3.模板用户输入双向绑定1.通过 CDN 使用 Vue3 你可以借助 script 标签直接通过 CDN 来使用 Vue&#xff1a; <script src"https://unpkg.com/vuenext"></script>通过 CDN 使用…

在WPF中使用Prism弹出自定义窗体样式的对话框

概述 我们在Prism中弹出一个对话框&#xff0c;默认是一个Windows默认样式的窗口&#xff0c;这样会同自己所开发的项目完全不搭调&#xff0c;譬如下面这样子 那么如果为了配合软件主体的风格&#xff0c;可以做出类似这样效果 其实原理也很简单&#xff0c;Prism也考虑到了这…

不科学,RocketMQ生产者在一个应用服务竟然不能向多个NameServer发送消息

前言 目前有两套RocketMQ集群&#xff0c;集群A包含topic名称为cluster_A_topic&#xff0c;集群B包含topic名称为cluster_B_topic&#xff0c;在应用服务OrderApp上通过RocketMQ Client创建两个DefaultMQProducer实例发送消息给集群A和集群B&#xff0c;架构图如下&#xff1…

使用Vue脚手架配置代理服务器的两种方式

1 前言 本文主要介绍使用Vue脚手架配置代理服务器的两种方式 注意&#xff1a;Vue脚手架给我们提供了两种配置代理服务器的方式&#xff0c;各有千秋&#xff0c;使用的时候只能二选一&#xff0c;不能同时使用 2 代理 除了cros和jsonp&#xff0c;还有一种代理方式&#x…

传奇GM调整极品属性的命令------技术分享

传奇GM调整极品属性的命令 GM命令supermake命令用法&#xff01; 以下格式皆为supermake a b c   以上命令含义&#xff1a;调整A(装备)的B(属性)到C(点数) supermake 1 0 10  1代表武器  0代表攻击 10代表调整的点数 B参数代表需要调整的那项属性如攻击 魔法 道术 …

黑*头条_第4章_文章搜索前后端成形记 实名认证审核

黑*头条_第4章_文章搜索前后端成形记 & 实名认证审核 文章目录黑*头条_第4章_文章搜索前后端成形记 & 实名认证审核文章搜索前后端成形记 & admin实名认证审核1 文章详情-前端开发1.1登录接口1.1.1 基本定义1.1.2 code定义1.1.3 mapper实现1.1.4 service代码实现1.…

宝塔一键安装wordpress

使用宝塔面板来部署网站是非常方便的&#xff0c;以WordPress网站为例来说&#xff1a; 一般有两种方式安装WordPress网站&#xff0c;第一种是上传网站程序到网站根目录手动安装&#xff0c;另外一种是在宝塔面板后台左侧菜单&#xff0c;找到“WordPress一键部署”&#xff…

Map 和 Set

模型 一般我们把搜索的数据称为 关键字(key) , 关键字对应的值叫做 值(value) , 将之称为 key-value 键值对. 衍生出两种模型: 1. 纯 key 模型 例如 : 班级上点名, 在花名册上找人的名字. 2. key-value 模型 例如 : 统计一个字符串中每个字母出现的次数, 结果是每个字母和它对…

简易版 图书管理系统

目录 1. Book包 1.1 Book类 1.2 BookList类 2. User包 2.1 User抽象类 2.2 AdminUser类 2.3 NormalUser类 3. Operate包 3.1 MyOperate接口 3.2 AddOperation类 3.3 DelOperation类 3.4 ExitOperation 3.5 FindOperation类 3.6 ShowOperation类 3.7 BorrowedOpe…

MySQL——数据库、表的操作

文章目录数据库的操作创建数据库创建数据库例子字符集和校验规则查看数据库支持的字符集查看默认的字符校验规则校验规则对数据库的影响查看数据库显示详细的创建数据库语句修改数据库删除数据库查看连接情况表的操作创建表显示创建表的详细过程不同的数据库引擎查看表结构修改…

【C语言】操作符与优先级详解

C的操作符 文章目录C的操作符前言一、算术操作符二、移位操作符三、位操作符四、赋值操作符五、单目操作符六、条件操作符七、逻辑操作符八、条件操作符九、逗号表达式十、下标引用、函数调用和结构成员十一、表达式求值11.1 隐式类型转换12.2 算术转换12.2 操作符的属性总结前…

解决Vue前后端跨域问题的多种方式

1 前言 本文主要介绍借助解决Vue前后端跨域问题的几种方式 说到ajax请求&#xff0c;就不得不说下xhr(XMLHttpRequest)了&#xff0c;它可以说是鼻祖&#xff0c;但是实际开发中&#xff0c;我们不会直接使用它&#xff0c;而是进行二次封装或者使用成熟的第三方封装&#xf…

Zookeeper:分布式过程协同技术

Zookeeper 是一个高性能的分布式一致系统&#xff0c;在分布式系统中有着广泛的应用。基于它&#xff0c;可以实现诸如“分布式同步”、“配置管理”、“命名空间管理”等众多功能&#xff0c;是分布式系统中常见的基础系统。Zookeeper 主要用来解决分布式集群中应用系统的一致…

http,https,ip,tcp,udp

http:超文本传输协议&#xff0c;明文传输&#xff0c;不安全 超文本&#xff1a;早期&#xff0c;文本存在本地&#xff0c;文本可以被计算机解析为二进制的数据包&#xff0c;随着发展&#xff0c;出现图片&#xff0c;视频&#xff0c;链接等&#xff0c;成为超文本 传输&a…

批量生成Excel文件,可以按模板进行自动生成

目录 一、文件目录结构 二、编辑生成名单 三、编辑模板 四、生成操作 软件描述&#xff1a;根据Excel模板 和 生成名单 可以批量生成相同格式的文件&#xff0c;可以应用于考核、工资单等文件的批量生成。方便快捷&#xff0c;有需求的小伙伴可以到最下面点击下载 注&#…

mysql 客户端简单搭建

主要使用的是mysql开发包中的api接口 操作流程 1.初始化mysql操作句柄 MYSQL *mysql_init(MYSQL *mysql)&#xff1b; 对传人的句柄进行初始化 若传入的句柄为NULL&#xff0c;则内部会动态申请空间&#xff0c;进行初始化&#xff0c;并返回句柄首地址 返回值&#xff1a;若…

基于51单片机的ds18b20数字华氏温度计

资料编号&#xff1a;114 下面是相关功能视频演示&#xff1a; 114-基于51单片机的数字华氏温度计报警&#xff08;源码仿真全套资料&#xff09;功能讲解&#xff1a; 采用51单片机采集DS18B20的温度&#xff0c;LCD1602显示&#xff0c;并且可以设置上下限值&#xff0c;超…

Unity UI 框架

开源地址&#xff1a; GitHub - NRatel/NRFramework.UI: 基于 Unity UGUI 的 UI 开发框架基于 Unity UGUI 的 UI 开发框架. Contribute to NRatel/NRFramework.UI development by creating an account on GitHub.https://github.com/NRatel/NRFramework.UI 一、需求/功能要点…