扩博智能× Milvus:图像检索助力零售商品图像高效标注

news2024/9/24 15:20:14

00ef89a6def0550fd85f593510cc688b.pngee337faeee7eadfc796f11879a61a976.png

大家好,我是上海扩博智能技术有限公司的Frank,负责算法工程相关的工作。很高兴能在 Milvus 社区和大家分享我们在图像检索方面的经验。

01

扩博智能公司简介

扩博智能 Clobotics 成立于 2016 年,总部位于上海长宁。我们聚焦计算机视觉和机器学习技术,专注为行业和企业用户提供端到端一体化智能服务。公司在丹麦、新加坡、巴西、美国分别设有海外销售分公司。

自成立以来,扩博智能申请及获得 300 逾项知识产权,为打造面向零售和风电行业的人工智能产品奠定了深厚的技术基础。凭借自身对技术的专注和探索,吸引了全球众多优秀人才的加入,为全球众多一线头部客户提供更高的创新能力及更安全的技术服务。

在零售业务中,我们的愿景是升级实体零售数字化营销体验,提供高效的、准确的、全面的市场数据收集和分析服务,我们提供端到端的零售智能化解决方法,集零售执行、货架和冰柜情报和竞品追踪于一体。

2bd20c24e0bc494820116e6f42471bba.png

02

零售业务及图像检索需求

在零售业务中,我们需要对海量的商品图片进行识别,为了训练识别模型,我们需要在产线数据中挖掘有价值的数据,并进行标注,然后迭代模型。传统的标注方式需要人工去做大量的筛选,效率低下,耗费大量的人力和时间。为了提高标注效率,我们引入了图像检索技术。

我们首先对产线数据进行质量检查,过滤掉不合格的图片,然后对合格的图片进行向量提取,并添加到产线向量数据库。在标注阶段,以待标注的 SKU 的注册图片为query,去产线向量数据库中搜索,找到可能的图片,然后进行人工确认和标注。

f7876155815a54f4b372fef9869308e0.png

03

选择 Milvus 的原因

在众多的图像检索工具中,我们选择了 Milvus,主要有以下几个原因:

高效的向量检索能力:Milvus 能够快速处理大规模的图像数据,满足我们零售业务中对海量商品图片的检索需求。

丰富的功能特性:支持多种索引算法,可根据不同的业务场景进行选择。同时,分布式架构也能够应对高并发的查询请求。

活跃的开源社区:Milvus 拥有活跃的开源社区,不断更新和完善功能。在使用过程中,我们遇到问题可以及时在社区中得到解答和支持。

04

使用 Milvus 的过程

安装和配置:按照官方文档进行安装和配置,确保环境搭建正确。根据我们的业务需求,调整了一些参数,如向量维度、索引算法等。

图像特征提取:我们采用了基于深度学习的特征提取方法,将提取的图像特征转换为 Milvus 支持的向量格式。

数据导入:使用 Milvus 的Python SDK,将产线数据库中的图片特征导入到 Milvus 向量数据库中。为了提高导入效率,我们采用了分布式导入方式,分批次导入数据。

图像检索:以待标注的 SKU 图片为query,在 Milvus向量数据库中进行检索。设置合适的相似度阈值和返回结果数量,确保检索结果的准确性和实用性。

05

使用 Milvus 进行图像检索的经验

索引和度量选择:Milvus 支持多种索引和度量算法,不同的算法适用于不同的场景。在选择时,需要考虑数据规模、查询类型和性能要求等因素。我们目前大约有1000多万条向量数据,使用的是IVF_FLAT索引,L2度量方法。

相似度阈值的设置:相似度阈值的设置需要根据具体的业务需求来确定。过高的阈值可能会导致检索结果过少,而过低的阈值可能会导致检索结果过多,增加人工筛选的工作量。我们的经验是,在实际场景中抽取一定数据,使用不同的阈值来进行评估,得到最佳阈值,然后将阈值应用到实际场景中,在我们的场景,对精度的要求高于召回要求,因此最终选择了0.75作为相似度阈值。

06

取得的效果

通过使用 Milvus,我们在零售业务中取得了显著的效果:

提高了标注效率:图像检索技术大大减少了人工筛选图片的时间,提高了标注效率,而且可以根据不同的相似度阈值,来针对性的检索,增加了数据的多样性。

提升了标注质量:通过检索到的相似图片,标注人员可以更好地理解商品的特征,提高标注的准确性和一致性。

加速了模型迭代训练:高效的标注流程为模型的迭代训练提供了更多的数据支持,加快了模型的优化速度。

总之,Milvus 为我们的零售业务带来了巨大的价值。我们也将继续探索和优化图像检索技术,为客户提供更好的服务。希望我们的经验分享能对大家有所帮助。

谢谢!

作者介绍

3ff7db5171312f8d10f020a1dc1e7faf.png

推荐阅读

59dd3fa1d12ee62bb1c6b0bcbabc5a2b.png

9e3bba1c6cc51c1abf01ea93ddc52beb.png

8c31c7f435ee23cd3eabd60740a80ca9.png

44b7330055b4c5c120bc65ae0c34549b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2084314.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SOMEIP_ETS_071: Union_Length_too_long

测试目的: 验证当设备(DUT)接收到一个联合(union)长度超出实际联合长度的SOME/IP消息时,是否能够返回错误消息。 描述 本测试用例旨在检查DUT在处理一个echoUNION方法的SOME/IP消息时,如果消…

基于DashScope+Streamlit构建你的机器学习助手(入门级)

前言 在LLM(大语言模型)盛行的今天,博主越来越感觉到AI(人工智能)的潜力被“无限”激发了。它为什么会突然间完成“鱼跃龙门”呢? 博主认为基础设施(也可以称为算力)的完善和“天才…

Java-异常处理try catch finally throw和throws

在 Java 中,异常处理机制是通过 try, catch, finally, throw和 throws 这几个关键字来实现的。以下 是这些关键字的基本用途和它们之间的区别: public class ExceptionHandlingExample {public static void main(String[] args) {try {processSomething();} catch (Exceptio…

【视频讲解】SMOTEBoost、RBBoost和RUSBoost不平衡数据集的集成分类酵母数据集、治癌候选药物|数据分享...

全文链接:https://tecdat.cn/?p37502 分析师:Zilin Wu 在当今的大数据时代,科研和实际应用中常常面临着海量数据的处理挑战。在本项目中,我们拥有上万条数据,这既是宝贵的资源,也带来了诸多难题。一方面&a…

RFFT:数据与代码已开源,京东推出广告图生成新方法 | ECCV 2024

论文将多模态可靠反馈网络(RFNet)结合到一个循环生成图片过程中,可以增加可用的广告图片数量。为了进一步提高生产效率,利用RFNet反馈进行创新的一致条件正则化,对扩散模型进行微调(RFFT)&#…

行业机遇!程序员:如何选择适合自己的就业方向?

随着科技的不断进步和发展,程序员的就业前景也越来越广阔。而在这个快速发展的行业中, 在各个领域都有着广泛的应用,信息技术的迅猛发展使得程序员在现代社会中占据了举足轻重的地位。从软件开发到网络安全,再到人工智能&#xf…

超越Text2Video-Zero|无需额外训练,条件生成、专门生成和指令引导的视频编辑全搞定!

论文链接:https://arxiv.org/pdf/2407.21475 github链接: https://densechen.github.io/zss/ 亮点直击 本文提出了一种新颖的zero-shot视频采样算法,该算法能够直接从预训练的图像扩散模型中采样高质量的视频片段。 本文提出了一个依赖噪声模…

青岛实训day33(8/21)

1、配置一主二从mysql 1. mycat对mysql8不完全支持 2. mysql8主从问题不大get_pub_key1 3. gtids事务复制 4. 删除/etc/my.cnf 5. 同步data文件需要先停用mysql服务,删除data目录中的auto.cnf 6. gtid模式以及经典模式都需要锁表 flush tables with read lock;unlock tables;…

解决渠道低价问题可以这样做

在品牌渠道的发展之路上,经销商低价、乱价、窜货以及非经销商的不受管控往往会引发渠道混乱,这已然成为众多品牌难以回避的难题。那么,面对这些各异的渠道问题,究竟该如何施展出不同的治理妙招呢?难道仅有单一的处罚手…

priority_queue模拟

一、什么是priority_queue? priority_queue是C标准库中的一个容器适配器,用于实现优先队列(priority queue)的数据结构。优先队列是一种特殊的队列,其中的元素按照一定的优先级进行排序,每次取出的元素都是优先级最高…

OpenAI融资谈判 估值或超1000亿美元

🦉 AI新闻 🚀 OpenAI融资谈判 估值或超1000亿美元 摘要:OpenAI正在进行一轮融资谈判,预计估值将超过1000亿美元,主导投资方为Thrive Capital,将投资10亿美元。今年早些时候,OpenAI估值已超过8…

vue按钮弹框

在Vue中实现按钮点击后弹出对话框(弹框)的功能,通常可以使用一些Vue的UI组件库,如Element UI、Vuetify、BootstrapVue等,这些库提供了丰富的组件,包括对话框(Dialog)、模态框&#x…

一般中小型企业网站用哪种类型的SSL证书?

对于一般中小型企业网站,常用的SSL证书类型主要包括域名验证型SSL证书(DV SSL证书)和组织验证型SSL证书(OV SSL证书)。 域名验证型SSL证书(DV SSL证书) 特点: 验证简单&#xff1…

android 将新建的底部导航的demo,修改首页默认显示的字符串为helloworld。

1、先上个图,demo建好了以后,默认显示一个字符串: 2、这个demo的结构: activity_main.xml中用navGraph与其关联。 3、增加方法,给text赋值: package com.example.helloworld.ui.homeimport androidx.lifec…

三级_网络技术_53_应用题

一、 请根据下图所示网络结构回答下列问题。 1.设备1应选用__________网络设备。 2.若对整个网络实施保护,防火墙应加在图中位置1~3的__________位置上。 3.如果采用了入侵检测设备对进出网络的流量进行检测,并且探测器是在交换机1上通过端口镜像方式…

Launcher3 长按Hotseat图标,显示删除角标(红底白杠杠用于删除图标或者显示应用未读消息数量)

基于Android 13,Launcher3实现需求: 1. 长按Hotseat的图标显示红色删除角标 2. 点击角标,删除图标并保存到Database 3.点击其他地方,取消编辑hotseat图标模式 实现效果: 实现原理: 图标是由BubbleTextView来是实现…

剑侠情缘c#版(游戏源码+资源+工具+程序),百度云盘下载,大小1.68G

剑侠情缘c#版(游戏源码资源工具程序),c#开发的,喜欢研究游戏的可以下载看看。亲测可进游戏。 剑侠情缘c#版(游戏源码资源工具程序)下载地址: 通过网盘分享的文件:【游戏】剑侠情缘c#…

jmeter如何把一个请求的响应中部分字段提取出来便于下个请求用

jmeter如何把一个请求的响应中部分字段提取出来便于下个请求用,可以通过json提取器提取,如果提取多个,就设置多个json提取。 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/dd5afb1fca3f4e31b636e17e11e8dfc3.png

2.10鼠标事件

目录 实验原理 实验代码 运行结果 文章参考 实验原理 在 OpenCV 中存在鼠标的操作,比如左键单击、双击等。对于 OpenCV 来讲,用户的鼠标操作被认为发生了一个鼠标事件,需要对这个鼠标事件进行处理,这就是事件的响应。下面我们…

手机ip频繁跳动的原因是什么?手机ip地址老是变怎么解决

在当今数字化时代,‌手机已成为我们生活中不可或缺的一部分。‌然而,‌有些用户可能会遇到手机IP地址频繁变动的问题,‌这不仅可能影响网络连接的稳定性,‌还可能对特定的在线活动造成困扰。‌本文将深入探讨手机IP频繁跳动的原因…