Zilliz @ GAIDC |Milvus:生产级 AI 数据库探索

news2024/9/24 7:03:18

e22df23872c9a41e78d342bf7e13eb18.png

2月26日,全球人工智能开发者先锋大会— AI 数据与开源论坛在上海举行,Zilliz 主任工程师刘力在现场发表了名为《Milvus:生产级 AI 数据库探索》的演讲。

刘力开篇便提到,Milvus 致力于打造更为完善的 AI 生态体系。随后,刘力从向量数据库的功能、云原生向量数据库 Milvus 2.0、向量数据库的云原生实践以及 Milvus 的进一步规划这四个方面阐明了 Milvus 如何为 AI 赋能。

首先是向量数据库的功能。刘力提到,所有数据中,非结构化数据占比超过了 80%,但其利用率却十分有限。过去人们通过关系型存储检索数据,这种方式无法模糊匹配、无法跨模态检索、缺少对上下文的理解。

例如,用户想要搜索一张图片,关键词为红帽子、25 岁以上、下雨。最终可能搜出《小红帽》的插图。尤其是在数据量越来越大的情况下,结果往往不尽如人意。

在此情况下,训练学习数据的基本特征,利用深度学习模型提取 Embedding 用于数据检索的范式越来越常见。向量检索就是通过找到相似的非结构化数据来充分利用的有效方法。向量数据库是在向量的维度上对数据库进行支持。

4f63ae015e4bab9876a6bd894bc51097.png

其次,Milvus 2.0 是为向量而生的云原生数据库,具备流批一体、可插拔引擎、微服务化设计、云端一体的特性。升级后的 Milvus 不再止于向量检索,不仅加持丰富的数据库功能,同时还具备完善的生态及强大的性能。

“相比于 ElasticSearch,不论是索引构建还是查询,Milvus 在多个数据集都获得超过 10X 以上的性能优势。”刘力表示。

再者,在云原生实践方面,刘力强调“接口即服务”,意为 Milvus 2.0 支持多种部署方式,在云端和开源统一接口,意味着用户可以在不同的部署方式中实现无缝切换。同时,Milvus 2.0 支持和接口分离,避免后续版本迭代带来诸多问题以影响用户体验。此外,Milivus 2.0 还具备多云/混合云的优势。

提及 Milvus 的进一步规划,刘力表示,Milvus 的下一站是 Zilliz Cloud,能有效帮助用户解决在运维、部署、性能等方面的问题,真正做到“忘记复杂,关注业务和数据本身”。

目前,Zilliz Cloud 已经在美东及美西的 AWS 上线,今年晚些时候将在 GCP 上线。值得一提的是,届时 Zilliz Cloud 也会基于阿里云为国内用户提供开箱即用的向量数据库服务。

cbdc912732a802e8273926a0fcbcbf7d.png

在随后的圆桌讨论环节,刘力再度贡献了精彩发言:

问题 1:作为人工智能大国的中国,在世界上产生了怎样的影响?作为世界级的开源项目,Milvus 有哪些值得业界学习的经验?

刘力:学习谈不上,简单分享一些我们的经验和看法。

首先,从技术的角度来说,中国与世界领先水平的 AI 技术差距会越来越小。像今天其他演讲嘉宾提到的,国内公司能在短时间内追赶 ChatGPT 这样的大模型,甚至未来能够超越它,这就是一个很明显的信号。

其次, AI 基础设施赛道或许是一个值得探索的方向。以 Milvus 为例,我们其实是业界乃至全世界第一个提出“向量数据库”概念、且将其付诸实践的一群人。或许由于我们的先发优势或者对技术探索的重视,其他同业做出的产品与 Milvus 相比,仍有一定的差距。延续这个思路,在 AI基础设施这个方向发掘新技术点、寻找新机会,会是一个不错的选择。

问题 2:基于您所触及的领域,您所在企业未来的发展方向是怎样的?

刘力:首先我想从开源、闭源的角度来谈。这两者之间的关系是,从闭源上可以更好地实现商业化反哺公司发展;开源帮助我们更好地去建设生态、收集需求和确定方向,它们是相辅相成的。在美国,这条路已经跑得很通,很多公司既做开源又做闭源,且能够很好地维持自身运转,这也是我们今后发展的方向之一。

其次,之前嘉宾提到的一个观点我非常赞同——要用业界第一的方式来思考未来。坦白说,这很符合 Milvus 的现状。我们是“第一个吃螃蟹的人”,目前在向量数据库领域处于领先地位,如何面向新业态、选定新方向、做别人没做过的事情……这些都是 Milvus 现阶段需要忖度的问题。

再者,聚焦到具体的事情上,我们计划提高产品的易用性,包括支持 SQL、支持 GPU 、支持更强大的标量引擎。当然,推广云服务也是我们未来一年的主要发力点。

1fe5a9f43206fb0af161769bc35c027c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/376648.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

阿赵的MaxScript学习笔记分享五《UI组件使用篇》

大家好,我是阿赵。这个专题的内容比较多,所以抓紧时间更新。这是第五篇,UI组件使用篇。 这里主要是把maxscript的rollout窗体支持的UI组件列举一下,并每个组件写一个使用范例,以方便理解和查看。 1、位图bitmap 可以指…

Java中常用的七种队列你了解多少?

文章目录Java中常用的七种队列你了解多少?ArrayBlockingQueue队列如何使用?添加元素到队列获取队列中的元素遍历队列LinkedBlockingQueue队列如何使用?1. 创建SynchronousQueue对象2. 添加元素到队列3. 获取队列中的元素4. 遍历队列SynchronousQueue队列…

Unity Lighting -- Unity的光源简介

在主菜单栏中,点击Window -> Rendering -> Light Explorer打开光源管理器,这个标签页可以看到场景中所有的光源,包括每个光源的类型,形状,模式,颜色,强度,阴影等信息。 在主菜…

android unit test mock框架使用记录

写在前面 之前上班时,开发一个功能之后,还需要编写测试用例,使用的框架是mock。 为什么防止以后用到时忘了,在这里记录一下。 由于团队没有人使用Espresso进行unit test,所以本人对该框架并不熟悉。想了解该框架的使用…

WPF布局控件之DockPanel

DockPanel DockPanel&#xff0c;英文释义为停靠面板&#xff0c;那是怎么个停靠法呢&#xff1f;如下&#xff1a; <Window x:Class"LearnLayout.DockPanelWin"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http:/…

数字图像处理

文章目录图像复原上升阶跃边缘、下降阶跃边缘、脉冲状边缘和屋顶状边缘曲线及其一阶导数和二阶导数有哪些特征&#xff1f;Hough变换的基本思想是什么&#xff1f;基本概念图像增强灰度变换直方图&#xff1a;直方图特点matlab代码空间域滤波平滑空间滤波均值滤波器&#xff1a…

python如何实现多线程

今天本来打算学习学习多进程的&#xff0c;但是由于我现在的电脑没有Linux系统&#xff0c;无法通过Linux系统编辑一些多进程的程序&#xff0c;因此我打算从多线程入手。 多线程 我们的程序一般都是多任务的&#xff0c;如果你没有好好的利用好&#xff0c;运行时就会出现卡…

【读论文】TCL: an ANN-to-SNN Conversion with Trainable Clipping Layers

DAC 2021 背景 通过ANN2SNN的方法得到的SNN中&#xff0c;存在准确性和延迟之间的一种权衡关系&#xff0c;在较大的数据集&#xff08;如ImageNet&#xff09;上可能会有较高的延迟。 主要贡献 分析了转换后SNN精度与延迟之间存在权衡关系的原因&#xff0c;并指出了如何缓…

6587: 计算分段函数

描述本题目要求计算下列分段函数f(x)的值&#xff1a;输入输入在一行中给出实数x。输出在一行中按“f(x) result”的格式输出&#xff0c;其中x与result都保留两位小数。样例输入10样例输出f(10.00) 3.16提示C/C可在头文件中包含math.h&#xff0c;并调用sqrt函数求平方根&am…

JAVA入门教程||Java Scanner 类||Java 异常处理

Java Scanner 类 java.util.Scanner是Java5的新特征&#xff0c;我们可以通过 Scanner 类来获取用户的输入。 下面是创建 Scanner 对象的基本语法&#xff1a; Scanner s new Scanner(System.in); 接下来我们演示一个最简单的的数据输入&#xff0c;并通过 Scanner 类的 nex…

产品分析丨豆瓣APP

本文将从以下几个方面进行分析&#xff1a;1. 产品功能结构2. 竞品分析3. 用户分析4. 用户调研5. 功能分析与优化方案6. 总结01 产品功能结构产品架构由豆瓣的产品架构图可看出&#xff0c;豆瓣是兼具书影音的评分系统和兴趣社区&#xff0c;以广告、知识付费和电商业务作为商业…

图解LeetCode——剑指 Offer 52. 两个链表的第一个公共节点

一、题目 输入两个链表&#xff0c;找出它们的第一个公共节点。 二、示例 如下面的两个链表&#xff1a; 在节点 c1 开始相交。 注意&#xff1a; 如果两个链表没有交点&#xff0c;返回 null.在返回结果后&#xff0c;两个链表仍须保持原有的结构。可假定整个链表结构中没…

代码质量与安全 | ChatGPT能帮到你什么还有待探索,但人工智能真的可以帮你做自动化测试

当听到“人工智能”&#xff08;AI&#xff09;时&#xff0c;你会想到什么&#xff1f; 你可能会开始想象科幻电影中的先进的人形机器人或者未来科技&#xff0c;但是&#xff0c;人工智能聊天机器人程序Chat GPT的爆火已经证明&#xff0c;这种“未来主义”技术已经融入了我…

三个月自学自动化测试,薪资15K直接翻倍,鬼知道我经历了什么····

学习软件测试是迫不得已&#xff0c;幸好最后通过自己的付出&#xff0c;得到了满意的回报。希望大家能通过我的经历得到一些帮助和思路。 零基础自学遇到的第一个难题就是需要怎么学&#xff0c;刚开始一头雾水&#xff0c;只能先从网上买些书来看&#xff0c;但是收效甚微。…

Unity中获取地形的法线

序之前&#xff0c;生成了地形图&#xff1a;(42条消息) 从灰度图到地形图_averagePerson的博客-CSDN博客那末&#xff0c;地形的法线贴图怎么获取&#xff1f;大概分为两个部分吧&#xff0c;先拿到法线数据&#xff0c;再画到纹理中去。关于法线计算Unity - Scripting API: M…

第4讲 cameraserver.rc详解(下)

本讲是Android Camera Native Framework专题的第4讲&#xff0c;我们介绍cameraserver.rc详解&#xff08;下&#xff09;&#xff0c;包括如下内容&#xff1a;Android init语言简介cameraserver.rc详解serviceuser选项group选项ioprio选项task_profiles选项rlimit选项更多&am…

领域自适应 DA Domain Adaptation

领域自适应是与机器学习和转移学习相关的领域。 当我们的目标是从源数据分布中学习在不同&#xff08;但相关&#xff09;的目标数据分布上的良好性能模型时&#xff0c;就会出现这种情况。 例如&#xff0c;常见垃圾邮件过滤问题的任务之一在于使模型从一个用户&#xff08;源…

2023年金三银四必备软件测试常见面试题1500问!!!【测试思维篇】

五、测试思维5.1 打电话功能怎么去测&#xff1f;我们会从几个方面去测试&#xff1a;界面、功能、兼容性、易用性、安全、性能、异常。1&#xff09;界面我们会测试下是否跟界面原型图一致&#xff0c;考虑浏览器不同显示比例&#xff0c;屏幕分辨率。2&#xff09;功能&#…

SpringBoot:SpringBoot配置文件application.properties、application.yml 和 application.ymal(2)

SpringBoot配置文件1. 配置文件格式1.1 application.properties配置文件1.2 application.yml配置文件1.3 application.yaml配置文件1.4 三种配置文件优先级和区别2. yaml格式2.1 语法规则2.2 yaml书写2.2.1 字面量&#xff1a;单个的、不可拆分的值2.2.2 数组&#xff1a;一组按…

《分布式技术原理与算法解析》学习笔记Day24

分布式缓存 在计算机领域&#xff0c;缓存是一个非常重要的、用来提升性能的技术。 什么是分布式缓存&#xff1f; 缓存技术是指用一个更快的存储设备存储一些经常用到的数据&#xff0c;供用户快速访问。 分布式缓存是指在分布式环境或者系统下&#xff0c;把一些热门数据…