给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品下周上线

news2024/9/22 15:45:03

一个在GitHub上标星超2万的数据库,究竟是什么来头?

原来,这正是最近大火的向量数据库之一、首个在这一赛道开源产品Milvus。

自大模型爆火以来,它的关注度也一路飙升,官方显示,目前Milvus已经拥有超过1000+企业用户。

alt

而就是这么一个GitHub上最流行的向量数据库,背后公司Zilliz已经完成了1.13亿美元融资。

Zilliz专注于研发面向AI应用的向量数据库系统,旗下有Milvus、Zilliz Cloud等产品,目的是为开发者提供易用性强、性价比高的向量数据库服务。

这两天,Zilliz Cloud发布2.0重磅更新,更是带起一波业界对向量数据库的讨论热潮。

大模型技术进展日新月异,向量数据在风口浪尖上也起起伏伏,不少人说它是给AI提供长期记忆的必备基建,也有人认为提高大模型上下文长度才是未来方向。

这不,还有谷歌工程师专门为此摆摊舌战群儒。

alt

众说纷纭之下,情况究竟如何?不如来听听向量数据库一线从业者怎么说。

我们联系到了Zilliz创始人兼CEO星爵,希望和他聊一聊向量数据库对于这一轮AI浪潮的意义,以及它背后变革的方式。

星爵认为,大模型的出现给AI带来了新的计算范式CVP Stack,向量数据库是不可或缺的关键:

其中,“C”代表大模型(ChatGPT)负责向量计算;“V”代表向量数据库(vector database),负责向量存储;“P”代表Prompt工程,负责向量交互。

alt

不仅如此,他还系统解答了在大模型发展过程中,向量数据库具体起到的作用,以及作为向量数据库头部公司的Zilliz,又要如何应对这一轮AI变革浪潮。

在不更改原意的基础上,量子位对与星爵的交流内容进行了整理,希望能为大家带来一些思考与启发。

大模型的数据基础设施

提问:最近向量数据库很火,能不能先简单科普一下?

星爵:向量数据库是一种为了高效存储和索引AI模型产生的向量嵌入(embedding)数据而专门设计的数据库。

在传统的关系型数据库中,数据通常以表格的形式存储,而在向量数据库中,数据以向量的形式存储。向量(embedding)是一组数值,可以表示一个点在多维空间中的位置。向量数据库非常擅长处理大量的高维embedding数据,这种数据在机器学习和深度学习应用中很常见。

提问:在最近半年里,向量数据库被广泛应用于大模型领域。向量数据库在大模型领域具体有哪些应用?

星爵:诸如GPT、Bard、Claude和LLaMA这样的大模型可以产生海量向量嵌入数据来表达复杂的语义关系,但模型本身的存储空间有限,无法持久保存这些数据。

向量数据库就像一块外置的记忆块,可以长期存储这些数据,供模型随时调用。向量数据库在LLM领域的应用主要可以分为以下几类:

  • 1、管理私有数据和知识库

开发者可以方便高效地将自己的领域数据集或者私有数据集转换成向量格式,让大模型直接操作,而无需将这些数据暴露给模型训练方,有效保护了数据隐私和产权。

  • 2、为大模型提供实时数据更新。

通过向量数据库可以为大模型提供实时的数据更新,解决大模型“胡言乱语”的问题,而无需频繁重训模型。这比直接fine-tune模型的成本低很多。

  • 3、实现大模型的个性化和增强。

开发者可以在向量数据库中添加上下文和自己的数据来扩展大模型的感知能力,实现个性化应用。

  • 4、提供智能体的记忆。

智能体是大模型的一个新兴应用场景,用于构建具有独立智能的虚拟人物、虚拟代理甚至人形机器人。向量数据库不仅可以帮助智能体记忆其感知的历史数据和上下文,帮其做出智能决策,还能使其根据长期记忆来实现自我演进。

  • 5、保存大模型的处理结果。

向量数据库可以持久保存大模型处理过的数据,进行离线分析和挖掘。而不像大模型那样,用过即弃。比如说,开源项目GPTCache可以将大模型的查询结果缓存至向量数据库,避免重复计算,提高查询效率,这有点像CDN和Redis对网站数据的作用。

  • 6、构建更复杂的AI系统。

在很多场景下,我们需要将多个大模型和向量数据库串联,实现更强大的功能。其中,多个大模型甚至是多模态模型共同负责处理语义,向量数据库负责数据流转。

对于大模型应用开发者来说,向量数据库是一个非常重要的基础设施,可以在最大限度发挥大模型威力的同时保护数据隐私,实现更丰富的功能。LLM和向量数据库共同推动AIGC的发展,二者缺一不可。

全面拥抱大模型

提问:我们了解到,Zilliz Cloud在两周前于硅谷发布了全面的产品更新和升级。这次产品升级背后的动机是什么?

星爵:我们的出发点是all-in大模型应用开发。

在过去的几年里,我们的开源产品Milvus和商业产品Zilliz Cloud被广泛应用于计算机视觉、NLP、推荐系统、搜索引擎、自动驾驶和生物制药等领域。在过去的半年里,向量数据库经历了它的iPhone时刻,数百万LLM应用开发者涌入,LLM应用开发成为了向量数据库的杀手级应用场景。众多的LLM应用开发者给我们带来了大量新兴的需求,我们决定拥抱这些变化,为LLM应用开发提供更全面、更便利的支撑。

提问:能不能具体介绍下Zilliz Cloud做了哪些更新和升级?

星爵:首先,引入了对RESTful API的全面支持。我们看到新进的LLM开发者大多具有丰厚的Web应用和移动应用开发背景,他们熟悉基于RESTful API将多个服务的能力串起来打造强大的应用。有了RESTful API,开发者可以便捷地将「LLM+向量数据库+提示词」三者连接起来,打造LLM应用程序。我们将这种新开发范式称为CVP Stack,能极大提高开发效率。举个例子说,明道云的一位工程师使用RESTful API一天就完成了Zilliz Cloud和对方平台的整合。

其次,提供了动态schema。此前向量数据库采用静态schema的方式,需要开发者在建表时根据业务定义数据的schema,这对于大型企业的成熟业务而言是一种常见的处理方式。然而,当下AIGC应用多处于早期快速迭代阶段,面向业务效果,需要频繁调整向量数据库内的字段,对于这类需求,反复重建schema结构以及频繁的数据重导入会严重影响产品的迭代速度。为此我们引入了动态schema,支持用户根据开发需要动态灵活地进行数据处理。

再者,新增了JSON数据类型的支持。JSON是目前最流行且最灵活的数据表示方式之一,被广泛地应用于应用程序开发中。我们将MongoDB的基础能力搬进了向量数据库,用户在Zilliz Cloud上可以将JSON与embedding这两种超强能力相结合,实现基于JSON与embedding向量的混合数据表示和处理。

另外,我们还引入了Partition Key,支持基于Partition Key的高效数据过滤;增加了组织和角色的概念,支持基于Role-Based Access Control(RBAC)的多粒度访问控制;增加了全面的LLM生态支持,深度整合了OpenAI、Claude、Cohere、LLaMA、Bard、Dolly、LangChain、LlamaIndex和Semantic Kernel等热门项目。

提问:我们看到Zilliz Cloud之前只提供专有集群一种产品,此次新增了Serverless和云上私有部署两种产品。这背后的原因是什么?

星爵:Zilliz Cloud面向不同阶段的用户提供多种用户计划。

基于Serverless的入门计划

为每位用户提供一个免费的Serverless实例,开箱即用,可支持百万条数据规模的向量检索,适合个人开发者和小型开发团队使用。

  • 专有集群产品

面向大型开发团队和企业,专注高性能、高可用、高可扩展性、智能运维和优化、数据安全以及敏捷技术支持等企业级特性,并提供性能型、容量型、经济型三类实例类型,满足企业不同维度的业务需求。

  • 自托管计划

允许用户在其虚拟私有云(VPC)上部署我们的向量数据库服务,提供完全控制,它是注重隐私、数据安全和合规的大型企业的理想选择。

通过提供不同形态的产品,我们希望满足LLM开发者在不同发展阶段的需要,让每一个开发者、每一个开发团队、每一个企业都能方便地使用向量数据库服务,加速实现AI数据基础软件的普及化。

向量数据库市场的竞争和趋势

提问:今年以来,多家向量数据库初创公司获得了大额融资,一些大厂也纷纷把向量数据库的研发列入日程。你怎么看待日益升温的竞争?

星爵:竞争意味着市场确认和机会。竞争的加剧说明向量数据库的价值得到了市场的广泛认可,其市场机会和潜力得以证实。与此同时,激烈的竞争也在一定程度上推动了技术的进步,这对消费者和整个行业而言都大有裨益,是一件实打实的好事。

当然,这种竞争环境迫使公司更加关注客户的需求。这意味着我们必须密切关注市场趋势,并适应这些变化,以提供客户真正需要的解决方案。我们必须不断创新和优化我们的产品和服务。这对LLM开发者和整个行业来说都是有益的。我相信在一个健康的生态系统中,有多个玩家是至关重要的。这为开发者和客户提供了选择,也为行业设置了标准。

在Zilliz,我们作为向量数据库行业的先行者和开拓者,尤其欢迎这种竞争。我们将继续致力于推动向量数据库技术的发展,并与其他参与者一起,为用户提供最先进的工具和服务。

提问:刚才你提到了行业标准,在关系型数据库领域有TPC-C和TPC-H这样的benchmark,向量数据库领域有类似的benchmark么?

星爵:目前还没有标准的benchmark,这给开发者和企业在向量数据库产品对比和选择时造成了很多的疑惑和困难。

为此,我们近期开放了一套开源的向量数据库评测工具VectorDBBench(https://github.com/zilliztech/VectorDBBench)。

该工具包含一套标准化数据集,结合多个典型场景,覆盖数据插入与索引构建、向量查询、混合查询、数据容量等多个能力维度,同时支持用户自定义的数据集与测试场景。

我们欢迎开发者们参与到这个开源benchmark的开发和迭代中来,希望VectorDBBench能发展成为像ClickBench这样的行业标准。

提问:你认为向量数据库赛道未来竞争的核心是什么?

星爵:向量数据库作为一款数据库产品,“更大更快更便宜”是未来发展的核心趋势。更大是指能处理更大的数据量,这意味着支持百亿条数据甚至更高的可扩展性;更快是指更高的性能,包括毫秒级的响应时间和高达数万的QPS;更便宜是指更少的资源消耗更高的性价比,在相同资源消耗的情况下提供更强大的性能。

我们的Zilliz Cloud基于Milvus开源项目,这是全球现在唯一一款真正分布式的向量数据库系统,能提供数百亿条向量数据的毫秒级查询。得益于Milvus的云原生架构,Zilliz Cloud高效地实现了多租户能力,在相同的实例配置下,性能远超其他竞品。举个例子说,在基于VectorDBBench的评测中,Zilliz Cloud性能是Pinecone的两倍以上,综合性价比超过Pinecone三倍以上。

国内云产品即将推出

提问:Zilliz Cloud现在已经支持了AWS和GCP,有没有计划支持国内云平台?

星爵:我们计划在今年7月上旬推出国内的云服务产品,首期预计会支持阿里云、百度云、腾讯云和金山云,并将逐步覆盖国内更多的云厂商。Zilliz Cloud国内云产品定价相比海外产品将会有较大幅度的下调,致力于为国内用户提供最高性价比的全托管向量数据库服务。

参考链接

  1. Zilliz Cloud:https://zilliz.com/cloud

  2. Milvus:https://milvus.iohttps://github.com/milvus-io/milvus

  3. VectorDBBench:https://github.com/zilliztech/VectorDBBench

  4. GPTcache:https://github.com/zilliztech/GPTCache

(本文为转载文章,原文刊载于微信公众号【量子位】)

🌟全托管 Milvus SaaS/PaaS 即将上线,由 Zilliz 原厂打造!覆盖阿里云、百度智能云、腾讯云、金山云。目前已支持申请试用,企业用户 PoC 申请或其他商务合作请联系 business@zilliz.com。


  • 如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。

  • 欢迎关注微信公众号“Zilliz”,了解最新资讯。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/728983.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构中队列的操作方式,一目了然

队列的概念 首先我们联想一下链表,在单链表中,我们只能对他的链表表尾进行插入,对链表的表头进行结点的删除,这样强限制性的链表,就是我们所说的队列。 也就是说,队列(queue)是限定…

云盘选择攻略:寻找易用且高效的同步云盘服务

同步云盘是集备份、同步、共享于一体的软件,备受用户青睐。在这个信息化的时代,我们经常需要在不同的设备之间共享文件,而同步云盘正可以帮助我们在多台设备之间同步文件。不过目前市面上同步云盘众多,我们该如何选择同步云盘呢&a…

数据结构【考研笔记】

数据结构【考研笔记】 第一章 绪论一、数据结构的基本概念1、基本概念1)数据2)数据元素、数据项3)数据对象、数据结构4)数据类型、抽象数据类型(ADT) 2、三要素1)逻辑结构2)存储结构…

C++学习 指针

目录 指针 指针的定义和使用 指针所占用的内存空间 空指针与野指针 const修饰指针 指针和数组 指针和函数 指针 指针是一个变量,其值为另一个变量的地址,即内存位置的直接地址。就像其他变量或常量一样,您必须在使用指针存储其他变量地…

动态规划:背包问题

01背包:物品只能选一个 完全背包:物品可以选无数个 注:01背包与完全背包,不论是求背包装的最多物品的价值,还是求装满容量为bag的背包最多有几种方法,区别都在里层遍历背包时,01背包使用倒序…

three.jsgsap滚动交互网页实现 1-模糊背景线条

实现 模型只有其中的一根线条 加载完模型后 将其圆形排列一周 要实现圆形排列一周可以自己计算sin和cos实现,更简单的可以使用vector3的setFromCylindricalCoords方法实现 该方法计算返回圆柱上的点,圆柱上的点由参数决定 使用方法: for (let…

监听DOM尺寸变化 - ResizeObserver

一、与 MutationObserver Api的区别 MutationObserver 主要用来监听 DOM 元素的属性和节点变化的,非 DOM 样式尺寸,可查看之前一篇 blog - DOM规范 - MutationObserver接口观察DOM元素的属性和节点变化ResizeObserver 主要用来监听 DOM 元素的 内容区域…

Stable Diffusion WebUI 不同采样方法的效果、耗时对比记录

测试方法 所有测试除了采样方法调整,其他均保持一致。主要参数信息如下 1girl, 3d, architecture, blurry, blurry background, blurry foreground, breasts, brown hair, building, cherry blossoms, city, cityscape, cosplay photo, cowboy shot, day, depth o…

hive2.3.7安装部署-问题:show databases;没反应

目录 一、安装包准备 二、安装mysql 三、hive安装 四、hive启动 五、问题 环境:CentOS7.2.xx、hadoop2.6.4、jdk1.8.0xx、mysql-5.7.38 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL查询功能。…

【计算机组成原理期末课设作业】16位微型计算机实现——MOVS串传送扩展指令设计

16位微型计算机实现——MOVS串传送扩展指令设计😎 前言🙌教学目的:1、数据**加粗样式**通路分析2、微程序控制器分析3、指令系统分析4、微程序控制器指令周期流程图5、微指令编码6、测试程序和运行结果(1)首先先在内存…

asp.net core 框架搭建2-搭建MVC后台管理系统

文章目录 系列文章1.项目搭建1.1 新建Asp.net core MVC项目1.2 ASP.NET Core MVC目录结构1.3 创建一个控制器,与页面数据交互1.4 实现一个登录页面1.5 实现后台管理主界面 2.过程中知识点和涉及到的问题2.1 session的使用2.2 EF Core连接mysql 源码下载 作者&#x…

机器学习29:《推荐系统-II》协同过滤

在《机器学习28:《推荐系统-I》概述》一文中,笔者介绍了“基于内容过滤(content-based filtering)”和“协同过滤(Collaborative Filtering)”两种常见的【候选 Item 池】生成方法。其中,基于内…

android studio使用Flutter Inspector调试布局

1、点击anroid studio右侧的Flutter Inspector按钮 2、点击展开布局右上角的‘Select Widget Mode’,即可实现点击相关节点,真机上可以看到相关的方框 如下图

月薪65k的大厂项目经理,是种什么体验

早上好,我是老原。 之前给大家更新了几期关于项目管理行业的面试题,又值一年毕业季,想入行的新手小白,或者想跳槽的行业大佬可以码起来了。 有很多粉丝朋友都在后台给我留言,想看云计算行业的岗位分析,今…

前端开发:JS中常用事件汇总

前言 在前端开发中,关于事件相关的操作是非常常见的操作,尤其是实际业务场景中涉及复杂交互的需求。在JS中比较常用的事件有很多,而且涉及不同方式不同类型的点击事件,一般情况下事件会和函数结合使用,这就是事件和函数…

Python 背包问题

✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心&…

MySQL阶段DAY20(附笔记)

【注意】:工厂模式学习知识结构如下: (一)、单例模式 1.Single类: 使用懒汉式:对象的延迟加载,安全的,高效的应用 双重判断提升效率和安全性 package singleton;/** 单例设计模式之…

Prisma 国内镜像设置

背景 相信大家在体验完 prisma 后,一般都是会感觉开发起来很方便,功能使用起来很顺畅很爽,但是想推广起来团队内使用的时候发现。。。 原因是prisma client 需要下载几个引擎,在其他没有翻墙工具的小伙伴使用的时候发现一直下不下…

供应商管理解决方案实战指南:打造高效供应链

在现代商业环境中,供应商管理是企业成功运营的关键因素之一。随着全球化和供应链的复杂性不断增加,供应商管理面临着许多挑战,如供应商选择、供应商绩效评估和供应链风险管理等。为了解决这些挑战,企业需要采取一系列的解决方案&a…

Sui x KuCoin Labs夏季黑客松第四批入围项目公布

自Sui x KuCoin Labs夏季黑客松开放注册以来,收获了众多开发者的关注和报名参与。现在比赛的报名阶段已结束,截至目前为止,我们已经公布了三批入围项目名单,现在第四批入围名单项目新鲜出炉,最后一轮入围结果将于7月12…