Milvus 老友汇|AI、云原生与向量数据库的精彩碰撞回顾!

news2024/11/15 21:44:03

一场久违的老友对谈,一次精妙的 AI 探索碰撞。

近日,Milvus 老友汇·Arch Meetup 在上海圆满落幕。本次 Meetup 亮点颇多,不仅得到了 KubeBlocks 社区的大力支持,同时也邀请了来自网易伏羲和蚂蚁集团的资深专家,现场分享各自对于 AI 时代云原生与向量数据库的思考。

alt

接下来,让我们快速回顾一下本次活动的主要观点:

Zilliz 资深工程师 夏琮祺 :无论是架构、新功能、性能还是可维护性,Milvus 2.3.x 都是向量数据库中的佼佼者,绝对值得一试

网易伏羲资深 AI 研发工程师 陈京来 :Milvus 在网易图文多模态场景的实践中显示,其有效地支撑了网易伏羲十亿级图文数据及应用落地

云猿生数据资深工程师 郭子昂:使用 KubeBlocks 轻松管理向量数据库 + LLM 等 AIGC 数据基础设施

蚂蚁集团工程师 徐鹏飞:使用 KCL 声明式配置语言和工具应对工程化配置策略挑战

以下为详细解读,大家可按需享用:

01.Milvus 2.3.x 新功能解读

夏琮祺从架构、新功能、性能和可维护性方面对 Milvus 2.3.x 进行了全方位的解读。

alt

他首先提到,Milvus 2.3.x 在架构方面进行了升级,包括对异构硬件的支持(GPU Index:RAFT;ARM)、升级 QueryNode(QueryNodeV2)。夏琮祺着重介绍了 QueryNodeV2 。QueryNode 承担了整个Milvus 系统中最重要的检索服务,其稳定性、性能、扩展性对 Milvus 至关重要,但 QueryNodeV1 存在状态复杂、消息队列重复、代码结构不清晰、报错内容不直观等问题。在 QueryNodeV2 的新设计中,团队重新梳理了代码结构、将复杂的状态改为无状态的设计、移除了 delete 数据的消息队列减少了资源浪费,在后续持续的稳定性测试中,QueryNodeV2 的表现更加优异。

新功能方面,Milvus 2.3.x 上线的这些功能值得重点关注:

  • Upsert:由于 Milvus 现在还不支持 update 操作,用户需要更新向量时需要删除旧有的记录后并重新插入。在2.3版本,Milvus 提供的 Upsert 接口,保证了一个原子性的“修改”操作;

  • SCANN Index:Knowhere 2.0,支持了 SCANN 索引;

alt
  • Iterator (pymilvus only):Milvus 的 Search 和 Query 都有数据上线,当用户需要查询大量乃至全量数据的时候,现存的接口无法完全满足这一需求。在 Milvus 支持 range search 后,pymilvus 通过动态调整 range 的方式模拟了一套 Iterator 接口,可以返回用户所需要的大批量数据;

  • Delete By Expression:Delete 接口,在 2.3 之前只能通过主键表达式来做删除(ID in [1, 2, 3, …])。用户想要删除一些满足条件的数据时,需要先 Query 其主键,再执行删除操作,Delete by expression 提供了 Milvus 服务端的“语法糖”,在系统内部完成了这一操作。

不止如此,Milvus 2.3.x 还支持 MMap、Growing Index、支持动态修改配置、CDC 等,大大提升了 Milvus 的整体性能和可运维性,感兴趣的同学可以查看 Milvus 2.3.x 系列文章了解详情。

02.Milvus 在网易图文多模态场景的实践

陈京来分享了“Milvus 在网易图文多模态场景的实践”。他表示,加大模型规模及提升数据质量是获得更好的人工智能效果的重要手段。

网易伏羲从事大模型的研究 5 年的时间,积累了丰富的算法和工程经验,先后打造了数十个文本和多模态预训练模型。而向量在大型语言模型中起着重要作用,例如:Embedding——基于 AI 的工具和算法,可以将非结构化的数据,如文本、图像、音频和视频等映射到低维度空间表示为 embedding。

alt

如今,伏羲图文数据已经积累了 10 亿+ 互联网数据以及网易自有版权数据,有着大量图文检索的需求,相应地也带来了各种挑战:

  • 资源占用高:占用大量的计算、存储资源

  • 异构资源:GPU、CPU、SSD 等不同类型资源

  • 业务类型复杂:图文多模态、NLP、用户画像等多种业务,不同业务数据规模、时延、服务质量、召回精度等不同

  • 稳定性和可靠性

在此情况下,如何构建一个高性能、高可靠、异构的图文向量引擎至关重要。Milvus 架构具有云原生、存储计算分离、分布式、冗余和高可用等特点,在其助力下,网易伏羲实现了十亿级 Milvus 集群的创建。

alt

此外,陈京来亦提到,在攻坚任务等研发框架下,伏羲启动了图文多模态领域能力的积累及应用探索。自研了支持中文场景的图文生成模型“丹青”,基于此推出了AI 绘画平台“丹青约”,而 LangChain + Milvus 可以构建丹青约绘画 Agent。

对于未来,陈京来期待用 Milvus 探索检索增强生成(RAG)以提升图文多模态模型能力,以及借助更多 Milvus+ 的能力提升图文多模态场景的应用落地。

03.KubeBlocks:轻松管理 AIGC 数据基础设施

alt

郭子昂以《KubeBlocks:轻松管理 AIGC 数据基础设施》为主题,讲解了 AI 时代背景下,KubeBlocks 的 AIGC 数据基础设施解决方案:KubeBlocks 通过提供向量数据库托管和 LLM 托管能力,帮助用户构建自己的 AI 应用,极大地降低了应用开发者的负担。

alt
  • KubeBlocks 的数据库托管能力

KubeBlocks 作为开源管控平台,可运行和管理 K8s 上的数据库、消息队列及其他数据基础设施。基于这一特点,KubeBlocks 的解决方案采用托管向量数据库(如 Milvus)和图数据库(如NebulaGraph)的方式,实现多云和线下部署,在实现快速 day-1 集成的同时,也提供了丰富的 day-2 运维操作。

KubeBlocks 依靠其强大的集成和抽象能力,可快速实现数据库集成。郭子昂以 Milvus 为例,展示了根据 KubeBlocks 的 API 在 YAML 文件中定义 Milvus 各种特性、运维配置,轻松实现向量数据库全生命周期管理。

  • KubeBlocks 的 LLM 托管能力

KubeBlocks 具有强大的 LLMOps 能力,支持托管 LLM 及多种大模型。基于 KubeBlocks,开发者可实现 LLM 私有化部署,同时支持定制化大模型,实现行业数据的精细调整。此外,KubeBlocks 的 LLMOps 能力还支持 LLM 开发环境私有化部署、分布式部署、高性能 batching,充分适配本地开发环境和生产环境,提升 GPU 利用率。

  • KubeChat:KubeBlocks AIGC 解决方案落地

基于上述解决方案,KubeBlocks 已成功落地 AI 应用,在 10 天时间开发出 AI 知识库应用 KubeChat,轻松应对 Embedding、向量数据库和大模型在开发 AI 应用过程中带来的各类挑战。

alt

04.KCL 在 AI 工程配置策略场景的探索和落地使用

alt

徐鹏飞分享了《KCL 在 AI 工程配置策略场景的探索和落地使用》。平台工程和 AI 工程的发展日益迅猛,但这也带来了问题和挑战,比如认知负担、配置/数据种类繁杂、配置/数据清洗过程易出错、效率可靠性低等。KCL 作为专用配置策略语言为配置和自动化提供了解决方案,以收敛的语言和工具集合解决领域问题近乎无限的变化和复杂性,同时兼顾表达力和易用性。

此外,KCL 以数据和模型为中心,采用开发者可以理解的声明式 Schema/配置/策略模型用于 AI 工程、云原生工程等场景。KCL 为开发人员提供了通过记录和函数语言设计将配置(config)、建模抽象(schema)、逻辑(lambda)和策略(rule)作为核心能力,具有可复用可扩展、抽象和组合能力、稳定性、高性能等特点。

alt

KCL 可以广泛用于表格数据集验证和转换、云原生配置验证和转换、通过抽象进行应用交付、IaC & GitOps等场景。KCL 也注重开发者体验,提供完备的 Language + Tools + IDEs + SDKs + Plugins 工具链支持,还支持模型 Registry。

彩蛋:看看模型 Registry 里出现了谁?

alt

关注 Zilliz 微信公众号,回复关键词【老友汇上海】获取现场嘉宾 PPT。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1310432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

影响云渲染质量的几大要素是什么?影响云渲染质量的主要原因有?

对于3D渲染从业者而言,实现高效和高质量的渲染是一个常见的挑战。由于三维场景的复杂性,相关计算和处理通常需要大量的计算能力和存储,尤其是当面对着高分辨率图像、详细的动画或全局光照效果等要求时,渲染时间往往会大幅增加。针…

Shopee热卖产品:把握市场趋势,掌握消费者心声

在Shopee平台上,热卖产品的选择是一个不断变化的过程。随着时间、季节和市场需求的变化,消费者对各类产品的需求也会有所不同。本文将为您介绍一些建议的热卖产品类别,并提供了一些关键的市场趋势和策略,以帮助您在Shopee平台上获…

Python安装报错: This environment is externally managed

error: externally-managed-environment This environment is externally managed ╰─> To install Python packages system-wide, try apt installpython3-xyz, where xyz is the package you are trying toinstall.这个错误信息表示当前Python环境是由系统外部管理的&…

国际语音呼叫中心的工作流程

国际语音呼叫中心的工作流程一般包括以下几个步骤: 1.呼叫分配 当客户拨打企业的客服电话时,国际语音呼叫中心会自动将呼叫分配给示闲的客服代表,或者根据客户的需求,将呼叫转接给相应的客服代表。 2.客服代表接听电话 客服代…

windows 服务器 怎么部署python 程序

一、要在 Windows 服务器上部署 Python 程序,您需要遵循以下步骤: 安装 Python:首先,在 Windows 服务器上安装 Python。您可以从官方网站(https://www.python.org/downloads/windows/)下载最新的 Python 安…

365锦鲤助手 砍价小程序源码 流量主引流裂变

源码介绍 修改版365锦鲤 助手, 砍价小程序源码 流量主引流裂变 拼多多商品快速丰富产品内容满足广大用户需求;流量矩阵让流量都进你的圈子飞起来;长期盈利、项目稳定 1.后台安装微擎 2安装应用 后台打包上传

【干货分享】网工必要了解协议MPLS

热门IT技术--视频教程https://xmws-it.blog.csdn.net/article/details/134398330?spm1001.2014.3001.5502 MPLS是一种在IP骨干网上利用标签来指导数据报文高速转发的协议,由IETF (Internet Engineering Task Force,因特网工程服务组&#xf…

深眸科技|轻辙视觉引擎以99.9%视觉检测能力为基准,赋能木材加工

轻辙视觉引擎:轻辙视觉引擎是以低代码为基础,深度学习技术为核心的视觉业务流程编排引擎,用于快速搭建部署复杂视觉检测流程软件方案。 轻辙视觉引擎|轻量级产品实现高效应用 作为深眸科技的核心产品之一,轻辙视觉引…

定时限电流继电器 JL-8D/2X112A5 AC220V 0.1~9.9S 0.1~9.9A 导轨

系列型号 JL-8D/3X1定时限电流继电器;JL-8D/3X111A2定时限电流继电器; JL-8D/3X121A2定时限电流继电器;JL-8D/3X211A2定时限电流继电器; JL-8D/3X221A2定时限电流继电器;JL-8D/3X2定时限电流继电器; JL…

关东升老师极简系列丛书(由清华大学出版社出版)

极简系列丛书,编程学习新体验 在这个科技日新月异的时代,编程已经成为了一种必备技能。但是面对各种复杂的编程语言,你是否也曾感到过迷茫和困惑?由清华大学出版社出版的“极简系列丛书”就是为了帮助你解决这个问题。 这套丛书…

Linux——进程地址空间与进程控制

进程地址空间与进程控制 文章目录 进程地址空间与进程控制1. 进程地址空间1.1 进程地址空间的引入1.1 进程地址空间的特点1.2 页表1.3 C/C的地址1.4 进程地址空间 页表的优势 2. 进程控制2.1 进程创建2.1.1 写时拷贝 2.2 进程终止2.2.1 进程退出码2.2.2 异常信号码2.2.3 errno…

基于Java SSM框架实现列车火车高铁票务信息管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现列车火车高铁票务信息管理系统演示 摘要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被…

从零开始创建一个项目,springBoot+mybatisPlus+mysql+swagger+maven

一,前提 从零开始创建一个项目,绑定了数据库 用到的技术栈:springBootmybatisPlusmysqlswaggermaven 二,创建项目步骤 1,创建项目 创建出来的项目结构如图所示 2,修改配置文件 因为我比较习惯yml语言&…

美国访问学者陪读签证怎么申请?

美国访问学者陪读签证是许多前往美国深造的学者及其家属关注的重要问题。如何申请这一签证,一直以来都是备受关注的话题。下面知识人网小编将为您介绍一下美国访问学者陪读签证的申请流程。 首先,申请人需要了解访问学者陪读签证的基本要求。通常情况下&…

如何在Kali Linux安装Xrdp+cpolar内网穿透实现远程访问Kali系统

文章目录 前言1. Kali 安装Xrdp2. 本地远程Kali桌面3. Kali 安装Cpolar 内网穿透4. 配置公网远程地址5. 公网远程Kali桌面连接6. 固定连接公网地址7. 固定地址连接测试 前言 Kali远程桌面的好处在于,它允许用户从远程位置访问Kali系统,而无需直接物理访…

ubuntu debian mini安装系统 有线选项消失或ens33 ethernet 未托管解决方法

nmcli device status#修改NetworkManager.conf如下 sed s/false/true/ /etc/NetworkManager/NetworkManager.confsed -i s/false/true/ /etc/NetworkManager/NetworkManager.conf#重启生效systemctl restart NetworkManager

Vue3-12- 【v-for】循环一个整数

说明 v-for 这个东西就很神奇&#xff0c;可以直接循环一个整数&#xff0c;而且循环的初始值是从1 开始。使用案例 <template><div v-for"(num,indexB) in 6" :key"indexB">【索引 {{ indexB }}】 - 【数字 {{ num }}】 </div></t…

[多线程]线程池

目录 1.前言 2. Java中的线程池以及参数介绍 2.1 核心线程数和最大线程数 2.2最大空闲存活时间 2.3任务队列和线程工厂 2.4 拒绝策略(最重要&#xff09; 2.5 线程池的类型 3.线程池的大小如何确定 4.手动写一个线程池 1.前言 我们知道.在开发过程中.为了效率,会引进很…

激荡思享 驱动增长 | 湾数联·湾董会走进竹云

12月12日&#xff0c;由湾区数字科技产业联盟&#xff08;GBADA&#xff09;、湾盟产业创新服务中心&#xff08;GBAIC&#xff09;、深圳竹云科技股份有限公司联合主办的“湾数联湾董会”第一期在深圳南山区创智云城圆满举办。本期湾董会以“竹云IDaaS数字身份为企业数字化转型…

Amazon CodeWhisperer:AI 编程助手

文章作者&#xff1a;prigioni 1. 什么是 Amazon CodeWhisperer&#xff1f; Amazon CodeWhisperer 能够理解以自然语言&#xff08;英语&#xff09;编写的注释&#xff0c;并能实时生成多条代码建议&#xff0c;以此提高开发人员生产力。该服务可以直接在集成开发环境&#…