全新启航!阿里云向量检索服务Milvus版正式上线!

news2024/12/23 15:50:22

今天,阿里云正式宣布向量检索服务Milvus版在杭州、上海、北京、深圳四大region正式可用并开放公测!这是由阿里云与产品生态合作伙伴Zilliz联合推出的一款业内领先的云原生向量检索引擎。向量检索服务Milvus版在上一代EMR Serverless Milvus 公测版的基础上全新升级并继续提供公测服务,不仅继续100%兼容开源版内核,同时联合ZIlliz提供更强大的商业化内核,极致的存算优化,使得性能得到3倍以上提升,资源节约30%以上,更与PAI-EAS、通义等阿里云AI产品打通,并全面兼容LlamaIndex,提供友好易用的RAG解决方案。

现在向量检索服务Milvus版提供独立产品控制台、售卖入口和帮助文档,用户可以在全新的产品详情页上了解服务,并进行免费的公测使用。

极致存算优化带来的数倍性能提升

向量检索服务Milvus版通过技术上的存算优化,较Milvus社区版有着数倍的性能提升。具有Cardinal商业内核,整合了最实用、最流行的 ANNS 方法,具备高效的计算资源使用率,通过大量可调整参数适配多种场景,能够默认自动调整参数适配不同的场景,在保持合理精度(召回率)的同时最大化搜索速度(QPS,每秒查询数)。体现在向量检索中的索引类型上,向量检索服务Milvus版提供功能更强大AUTOINDEX索引,对比HNSW、IVF等开源索引,用户无需再花费时间精力调优索引参数,AUTOINDEX索引可以自适应优化索引参数,一种索引适配多种场景,用户只需聚焦于业务本身,减轻调参压力。同时,提供远超开源内核的高性能的 ANN 算法、稀疏查询算法等能力。在工程上进行了大量优化,相同场景下引擎性能(QPS)是开源社区版的10倍,召回率一致的情况下QPS有5倍提升,而综合考虑QPS和召回率也可实现8倍的提升。同时对计算、存储资源进一步降低,可达到至少30%的自建Milvus上云成本缩减。通过开源向量数据库性能测试工具对向量检索服务Milvus版和社区版进行评估测试,结果如下:

云原生企业级的护航服务

向量检索服务Milvus版提供全托管免运维的向量检索引擎服务。100%兼容开源,支持开源用户平滑迁移上云,开箱即用,用户能够一键调整集群配置。根据专业技术团队评估,自建Milvus服务依赖至少2-3位专业开发及运维工程师耗费月余完成业务搭建,并且需要投入1/3的人力持续运维,而使用阿里云向量检索服务Milvus版则可在10min内完成集群资源搭建,立即进入业务开发状态,几天内让开发人员快速完成业务开发和接入,并持续稳定运行,极大地降低用户的使用门槛和前期投入。

同时,向量检索服务Milvus版在安全可用上提供99.9%可用性SLA(公测期免费,不保证SLA),有着丰富的安全策略,拥有更细粒度的角色权限访问控制和组织管理,云上自研技术提供Kubernetes集群监控告警等系统,保证在业务波动情况下集群稳定运行。同时阿里云同Zilliz技术团队一起为用户提供更全面的服务支持,用户无须依赖有丰富经验的架构与运维人员,可将大部分精力投入到业务中去。

拥抱阿里云与AI双生态的便捷体验

在阿里云上,向量检索服务Milvus版无缝集成于PAI-EAS产品,通过EAS的Web UI,帮助用户快速搭建功能丰富、简单易用的RAG解决方案。用户只需要经过简单的配置,就可以快速运行一个知识问答助手。除此之外,还可以通过API调用的方式和通义大模型、魔搭社区打通,非常方便的使用各种大语言模型,享受阿里云AI平台为开发者提供的各种工具。在开源社区内,Milvus原生接入LangChain和LlamaIndex框架,用户在云上也可以直接使用开源AI生态的各种工具,在自带的PythonSDK下,体验非常友好。

首战告捷

公测期间阿里云Milvus成功助力识货搭建电商向量数据检索平台。识货成立于2012年6月,是虎扑旗下的国内领先的电商平台,产品覆盖国内外主流购物商,搜索引导的成交占比全部成交的50%以上,是站内最重要的功能之一。通过与识货技术团队多次协同配合,阿里云Milvus为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。实现了亿级别数据准实时检索,毫秒级别查询响应,同规格QPS对比自建提升10%。同时提供开箱即用的全托管服务,极大的缓解了运维人力和精力负担。

现在,阿里云向量检索服务Milvus版为非结构化数据处理提供全链路解决方案,在整个链路中,从向量索引、工程算法优化、弹性扩缩容、全链路非结构化Pinepline等多个方向进行大量优化,目前已经成功应用于相似性检索、多模态检索,大语言模型中的检索增强生成等场景中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1983349.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能自动驾驶三维车道线检测—PersFormer模型代码详解

文章目录 1. 背景介绍2. 数据加载和预处理3. 模型结构4. Loss计算5. 总结和讨论 1. 背景介绍 梳理了PersFormer 3D Lane这篇论文对应的开源代码。 2. 数据加载和预处理 数据组织方式参考:自动驾驶三维车道线检测系列—OpenLane数据集介绍。 坐标系参考&#xff…

【Raven2靶场渗透】

文章目录 一、IP获取 二、信息收集 三、Flag1 四、漏洞利用 五、Flag2 六、Flag3 七、MSF UDF提权 八、CVE漏洞本地提权 一、IP获取 Kali IP:192.168.78.128 靶机IP:192.168.78.178 二、信息收集 端口和服务探测: nmap -sV -p- 192.168.78.178 开放…

启发式合并加树形dp

题目链接 令f【x】【0】表示不选根的x子树的最大贡献,f【x】【1】表示选根的x子树最大贡献,g【x】为max(f【x】【0】,f【x】【1】)。 如果我们要连接x和u1,那么贡献是: w【x】w【u1】f【u1】【0…

ASP.NET Core 基础 - 入门实例

一. 下载 1. 下载vs2022 Visual Studio 2022 IDE - 适用于软件开发人员的编程工具 (microsoft.com) 学生,个人开发者选择社区版就行,免费的. 安装程序一直下一步下一步就行,别忘了选择安装位置,如果都放在C盘的话,就太大了. 2. 选择工作负荷 准备工作完成 二. 创建新项目 三…

如何用密码保护你的 WordPress 管理员 (wp-admin) 目录

在维护 WordPress 网站时,确保 wp-admin 目录安全是非常重要的。为该目录添加密码保护可以有效提高网站安全性,防止未经授权的访问。这篇文章将介绍实现这一目标的两种方法。 1.为什么要为 wp-admin 目录添加密码保护 WordPress 管理员后台是网站的核心…

自动化集成应用钡铼DB系列防水分线盒

随着工业自动化的快速发展,如今的现场设备需要更高效、更稳定的信号采集和集成方案。钡铼技术的DB系列防水分线盒作为一种优秀的解决方案,成功地结合了先进的工业设计与耐用材料,为物流设备、食品加工设备、制药设备等多种工业应用提供了可靠…

《深入浅出WPF》学习笔记六.手动实现Mvvm

《深入浅出WPF》学习笔记六.手动实现Mvvm demo的层级结构,Mvvm常用项目结构 依赖属性基类实现 具体底层原理后续学习中再探讨,可以粗浅理解为,有一个全局对象使用list或者dic监听所有依赖属性,当一个依赖属性变化引发通知时,就会遍历查询对应的字典,通知View层进行…

目标检测之选择性搜索:Selective Search

文章目录 一.选择性搜索的具体算法二.保持多样性的策略三.给区域打分四.选择性搜索性能评估五.代码实现 论文地址: https://www.koen.me/research/selectivesearch/ 代码地址: https://github.com/AlpacaDB/selectivesearch 参考: https:/…

SpringBootWeb AOP

事务&AOP 1. 事务管理 1.1 事务回顾 在数据库阶段我们已学习过事务了,我们讲到: 事务是一组操作的集合,它是一个不可分割的工作单位。事务会把所有的操作作为一个整体,一起向数据库提交或者是撤销操作请求。所以这组操作要…

kickstart自动安装脚本,pxe网络安装

目录 1 kickstart图形化生成脚本工具 1.1 安装apache 1.2 创建挂载镜像软链接 1.3 图形生成自动化脚本选项 1.4 修改生成的自动化脚本 1.5 将脚本放至网站根目录 2 安装系统 2.1 关闭DHCP自动分配 2.2 下载配置DHCP服务 2.3 重启DHCP服务 2.4 使用pxe方法安装系统(网…

YOLOv5与YOLOv8 训练准备工作(不包含环境搭建)

前言:我发现除了安装环境需要耗费大量时间以外,对于训练前的准备工作也要琢磨一段时间,所以本篇主要讲一下训练前需要准备的工作(主要是XML格式换为txt,以及划分数据集验证集,和训练参数的设置)…

8–9月,​Sui Move智能合约工作坊将在台北+线上举行

你对区块链和去中心化应用感兴趣吗?想深入学习Sui Move编程语言吗? 从8月10日到9月28日,Sui Mover社区将在每周六下午13:00–17:00举办精彩的工作坊,为期两个月,带你从零基础入门到高级进阶,全面掌握Sui M…

Django配置模板引擎

【图书介绍】《Django 5企业级Web应用开发实战(视频教学版)》_django 5企业级web应用开发实战(视频教学版)-CSDN博客 《Django 5企业级Web应用开发实战(视频教学版)》(王金柱)【摘要 书评 试读】- 京东图书 (jd.com) 本节主要介…

Linux之进程间通信(上)

目录 进程间通信的目的 进程通信的分类 进程通信之匿名管道 创建匿名管道 匿名管道的特点 匿名管道四种通信类型 在现实生活中,人们要进行合作,就必须进行交流,那么在进程之间,会存在交流的情景吗?答案是肯定的…

音频转换器在线哪个好?提升音频质量的转换工具

你是否曾梦想过将手机里的铃声变成自己的原创作品?或者,有没有想过将一段演讲录音转化为易于分享的MP3格式? 如果答案是肯定的,那么这款音频转换器mp3就是你寻找的答案。现在,让我们一起探索它的魅力吧! 一…

基于MATLAB机器学习、深度学习实践技术

近年来,MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域,MATLAB提供了丰富的算法库和工具箱,极大地…

浏览器用户文件夹详解 - Preferences(十)

1.Preferences简介 1.1 什么是Preferences文件? Preferences文件是Chromium浏览器中用于存储用户个性化设置和配置的一个重要文件。每当用户在浏览器中更改设置或安装扩展程序时,这些信息都会被记录在Preferences文件中。通过这些记录,浏览…

海思ISP记录七:低照度图像调整

Hi3519av100imx585 记录下低照度图像调整的流程和思路 一、环境与配置 环境:暗房不开灯,只有零散漏光和电脑光亮gain与帧率:根据手册我设置的是Again:31282;Dgain:8192;ISP Dgain:…

B1.1 关于应用程序员模型-概述

快速链接: . 👉👉👉 ARMv8/ARMv9架构入门到精通-[目录] 👈👈👈 付费专栏-付费课程 【购买须知】个人博客笔记导读目录(全部) B1.1 关于应用程序员模型–概述 本章节包含了应用程序开发所需的程序员模型信息。 本章节中的信息不同于支持和服务于操作系统下应用程…

1.MySQL面试题之innodb如何解决幻读

1. 写在前面 在数据库系统中,幻读(Phantom Read)是指在一个事务中,两次读取同一范围的数据集时,由于其他事务的插入操作,导致第二次读取结果集发生变化的问题。InnoDB 作为 MySQL 的一个存储引擎&#xff…