Milvus在数派数据大模型业务中的实践

news2024/11/15 23:56:53

6853fc6e43b80f134416700ed19659a1.png

0ec18b993898aa076de4d8ca80bcf670.png

01.

写在前面

云南数派数据科技有限公司是一家总部位于美丽春城昆明的大模型创新企业,在深圳和昆明双城并立,设立了两个研发中心。我们的旗舰产品——SUPIEDT大模型开发平台,作为一款全生命周期的异构算力大模型开发平台,集一站式企业级大模型开发及服务运行等综合能力于一身。目前,该平台已成功落地全国10家人工智能算力中心,构建起强大的算力网络,能够向客户提供总量超过1000P的算力供应以及数十套大模型的行业解决方案。帮助客户在大模型时代,用得上、用得起、用得好。

02.

业务背景

在市场上除了大企业外更多的是咱们的中小企业以及个人,众多的中小企业正面临一种普遍的焦虑情绪,其核心担忧在于:若未能及时搭乘大模型技术的快车,恐将面临被时代浪潮淘汰的风险。然而,对普通企业来说,大模型入门门槛高,不知如何跨越这道门槛,融入这一技术革新潮流。鉴于当前这一现状,我们做了一些事情,把这个门槛降低,让每一位个人或企业都能够以极低的门槛将大模型在本地业务进行私有化的落地。

目前,我们业务正蓬勃发展,在全国范围内展现出了较强的竞争力。简而言之,我们是一个小而美的研发团队,我们也期望能够助力众多像我们一样的中小企业在大模型的时代尽早完成转身。

尤为值得一提的是,我们的平台将秉持开放共享的精神,实施开源策略,为更广泛的开发者及企业用户提供便利。

03.

Milvus与数派数据大模型业务的架构

1c9a1e0a85b2c29e4ec5a8956a1134cb.png

Milvus作为业务架构中的核心模块,贯穿整个应用技术栈,起到了关键作用。整个应用可以架构在不同的硬件设备之上,对不同的数据进行向量化,将向量化的结果存入到Milvus向量库,由向量库为大模型以及应用提供数据。

04.

Milvus与数派数据大模型使用场景的结合

4.1基于Milvus知识库问答应用

随着企业业务与算力中心的日益普及,客户对我们的业务提出了新的期望:希望获得能够即刻投入使用且支持模型训练的开箱即用应用。这意味着用户能够先从应用层面直接体验,若需求未得到充分满足,再进一步进行模型调优。

在这一背景下,知识库成为了满足客户需求的关键工具之一。基于客户的迫切需求,因此集成了RAG能力,确保了知识库功能的即时可用性,这个场景就需要向量数据库的支持,特别是Milvus,它在后续的数据管理和模型评估中将发挥潜在的重要作用,确保数据的高效处理和模型的精准评估。

a89c37e826f5eb6f088379f7ccb30a40.png

4.2基于MilvusAI搜索应用

776f6d04aed86cd5d7b91e61f3615609.png

客户除了知识库问答之外,也对我们提出了需要具备AI搜索的能力,既能够检索联网信息,可以基于联网能力在极短的时间内构建行业基础知识库。同时也需要能够搜索本地数据,并且完成复杂的搜索任务。进一步的分析图表的呈现以及分析报告出具。该功能同样依赖于向量库的强大支持,Milvus作为向量数据库,确保信息检索的全面性与精准性。向量库作为核心组件,其应用深度与广度贯穿了我们产品的整个生命周期。

4.3基于Milvus的AI长文档编写应用

在提升查询效率的基础上,我们进一步开发了长文档写作功能,赋能用户撰写超长文档。这个过程中,用户可便捷地引用既存素材与资料,这得益于Milvus向量化存储和检索。

帮助用户快速找到相关文档或段落,提升写作效率和质量。

7d04fc204ae643deafc055ab8302ed55.png

4.4基于Milvus的大模型一站式开发应用

除了开箱即用的功能之外,还可以在不满足预制模型的情况下进行数据标注、模型训练部署、AI应用构建等功能,通过我们精心设计的三步操作流程,能够高效实现企业私有化大模型的落地,而这一过程中,Milvus的应用更是不可或缺,它作为关键组件贯穿于数据工程、模型训练与部署等多个环节。

第一步,数据工程模块:

  • 公开数据集采集:从互联网收集领域相关数据,通过处理与标注形成训练集。

  • 自动数据标注:利用模型自动标注和合成数据,解决数据量少和标注难题。

  • 数据处理Pipeline:内置工具去重、去隐私、统一编码等,辅助数据清洗。

  • 数据质量校验:校验数据质量,提供评判依据。

    ‍‍

82b98b9a83533b563ea82fd4916d54e1.png

Milvus应用场景:

在数据质量校验过程中,涉及到对数据的存储、检索和对比,在标注以及检查的过程中,尤其是当数据量庞大且需要高效处理时,Milvus作为向量数据库,能够支持高效地向量相似度搜索,有助于快速识别和验证数据质量。

第二步,模型训练:

  • 选择算力:通过平台选择适合的算力资源,无论是专属还是共享。

  • 选择模型:从内置的上百款不同参数的大模型中选择所需模型进行训练。

  • 选择数据集:选定先前准备的一个或多个数据集进行训练。

c87c5d75c1c8d91e94b76574cd241a9d.png

Milvus应用场景:

在模型训练完成后,数据的管理和更新变得尤为重要。Milvus作为向量数据库,能够有效地存储和管理海量向量数据,包括数据集向量、训练日志、图表数据等。通过Milvus,用户可以高效地查询、检索和更新这些数据,为模型的持续迭代和优化提供有力支持。

2725f872ccae3f866d03e4f51e66406f.png

在模型评估阶段,Milvus可以发挥重要作用。通过对模型输出结果的向量化处理,用户可以利用Milvus进行高效的相似性搜索和分析,从而评估模型的准确性和泛化能力。此外,Milvus还支持对时序数据的预测分析,帮助用户更全面地了解模型在不同场景下的表现,为后续的模型优化和部署提供重要参考。

第三步,部署及应用构建:

  • 模型部署:用户可以直接部署或导出训练完成的模型,以便于快速测试和应用构建。

  • 应用编排:将业务节点与大模型整合,打造定制化的大模型应用,无论是企业还是个人都能灵活构建。

ea4d21150f4881518bbf145167d7e334.png

f759a26d106357e76ebd99107bd7fc51.png

Milvus应用场景:

模型部署,需对模型进行持续优化或监控其性能时,Milvus可用于存储和分析模型的运行数据(如输入、输出、性能指标等),通过向量化技术,实现快速检索和对比不同版本的模型表现,为模型的优化提供数据支持。

在应用编排过程中,若涉及到需要处理或检索大量结构化、非结构化数据时,Milvus可作为底层数据库支持,提供高效的向量相似度搜索功能,加速业务处理流程。

05.

选择Milvus

在进行向量库选型的时候,我们基本上一开始就决定了选择Milvus作为我们的核心支撑,这一决策背后,是我们基于多维度指标的全面考量与深思熟虑。当时我们评估的主要指标就是:成熟度是否高、可扩展性是否强、是否拥有庞大的用户基数、是否拥有完整的生态、是否适配国产化、是否足够的方便易用。

多个算力中心稳定运行半年以上

我们首要关注的是其成熟度。Milvus作为成熟的向量数据库,经过多个版本的迭代与优化,其系统稳定性和兼容性得到了广泛验证。在关键业务场景中,Milvus能够确保数据的高可用性和低故障率,减少因系统不稳定导致的业务中断风险,我们在10个以上的算力中心稳定运行6个月以上,保障了众多用户的业务稳定运行。

维护成本降低30%

紧接着,我们审视了Milvus的可扩展性以及生态支持。Milvus支持水平扩展,能够轻松应对数据量的快速增长。随着业务规模的扩大,Milvus能够无缝扩展存储和计算能力,确保查询性能不受影响。相比传统数据库,Milvus在扩展性方面的优势以及庞大与生态系统的完整性也是我们不可忽视的重要因素,它们为我们提供了丰富的实践经验与强大的社区支持。这种强大的社区支持能够加速问题的解决,提高开发效率,作为整个应用的核心组件我们整个实施以及维护成本至少降低了30%。

多模态能力综合效率提升50%以上

最新版本的 Milvus 推出了 Hybrid Search 功能,大幅提升了多模态 RAG(Retrieval-Augmented Generation)流程的构建效率。单表默认支持多达 4 列向量,最多可支持 10 个向量列。在实际应用中,这一功能在我们应用场景中,综合效率提升达到了50%。同时,Milvus 原生支持多种融合策略,包括基于排名的 RRF(Ranked Retrieval Fusion)和基于得分(距离)的加权平均算法 WeightedRanker,这些策略在多模态检索与问答系统中实现了性能提升,查询准确率提高了,显著增强了系统的整体效率和效果。

综上所述,选择Milvus,是我们对技术前瞻性、实用性与可持续性的共同追求。

06.

总结

感谢 Milvus 向量数据库全体团队,其提供的稳定向量检索能力、多样化功能特性,极大地简化了我们在向量检索场景下构建业务系统的流程,其卓越的分布式扩展能力更是有效应对了数据量的持续增长,确保了系统的稳定运行。得益于Milvus的强大支持,我们成功推出了可私有化部署的应用平台,实现了客户真正的开箱即用体验,同时预留了灵活的空间,在现有需求未满足时,便于进行模型的进一步训练与优化。

aebc503688c76c9046a311a37f8bea39.png

目前,我们的平台已全面适配国产的NPU芯片,鉴于Milvus已展现出对GPU加速的良好支持,也期待后续能够支持到NPU以及多种其他芯片的加速。

并且最重要的是,我们的大模型开发平台即将开源,我们将会把技术成果贡献给社区,促进技术交流与共享。

推荐阅读

bd09a92392f4384168a9806be366922d.png

c4503f98e8a58c2025f56d4d96dd883f.png

db7a171e5672b06f0a93d70204f14916.png

dbfc533e9f891902a5537b8ff7fda3db.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2073648.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

推荐3款好用的电脑动态壁纸软件,资源丰富,图片精美

WinDynamicDesktop WinDynamicDesktop是一款将macOS Mojave的动态桌面功能移植到Windows平台上的开源软件。它允许用户根据时间、地点和天气等条件自动更换壁纸,从而实现类似macOS系统中的动态壁纸效果。 该软件的主要特点包括: 动态壁纸:W…

查找1

一、查找的基本概念 二、线性表的查找 1)顺序查找(线性查找) 2)折半查找(二分或对分查找) 3)(分块)索引查找

具有宽输入电压范围的75V同步降压控制器LM5145

芯品快报:亚德诺(ADI)汽车音频总线AB收发器AD2428 这周末,除非外面下钞票,否则谁也拦不住我玩《黑神话悟空》(附:两款可以玩转悟空的显卡推荐) LM5145是德州仪器推出的一款具有较宽输入电压的75V同步降压控制器,其输入电压范围可达6V~75V,具有0.8V~60V可调整的输出…

【研发日记】嵌入式处理器技能解锁(五)——TI C2000 DSP的中断系统

文章目录 前言 背景介绍 中断框架 外设中断 ePIE模块 CPU中断 中断嵌套 应用实例 总结 参考资料 前言 见《【研发日记】嵌入式处理器技能解锁(一)——多任务异步执行调度的三种方法》 见《【研发日记】嵌入式处理器技能解锁(二)——TI C2000 DSP的SCI(串口)通信》 见…

大数据中台建设整体技术方案(中台设计)word完整版

1. 中台概念 2. 推动企业组织模式演进 3. 建设方法 4 .中台内容 5. 数据安全体系 中台内容围绕数据中台建设评估、整体框架、数据采集,结构化、半结构化、非结构化的数据采集,数据计算能力、存储计算引擎、数据架构、数据挖掘、各种不同数据层建设、模型…

ssrf+redis

curl支持很多协议,有FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE以及LDA dict被禁用了用(?urlhttp://172.19.0.3端口)来探测一下端口吧 172.19.0.3主机只开放一个80端口 看看内网还有其他服务器没 这里可以看到内网还有一台172.1…

【Python】给动态图片加水印

文章目录 原文:https://blog.c12th.cn/archives/35.html前言部分代码ini文件CMD 完整代码使用教程(打包整理后文件)注意事项 最后 原文:https://blog.c12th.cn/archives/35.html 前言 之前 图片加水印 是对于静态图片,而现在这个是对动态图片…

一个快速简单的工具来分析SSL/TLS协议数据帧 (C/C++代码实现)

SSL/TLS协议是网络安全通信的基石,它通过在客户端和服务器之间建立一个加密的通道,确保数据传输的安全性和完整性。SSL(Secure Sockets Layer)最初由Netscape公司开发,而TLS(Transport Layer Security&…

Renesa Version Board开发RT-Thread 之UART驱动应用

目录 概述 1 硬件介绍 2 软件配置 2.1 RT-Thread Studio配置参数 2.2 FSP配置MCU 3 RT-Thread中UART的接口介绍 3.1 RT-Thread UART简介 3.2 RT-Thread 下的UART接口 4 UART的应用 4.1 应用功能实现 4.2 源代码文件 5 测试 程序下载地址: RenesaVersio…

Open3D 最小点约束的体素滤波(34)

Open3D 最小点约束的体素滤波(34) 一、算法介绍二、算法流程三、算法代码四、实现效果一、算法介绍 体素滤波可以达到快速减少点云数量的目的,而海量点云往往是需要这一步骤才可以进行后续处理的,比如配准时使用千万级别的原始点云配准显然是不合理的,因此体素滤波是比较重…

Mybatis搭建配置文件基础用法参数传递

背景介绍 Mybatis原是Apache的一个开源项目iBatis 2010碾开发团队转移到谷歌旗下改名为Mybatis Mybatis介绍 Mybatis是一个优秀的数据持久层框架(dao层 数据访问层 数据持久层) Mybatis是对jdbc进行封装,比见面jdbc这手动设置参数,手动映射结果的操作 Mybatis是将jdbc中的…

高变比LLC谐振变换器中“十”字型低匝比平面变压器设计

导语 为了解决高变比LLC谐振变换器的变压器绕组匝数过多、绕组结构复杂这一技术瓶颈背后的核心科学问题,本文提出一种“十”字型低匝比平面变压器,用于高变比LLC谐振变换器。 1.0引言 大数据中心的建设离不开供配电系统—电源设备的建设,为大…

15天速通java基础:java(J2SE)阶段学习总结(数据类型、数组、方法、面向对象、异常处理、容器、流、多线程、网络编程)

有一段时间没有写博客了,我这段时间去学习java了,谁也不会想到,短短两周的时间,我的java学习已经学习了不少东西了,毕竟python这座山也可以去攻java这块玉,对应python那就是基础的大部分内容,不…

吴恩达机器学习课后作业-06支持向量机(SVM)

SVM 线性可分SVM题目绘制决策边界改变C,观察决策边界代码 线性不可分SVM核函数代码 寻找最优C、gamma垃圾邮件过滤 线性可分SVM 题目 数据分布 绘制决策边界 import numpy as np import matplotlib.pyplot as plt import scipy.io as sio from scipy.optimize import minimi…

电子电路学习之二极管-1

特别感谢:B站博主:唐老师讲电赛 工科男孙老师 本文图片出自两位博主视频 再次感谢 1 半导体 1. 本征半导体 (Intrinsic Semiconductor) 定义:本征半导体是指纯净的、不掺杂任何杂质的半导体材料,如硅(Si)…

日本人形机器人仿真环境搭建

机器人 官网在这里 http://ai2001.ifdef.jp/uvc/uvc.html 我们可以下载他们的源码 ODE引擎安装 这个是刚体动力学模拟引擎,我用的是windows,大家可以自己参考着官网来(http://ode.org/wiki/index.php/Manual#Install_and_Use)…

【SpringBoot】自定义spring-boot-starter

目录 定义和目的# 命名规范# 准备阶段# 开发步骤# 一、创建 Starter 项目# 二、导入必要的依赖# 三、编写属性类# 四、自定义业务类# 五、编写自动配置类# 六、编写 spring.factories# ​编辑 七、编写配置提示文件# 八、测试 starter# 测试 starter# 一、导入自…

如何玩转CentOS Linux内核升级?手把手教你内核编译升级至最新版本

文章目录 如何玩转CentOS Linux内核升级?手把手教你内核编译升级至最新版本1 升级环境2 升级需求2.1 升级前的内核版本2.2 升级后的内核版本 3 升级步骤3.1 安装编译环境3.2 更新GCC版本3.2.1 多GCC版本共存3.2.2 永久替换旧的GCC 3.3 下载内核源代码并解压3.4 配置…

《数据结构》(408代码题及应用题)(王道收编真题)

一、线性表 1、线性表的线性表示 分析: “循环”左移,那这个循环就应该是我们需要重点思考的点。先考虑最简单的我们可以设置两个数组,其中一个数组保存的是原数据,另一个初始为空。接着想要实现循环左移就只需要找出相对应的位…

2002-2023年中债国债3年期到期收益率

国债是一种政府发行的债券,它为投资者提供了一种相对安全的投资渠道,因为背后有国家信用的支撑。国债的发行可以帮助政府筹集资金,用于公共支出、基础设施建设、社会福利等项目。国债通常分为两种形式:固定利率国债和浮动利率国债…