客户案例|100M 768 维向量数据,Zilliz Cloud 稳定支持 Shulex VOC 业

news2024/11/15 19:45:55

日前,国际化 VOC SaaS 公司数里行间(Shulex)将上亿数据量的核心业务从开源向量数据库 Milvus 迁移至全托管的向量数据库云服务 Zilliz Cloud。

相比于 Milvus,Zilliz Cloud 实现了 Shulex VOC 评论分析洞察报告生成速度 30% 的提升,VOC 智能客服召回率 98%,且系统稳定,0 宕机,大大降低了企业在向量数据库的运维成本。

alt

01.从内卷到出海,Shulex 为电商打造基于大模型的 VOC 服务

近几年,国内电商市场竞争日益激烈,跨境电商异军突起,这也无形中增高了中小商家入局的门槛,Shulex 正是在这样的背景下迅速崛起。Shulex 专注品牌出海,面向海外客户和中国出海客户,基于大模型为企业提供 VOC SaaS 服务,帮助企业通过数智化来引领产品创新、驱动客户品牌增长。

02.从 Milvus 到 Zilliz Cloud,向量数据库支撑 Shulex 核心业务场景

随着业务的高速发展,仅在 VOC 评论分析业务上,Shulex 就训练了 10,000 条以上电商类目的评论标签,产生了上亿规模的向量数据。以往基于开源向量数据库 Milvus 自建方案,费时费力,稳定性无法保障,运维成本非常高昂,当出现故障的时候往往需要几个小时甚至一天才能恢复,运营疲于处理由于系统不稳定导致的客户吐槽和投诉,客户满意度也持续走低。

Shulex 技术专家李辰辉表示:“业务发展到这个阶段,对向量数据库的要求也就更严苛了,要能弹性扩容以支撑海量的向量存储与搜索,向量匹配速度要更快、SLA 足够高,运维成本一定要够低。”

在与 Milvus 的背后商业公司 Zilliz 的专家团队进行充分沟通后,Shulex 技术团队决定将核心业务的向量数据库部分搬迁至 Milvus 的全托管云服务 Zilliz Cloud 上。目前 Zilliz Cloud 主要支持了 Shulex 的 VOC 评论分析及智能客服两大块核心业务。

| 文本搜索场景——VOC 评论分析

Shulex 是排名第一的 Amazon ChatGPT 选品工具,而 VOC 评论分析服务核心是通过向量数据库对海量的 Amazon 评论/社媒数据,进行分类打标和实时分析,为客户提供实时的商品评论洞察报告,包括但不限于:用户画像、使用场景、购买动机、商品卖点、商品不足点等。

向量数据库是该业务场景的关键组件,基于 Zilliz Cloud 的 VOC 评论分析流程包含建库、选品、分析样本、全量打标、报表生成 5 个步骤,具体来看:

  • 建立用来判断评论的标签库:在向量数据里面存储的表结构包括评论文本、评论的 embedding、评论的正负情感标签等等;

  • 选择待分析的商品类目:在上万个类目的商品中选择感兴趣的品类作为后续进行评论分析的对象;

  • 基于大模型的评论分析:选择上一步中品类的数万条评论(包含正负评论、意思相近的评论)输入给大模型,让 GPT-4 对每个评论进行标签,将这些标签而后进行聚类后生成标签的样本库;

  • 用向量数据库做分类打标:将生成的标签样本输出给向量数据库里进行该类目商品的全部评论 embedding数据的检索,结合向量数据库来进行分类,判断这些评论的正负情感;

  • 生成结构化的统计报表:基于向量数据库的分类情况,进行用户对该商品属性的情感、正负向的分析,然后生成报表。

alt 图 1 |基于 Zilliz Cloud 的 VOC 评论分析流程

Zilliz Cloud 的引入在 Shulex VOC 评论分析业务中取得的收益显著,总结而言包括以下几点:

报表生成速度提升 30%:Zilliz Cloud 提供更高性能的向量搜索能力,其搜索引擎性能比开源 Milvus 提升超过 5 倍,稳定支持了 1000 QPS 的商品评论的高频次搜索。同时,相比于 Milvus,搜索时延降低了 50%,这使生成结构化的统计报表速度提升 30%;

数据分析成本降低 50%:由于无需将所有的商品评论信息通过大模型进行分析来获取评论标签,仅需要基于评论原文与向量数据库,实时召回评论标签即可生成高质量标签,去除了对大模型的依赖,极大的降低了评论数据分析的成本。

分钟级响应大促等突发流量:对于突发的客户访问量剧增,如大促周期,以往需要客户请求排队半个小时甚至 1 个小时,而 Zilliz Cloud 支持弹性扩缩容,集群增减分钟级即可完成,客户排队的状况也顺利解决。

| 大模型 RAG 应用——VOC 智能问答系统

Shulex 提供 VOC 企业智能问答系统,通过训练企业与外部数据,自动解析成 FAQ,2 分钟生成专业客服机器人,可以显著提升响应效率,同时降低运营成本。

alt 图 2 |基于 Zilliz Cloud 的 VOC 智能问答系统

当前,Shulex VOC 智能客服业务采用大模型+向量数据库的标准范式构建了 RAG 应用,除了自动提取公网链接,还将企业文件、邮件、工单等多渠道的知识 embedding 后存入 Zilliz Cloud 来构建企业专属知识库,为大模型增加外接记忆体。而 Zilliz Cloud 使得大模型能够快速有效地检索和处理大量的向量数据,实时召回知识,稳定支撑 Shulex VOC 智能客服业务每秒 90 次的客户询问,稳定召回率在 98% 以上,据统计,Shulex 智能客服机器人已经可以承担 80% 以上的客服工作。

03.客户说

Shulex CTO 潘胜一表示:“从开源的向量数据库 Milvus 切换到托管云服务 Zilliz Cloud 后,我们的业务收益显著提升,实现了更低的运维成本、更高的业务速度、更灵活的系统架构以及更稳定的用户体验。通过使用 Zilliz Cloud,我们能够享受到专家团队的支持,他们能够高效沟通并快速解决业务中遇到的问题。总的来说,Zilliz Cloud 为我们带来了更大的便利和竞争优势,我们对这一转变感到非常满意和乐观。”

04.关于 Zilliz

Zilliz 作为向量数据库技术的开创者,推出的全球最受欢迎的的开源向量数据库--Milvus,受到了全球 5000 家以上企业用户的支持与青睐。2023 年,Zilliz推出了基于 Milvus 的全托管云服务 Zilliz Cloud。

截至目前,Zilliz Cloud 已实现全球 4 大云 11 个节点的全覆盖,是全球首个提供海内外多云服务的向量数据库企业,其企业注册用户已超过 40,000 家,付费用户遍及全球多个国家和地区,覆盖 AIGC 领域、电商、在线教育等场景。作为 AIGC 关键基础设施和 RAG 技术的基本组件提供商,Zilliz 完成了与全球头部大模型生态的对接,赋能大模型应用落地。

加入 Zilliz AI 初创计划

Zilliz AI 初创计划是面向 AI 初创企业推出的一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。点击 https://zilliz.com.cn/ 了解更多。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1508950.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

伊芙丽签约实在智能,实在Agent数字员工助力品牌效能飙升

近日,国内知名时尚女装品牌伊芙丽与实在智能达成合作,引入业内领先的平台级自动化产品实在Agent数字员工——取数宝,自动获取天猫、淘宝、抖音等线上平台营销数据,开启全域化营销的“提效之旅”。 实在Agent智能体 伊芙丽集团成立…

2024年AI辅助研发趋势:AI辅助科技发展

目录 前言 一、AI辅助研发的技术进展 (一)深度学习在研发中的应用 (二)强化学习在研发中的应用 (三)生成模型在研发中的应用 (四)技术如何推动研发效率的提升 二、2024人工智…

谷歌浏览器如何使用词令官网直达快速打开微博官方网站?

谷歌浏览器如何使用词令官网直达快速打开官方网站? 1、电脑上打开谷歌浏览器,选择打开词令官网直达网站; 2、打开词令关键词口令直达网站; 3、输入网站名称或点击热门历史词令中的网站名称; 4、输入词令搜索直达进入微…

【好书推荐-第十一期】《Java面试八股文:高频面试题与求职攻略一本通(视频解说版)》(博文视点出品)

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公众号:洲与AI。 🎈 本文专栏:本文收录…

如何利用AWS CloudFront 自定义设置SSL

Amazon CloudFront 提供三种选项,可以加速整个网站并从 CloudFront 的边缘站点通过安全的 HTTPS 方式交付内容。除能够安全地从边缘站点交付内容外,您还可以配置 CDN 来使用针对源提取的 HTTPS 连接,这样您的数据就会实现从源到最终用户的端到…

几种摩擦力模型

文章目录 1 摩擦力特性分析1.1 预滑动特性及摩擦滞回1.2 非局部记忆效应1.3 临界摩擦力1.4 低速爬行现象1.5 Stribeck 效应1.6 摩擦滞后特性1.7 法向与切向摩擦力的耦合2 摩擦力数学模型2.1 静态摩擦模型2.1.1 库伦+粘性摩擦模型2.1.2 Stribeck模型-指数型摩擦模型2.2 动态摩擦…

python学习28

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

【Ubuntu】原生Ubuntu-dock 栏 安装与卸载

1.查看是否安装 Ubuntu-dock(新版本的Ubuntu自带Ubuntu-dock version> 18.04) gnome-extensions list 2.安装Ubuntu-dock sudo apt install gnome-shell-extension-ubuntu-dock 3.重启,一定要重启!!!…

Jmter接口网站压力测试工具

首先下载Jmeter 官方地址:Apache JMeter - Apache JMeter™ 安装Jmeter 把下载的文件进行解压,产生如下目录: 打开bin文件夹下的jmeter.bat文件及进入程序的主界面窗体jmeter.log是日志文件。 主意:需要配置java环境。 jmter创…

238.除自身以外数组的乘积

题目:给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且…

Oracle数据库的连接

首先:你要去官网下载一个Oracle数据库,并且把它安装完毕,详细操作,大家可以自行百度下载安装,笔者就不在过多阐述。下面开始讲解Oracle数据库的连接。 2.1.1 启动oracle服务 为了节省资源,建议把其中自动启…

基于数组的顺序表删除操作

删除算法需要注意&#xff1a; 1. 列表长度为0时不能再删除 2.每次删除后长度减一 3.输入删除的数据在原来列表中不存在&#xff0c;不需要改变原列表 #include <iostream> #define MAX 100; using namespace std;int search(int arr[],int len,int n) {for(int i0; i…

MongoDB的count() 统计文档数量非常慢

在MongoDB中&#xff0c;count()函数用于统计文档的数量。但是count()函数通常不会使用索引来计算文档数量&#xff0c;而是扫描集合中的文档来计数。当数据量较大的时候&#xff0c;就不适合使用了。 解决方案&#xff1a; 1、使用聚合框架&#xff08;aggregation framewor…

2024 MCM数学建模美赛2024年A题复盘,思路与经验分享:资源可用性与性别比例 | 七鳃鳗的性别比例变化对生态系统稳定性的影响(四)

审题 第三问要我们评估七鳃鳗的性别比例变化对生态系统稳定性的影响。 这里我们就要去查一下生态系统稳定性的定义。 通过查资料我们知道&#xff0c;生态系统稳定性包括生态系统的抵抗力和恢复力。 OK&#xff0c;到这里问题就变成了&#xff0c;七鳃鳗的性别比例对生态系…

神经网络基本使用

1. 卷积层 convolution layers import torch import torchvision from torch import nn from torch.nn import Conv2d from torch.utils.data import DataLoader from torch.utils.tensorboard import SummaryWriterdataset torchvision.datasets.CIFAR10(./dataset,trainFa…

快速入门:JS对象/BOM/DOM/事件监听

本贴介绍JS相对进阶的知识&#xff0c;对于JavaScript的基础语法&#xff0c;本文不再赘述~ 一.JavaScript对象 1.Array数组对象 定义 var arr new Array(1,2,3); var arr[1,2,3]; 访问 arr[0]1; Js数组类似Java中的集合&#xff0c;长度&#xff0c;类型都可以改变。 如…

数据通信练习题

1.0osi七层模型 应用层 data 表示层 会话层 传输层 数据段 防火墙&#xff0c;端口&#xff08;TCP UDP&#xff09; 网络层 数据包 路由器 数据链路层 数据帧 交换机 物理层 比特流 网卡 2.IP地址分类 私有地址 A类 0--127 10.0.0.0…

如何应对Android面试官->玩转Binder机制,手写MMKV核心实现

前言 本章主要基于面试中的常见问题&#xff0c;进行 Binder 机制的讲解&#xff1b; Binder 是什么&#xff1f; 在 Android 中我们所使用的 Activity&#xff0c;Service 等组件都需要和 AMS 通信&#xff0c;这种跨进程的通信都是通过 Binder 完成的&#xff1b; 机制角度…

强烈推荐—GpuMall智算云实例网盘操作详解

实例网盘为实例的 /gm-fs 目录&#xff0c;该目录为实例同一个数据中心的分布式存储&#xff0c;对于较大的文件或者压缩文件有着出色的读写性能&#xff0c;实例网盘不受实例删除/释放影响&#xff0c;采用分布式冗余存储&#xff0c;数据安全性较高&#xff0c;强烈建议使用网…

Python对头发二维建模(考虑风力、重力)

目录 一、背景 二、代码 一、背景 数值方法被用于创建电影、游戏或其他媒体中的计算机图形。例如&#xff0c;生成“逼真”的烟雾、水或爆炸等动画。本文内容是对头发的模拟&#xff0c;要求考虑重力、风力的影响。 假设&#xff1a; 1、人的头部是一个半径为10厘米的球体。…