Dopple Labs 选择 Zilliz Cloud 作为安全高效的向量数据库

news2024/9/20 9:41:09

一直以来,我都十分赞同采用通用的标准来评估机器学习领域的技术。向量数据库领域也是如此。Zilliz 发布的性能测试对我有着很大的帮助。

——Sam Butler

Dopple.AI 机器学习总监

01.Dopple AI简介

Dopple Labs Inc. 是 Dopple.AI 的原厂,通过提供创新平台,彻底改变人类与 AI 的交互方式。Dopple.AI 可通过 iOS 和 Android 下载。使用 Dopple.AI 后,用户能够创建逼真的 AI 克隆体(亦称为 “Dopples”),无缝集成视频、音频和消息传递,获得沉浸式体验。

本质上,Dopple.AI 利用了 Llama2 —— 先进的 LLM 技术。用户可以与 Dopples 聊天互动。无论是 Dopple Labs 还是用户自己创建的 Dopples,都可以根据用户的输入和提示模拟现实中的对话。

最近,Dopple Labs 推出了突破性的图像回应功能,通过图像中附带的丰富情感,增强了用户与 Dopples 之间的互动。此外,声音字幕和实时音频流媒体功能进一步提升了音视觉体验,促进了用户与 Dopples 之间更深层次的连接,提升了用户对话参与感。

随着 Dopple.AI 不断发展创新,它重新定义了人与个性化 AI 克隆体之间互动的方式。

02.用户痛点:将历史聊天记录增加到Chatbot中

Dopple AI 的用户对平台 AI 角色有着深入了解,采用高级技术塑造 Dopples 以及与 Dopples 之间的互动。他们利用消息编辑和 reroll 功能来引导对话,打造个性化的交流体验。本质上,用户充当“Prompt工程师”,巧妙地与 AI 角色进行对话。用户通过策略性的 Prompt 和编辑引导对话,根据自己的偏好和目标矫正 Dopples,并与其实时互动。

在机器学习总监 Sam Butler 的带领下,Dopple.AI 团队通过使用检索增强生成(RAG)技术来实现内存存储系统,存储对话摘要,从而构建这类功能。在此过程中,需要获取几条消息作为上下文,主消息作为他们想要存储记忆的内容。然后他们使用另一个 LLM 创建这些消息的摘要。生成的摘要被转化为 Embedding 向量并存储在向量数据库中。

当用户提交查询时,查询被转换成一个新的 Embedding 向量,然后在向量数据库中搜索与之相似的 Embedding 向量。这样一来,用户就能够在对话中带入上下文,帮助 LLM 获得长期记忆的能力。例如,如果用户向 Dopples 提问:“我的宠物鱼叫什么名字?”而此前已经发生过关于宠物鱼的对话,那么他们的查询会被转换为 Embedding 向量,根据上下文从向量数据库检索出宠物鱼的名字。

03.控制Chatbot对话内容

用户可以编辑他们的最后一条消息,从而精炼与 LLM 的对话。如果他们收到的回复不满意,可以选择“reroll”而不改变最后一条消息,促使 LLM 提供新的回答。此外,用户可以修改他们的最后一条消息来改变 LLM 的回应,逐步塑造对话,让对话内容以他们期望方向的进行。这种十分受用户欢迎,尤其是那些有明确对话目标的高级用户。相反,新手或不常用的用户可能会更被动,让对话自然展开。然而,Dopple AI 的核心用户群通常参与度更高,把对话当成是一项任务或角色扮演,因此更需要把控对话内容。

每个对话摘要会被存储为数据库中,具有唯一性,允许根据用户名有效过滤。摘要是通过将每三或四条消息合并为一个大的摘要生成的,然后无缝插入到向量数据库中。这一过程不断积累,成为对话记忆和上下文。除非用户明确删除对话记录,否则所有记忆将被保留,相关的记忆也会被删除。

这种 RAG 应用更注重娱乐价值而非回答准确性。

04.解决方案:使用安全、高性能的Zilliz Cloud向量数据库

Sam Butler 主要负责协调 ML 团队。他还负责与前端团队合作,搭建应用和网络平台。他们面临的最大挑战之一,就是紧跟最新的模型进展。随着新模型不断涌现和最先进技术的演变,跟上步伐需要付出巨大努力。这就是与像 Zilliz 这样的全托管服务提供商合作的价值所在,Zilliz 能够让其用户专注于核心产品。

由于 Sam 团队需要大规模检索服务,并且要求索引具有可扩展性,他们放弃了 Pinecone,转而使用 Zilliz Cloud。尽管 Pinecone 提供了全托管服务,但缺乏他们所需的细粒度权限控制和真正有效的扩展能力。随着 Dopple.AI 数据量不断增加(预计达到数亿到数十亿),他们需要寻求一种能够有效扩展的解决方案。最终,他们选择 Zilliz Cloud。

在使用 Pinecone 遇到挑战后,Sam 探索了不同向量数据库,查阅了向量数据库性能测试,最终发现了 Zilliz Cloud。Dopple AI 的团队特别对性能测试结果十分感兴趣,并十分期待进一步对其进行探索。

05.Dopple LAbs:展望未来

Sam 和他的团队最近通过引入视听体验来增强服务。他们首先集成了图像回应功能,为每个角色提供了大约 800 到 900 张图像,描绘了 30 种情绪——每种情绪都有几个不同的版本。在推理过程中,另一个语言模型确定响应的情绪,并从相应的情绪类别中随机选择一张图片以确保多样性。此外,他们还引入了声音字幕功能,并从推理提供商流式传输角色到 ElevenLabs 以实现实时音频流。这种同步的视听体验会在应用中显示表情回应的图像和文本。除此之外,他们还计划添加 Glide 语音通话、动态图像和视频。最终,用户可以通过 FaceTime 与他们的 Dopples 进行实时对话。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1995734.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

我是如何选择适合我的电脑的

当前有什么可以供自己选择 将从便携、性能、价格、游戏、视频剪辑、高性能、接口、屏幕、使用感受等方面考虑(超出普通人范围电脑不考虑) 非苹果: 轻薄笔记本:最便捷办公笔记本:游戏笔记本台式电脑台式游戏电脑台式高性能电脑 苹果&#…

ROM修改进阶教程------修改rom 内置app的几种方法与注意事项 以及运行库中arm64 .rmeabi-v7a与armeabi 区别

在定制rom的过程中。内置app是很多rom爱好者必须的技能之一。但对于初学者来说。会遇到内置的app无效果或者出现运行有bug的情况。内置app需要根据安卓版本的不同略有变化 .在高安卓版本中还需要内置apk的运行库。 通过今天的博文了解; 1-----内置APP的几种方式步骤 2-----视…

OpenHarmony南向开发 SA服务SELinux权限配置一站式傻瓜式教程

Selinux权限配置 OpenHarmony中SELinux使用详解 目录 SELinux简介SELinux概念SELinux模式OH中SELinux使用详解新增SA服务如何配置SELinux权限SELinux简介 SELinux是Security Enhanced Linux 的缩写,也就是安全强化的 Linux,旨在增强传统Linux操作系统的安全性,解决传统Li…

关于使用webflux开发思考

1、目前终于看到有系统使用spring的webflux进行系统开发,主要原因是比如gpt、千问的大模型数据返回都支持流式方式返回,比如和用户对话,可以流式的把数据给用户展示,不用一次性把数据展示到页面上。 webflux还有一个能力就是&…

MongoDB笔记1——MongoDB简介

MongoDB 什么是MongoDB 2007年10月,MongoDB由10gen团队所开发,2009年2月首度推出。 基于分布式文件存储的数据库由C语言编写。旨在为WEB应用提供可拓展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库(NoSQL&…

东芝新小黑移动硬盘数据被格式化如何恢复(2024年8月版)

在数字化时代,数据已成为我们生活和工作中不可或缺的一部分。东芝新小黑移动硬盘,以其便携性和大容量,成为许多用户存储重要数据的首选。然而,当这些宝贵的数据因意外格式化而面临丢失的风险时,我们该如何应对&#xf…

Visionpro二次开发学习笔记7-使用CogToolDisplay控件

CogToolDisplay控件可显示与视觉工具记录相关的图像,图形和其他状态信息。它使用CogRecord和ICogTool接口将图像和图形连接到CogDisplay。 图片清单 控件的CogComboBox列出当前记录及其子记录中的图像和图形。您可以单击列表并选择要显示的图像或图形。如果记录层…

基于springboot3实现单点登录(二):认证服务端搭建

前言 上文我们介绍了oauth2.0的相关理论和流程,本文我们继续实现。 Oauth2协议中有个很重要的概念,叫做”端点“, 以下整理了一些常用的端点及其参考访问路径及使用场景的信息,供参考。 这些端点在oauth2.0协议的整个生命周期…

白嫖不是梦,三分钟搞定一台服务器

在知乎上浏览时,我偶然发现了一个引人入胜的话题。这个话题附带了一张Excel表格的截图,表格设计得非常巧妙。它允许用户输入包括日薪、工作时间、通勤时间、休息时间以及学历等在内的多个变量。通过这些输入,表格能够计算出一个反映工作性价比…

JAVA—正则表达式

关于正则表达式的了解学习,以及用于校验格式,信息查找和替换分割内容。 目录 1.概述 2.书写规则 3.应用案例 4.用于信息查找 5.用于搜索替换,分割内容 1.概述 由一些特定的字符组成,代表一个规则 作用: 1.校验数据…

国外高清风景视频素材无水印哪里找?

哪里可以下载国外高清风景视频素材?有哪些高清海外素材网站?作为一名从业多年的视频剪辑师,今天就来给大家揭秘可以下载国外高清风景视频素材的网站,赶紧进来看看吧~ 1. 稻虎网 稻虎网作为国内外知名视频素材网站&a…

【机器学习】 Sigmoid函数:机器学习中的关键激活函数

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 Sigmoid函数:机器学习中的关键激活函数1. 引言2. Sigmoid函数定义3.…

C++day04

1】思维导图 2】完成关系运算符重载&#xff0c;实现成员函数和全局函数的版本。 #include <iostream>using namespace std;class Stu { friend bool operator<(const Stu &L,const Stu &R); private:int age;int id; public:Stu(){}Stu(int age,int id):age…

OD工具-18个实操工具共创会

一、什么是共创会1.1 什么是共创共创&#xff0c;共同创造词组的缩写&#xff0c;字面上来看就是团队为了多个个体一起把以前没有的事物给产生出或者造出来&#xff0c;这明显的是一种典型的人类自主行为。 托德老师有一段描述:共创是一种工作状态&#xff0c;让团队中的每个个…

【时时三省】(C语言基础)操作符3

山不在高&#xff0c;有仙则名。水不在深&#xff0c;有龙则灵。 ----CSDN 时时三省 &取地址操作符 示例: 每个内存单元都有自己的编号 编号就成为内存单元的地址&a就是找出a的地址 后面可以加一个int *pa&#xff1d;&a 是可以用来存放地址 pa是用来存放地址的…

SQL进阶技巧:有序数据合并问题之如何按照指定的规则对数据进行合并?【详解collect_list函数有序性保证】

目录 0 问题描述【小红书面试题】 1 数据准备 2 问题分析 3 小结 0 问题描述【小红书】 有如下需求,需要将左边的表变换成右边的表,注意字段内容的顺序及对应内容的一致性。 第一个字段为name,第二个字段为subject,第三个字段为score,变换后要求subject按照语文、数学…

电脑管家软件搬运导致edge、chrome浏览器不可用

最新版本的腾讯电脑管家可以直接搬运软件到其他路径&#xff0c;但是搬运浏览器会造成软件问题&#xff0c;不建议搬运。 浏览器恢复到原路径&#xff0c;可以解决浏览器不可用的问题&#xff1a; 首先到达你的搬运路径下 可以看到软件文件夹&#xff0c;比如Microsoft Edge或…

C++11——包装器和绑定

1.包装器 C中有一些可调用对象&#xff0c;比如 函数指针&#xff0c;仿函数对象 lambda等等&#xff0c;但是他们又有缺点 因此就引出了包装器的概念 包装器 function的头文件是<functional> 我们可以用包装器包装函数指针&#xff0c;仿函数&#xff0c;lambda int …

关于LLC知识5

RLC的增益曲线不知一条 频率升高&#xff0c;增益会越来越低 无论在容性区还是感性区&#xff0c;当负载加重的时候&#xff0c;R阻值会变小&#xff0c;所以R的分压也会变小&#xff0c;导致增益会变低 当负载突然加重&#xff0c;输出电压会变低&#xff0c;增益曲线由红色变…

MySQL数据分析进阶(十二)设计数据库——PART3

※食用指南&#xff1a;文章内容为‘CodeWithMosh’SQL进阶教程系列学习笔记&#xff0c;笔记整理比较粗糙&#xff0c;主要目的自存为主&#xff0c;记录完整的学习过程。&#xff08;图片超级多&#xff0c;慎看&#xff01;&#xff09; 【中字】SQL进阶教程 | 史上最易懂S…