数据库信息速递 DataStax与谷歌合作将向NoSQL AstraDB引入向量搜索技术

news2024/9/29 19:25:15

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共870人左右 1 + 2 + 3)新人会进入3群

29bdb90eeee5a09adb2c2ce342ab301d.png

DataStax正在与Google合作,将矢量搜索引入其AstraDB NoSQL数据库即服务中,试图使Apache Cassandra更加兼容人工智能和大型语言模型工作负载。

在生成式人工智能的普及之后,矢量搜索,特别是矢量化,被认为是数据库厂商关注的一个关键能力,因为它可以通过减少数据结构的需要来缩短训练人工智能模型所需的时间,这是目前搜索技术普遍存在的一个做法。相反,矢量搜索可以读取正在查询的数据点的所需或必要属性属性。

DataStax在一份声明中表示:“矢量搜索使开发人员能够通过上下文或意义而不是关键字或文字值搜索数据库。这是通过使用嵌入,例如Google Cloud的文本嵌入API,它可以将语义概念表示为向量来搜索非结构化数据集,如文本和图像。”

Datastax表示,嵌入可以看作是一种强大的工具,它可以在不同格式的大型数据语料库中对自然语言进行搜索,并提取最相关的数据。

分析师们认为,随着企业寻求减少支出并构建基于生成式人工智能的应用程序,矢量数据库被视为2023年的“热门产品”。

据公司表示,矢量搜索以及其他更新将通过由谷歌提供支持的NoSQL Copilot在AstraDB内实现,并且还将帮助DataStax的客户构建人工智能应用程序。

在底层,NoSQL Copilot是将Cassandra的矢量搜索、谷歌云的Gen AI Vertex、LangChain和GCP BigQuery相结合。

DataStax的首席产品官Ed Anuff表示:“DataStax和GCP共同设计了NoSQL Copilot作为一个LLM Memory工具包,然后将其插入到LangChain中,以便轻松地将Vertex Gen AI服务与Cassandra相结合,用于缓存、矢量搜索和聊天记录检索。因此,企业易于构建适用于其业务应用程序的自己的Copilot,并将AI服务组合用于保存在Cassandra中的自己的数据集。”

由两家公司联合开发的开源库使得其可以插入到旨在简化使用大型语言模型开发生成式人工智能应用程序的开源框架LangChain中。

这个名为CassIO的库旨在使将基于Cassandra的数据库添加到生成式AI软件开发工具包(SDK)(如LangChain)中变得更加容易。

DataStax表示,企业可以使用CassIO构建复杂的AI助手、生成式AI的语义缓存、浏览LLM聊天记录以及管理Cassandra提示模板。与Google的其他集成包括使用Google Cloud Console创建和提供基于机器学习的功能,以便使用Google云的企业将数据从基于Cassandra的数据库导入和导出到Google的BigQuery数据仓库。

DataStax表示,与Google的第二个集成将允许AstraDB订阅者将实时数据从Cassandra传输到Google Cloud服务,以监视生成式AI模型的性能。DataStax还与SpringML合作,以帮助加速使用SpringML的数据科学和AI服务来开发生成式AI应用程序。

可以说,建立在Apache Cassandra之上的AstraDB将成为首批将矢量搜索引入开源分布式数据库的之一。数据社区的一篇帖子(DataStax是其中的成员)显示,目前正在计划为Cassandra 5.0版本增加矢量搜索功能。

就可用性而言,DataStax表示,AstraDB的矢量搜索目前仅可以用于非生产工作负载,并处于公共预览阶段。该公司还表示,这种搜索最初将仅在Google Cloud上提供,后来将扩展到其他公共云。

b5f671235b0c0d583675dab3c0ec7727.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687657.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习5:基于线性回归理解减少“损失”的方法

在上节《机器学习4:基本术语》中,笔者介绍了“损失(Loss)”的定义,在训练模型时,减少损失(Reducing Loss)是极为关键的,只有“损失”足够小的机器学习系统才有实用价值。…

【数据库】mysql主从复制与读写分离

文章目录 一、读写分离1. 什么是读写分离2. 为什么要读写分离3. 什么时候要读写分离4. 主从复制与读写分离5. Mysql 主从复制原理(主从复制的类型)6. Mysql 主从复制的工作过程7. Mysql 读写分离原理 二、主从复制的配置操作1. 环境配置2. 搭建 MySQL主从…

从第一性原理揭秘爱因斯坦相对论

摘要: 本文首先将探讨狭义相对论的基本原理及其起源。接着,我们将深入分析狭义相对论的世界观给我们的认知带来了哪些本质的改变。最后,我们将探讨狭义相对论为何无法解决引力的矛盾性问题,以及广义相对论是如何有效解决此类问题的…

最大匹配问题---男女匹配问题(算法)

扯淡: 今天期末复习的时候发现一个算法很有意思,就是男女最大分配对象问题,几对男女最多能凑够几对对象。 根据社会主义核心价值观,我们最好整一夫一妻制,分配一人一对象,我辈义不容辞。 题目分析&#…

需求分析六步法

需求收集可能看起来不言自明,但它很少得到应有的充分关注。就像运动前伸展或睡前刷牙一样,这是一项经常被忽视的简单任务。 但是,忽视这些看似简单的事情的后果可能会导致伤害、蛀牙,或者在项目管理的情况下,导致项目…

GeoServer发布图层遇到的几个雷点及解决方案

目录 前言 一、图层编码导致图层预览无服务的异常问题 1、问题描述 2、问题分析 3、问题解决 二、图层空间参考投影设置的问题 1、问题描述 2、问题分析 3、问题解决 三、Qgis导出的SLD在GeoServer中发布预览报错的问题 1、问题描述 2、问题分析 3、问题解决 四、GeoS…

java 临床症状识别系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目

一、源码特点 JSP 临床症状识别系统 是一套完善的系统源码,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,以及相应配套的设计文档,系统主要采用B/S 模式开发。 研究的基本内容是基于Web的临床症状识别…

一文详解如何用GPU来运行Python代码/基于Python自制一个文件解压缩小工具

前几天捣鼓了一下Ubuntu,正是想用一下我旧电脑上的N卡,可以用GPU来跑代码,体验一下多核的快乐,感兴趣的小伙伴快跟随小编一起了解一下吧 简介 前几天捣鼓了一下Ubuntu,正是想用一下我旧电脑上的N卡,可以用…

Nova代码解析

1. 引言 前序博客有: Nova: Recursive Zero-Knowledge Arguments from Folding Schemes学习笔记基于cycle of curves的Nova证明系统(1)基于cycle of curves的Nova证明系统(2) 微软团队2021年论文 《Nova: Recursive…

警惕2本期刊被剔除!2023年6月EI目录已更新!(附全目录下载)

2023年6月EI期刊目录更新 爱思唯尔官网近日更新了EI期刊目录,此次更新是2023年6月1日,与上次更新(2023年2月)相比,有3本期刊名称在Serials(连续出版)列表中搜索不到,其中&#xff0…

【前端|HTML系列第2篇】HTML零基础入门之标签元素

大家好,欢迎来到前端入门系列的第二篇博客。在这个系列中,我们将一起学习前端开发的基础知识,从零开始构建网页和Web应用程序。本篇博客将为大家介绍HTML(超文本标记语言)常用标签元素,帮助零基础小白快速入…

Upload靶场通关笔记(更新中)

文章目录 一、Pass-011.抓包上传2.获取上传路径3.工具验证 二、Pass-02三、Pass-031.使用httpd.conf自定义后缀2.提取上传文件名3.工具测试4.注意点四、Pass-041.上传.htaccess2.上传图片3.工具测试 五、Pass-05六、Pass-061.空格.号绕过2.工具测试 七、Pass-07八、Pass-081.特…

电气工程师日常工作常遇到的41种接线方法(一)

01 电动机接线 一般常用三相交流电动机接线架上都引出6个接线柱,当电动机铭牌上标为Y形接法时,D6、D4、D5相连接,D1-D3接电源;为△形接法时,D6与D1连接,D4与D2连接,D5与D3连接,然后…

报表软件测评|如何选择一款简单易用的报表开发工具

报表业务的稳定性天生较差,随着业务的推进,会不断产生新的查询统计需求,报表也必须相应地不断增加、修改。这导致报表的数量似乎没有止境。通常情况下,企业信息系统的主要功能模块在上线后相对稳定,不再变化&#xff0…

文心一言 VS 讯飞星火 VS chatgpt (48)-- 算法导论6.1 6题

值为<23&#xff0c;17&#xff0c;14&#xff0c;6&#xff0c;13&#xff0c;10&#xff0c;1&#xff0c;5&#xff0c;7&#xff0c;12>的数组是一个最大堆吗? 文心一言&#xff1a; 是的&#xff0c;这个数组是一个最大堆。 最大堆是一种特殊的二叉树&#xff0…

第十六届CISCN复现MISC——国粹

国粹 不是我说&#xff0c;我当时比赛的时候&#xff0c;在那里叭叭叭的数的老用心了结果他是一道非常不常规的图片密码题&#xff0c;又是一种我没见过的题型 看了一些大佬的解题&#xff0c;知道他是一个坐标类型的图片拼凑 发现很多都提到了opencv&#xff0c;又是一个知识…

Hadoop生态之Mapreduce

今天给大家带来的是Hadoop生态中的Mapreduce&#xff0c;看到这里诸佬们可能就有疑惑了呢&#xff0c;啥是Mapreduce&#xff1f;小小的脑袋大大的疑惑。 在上篇博客中博主使用了王者来举例子&#xff0c;如果把Hadoop当作王者的话&#xff0c;HDFS是后台存储点券数据的系统的…

元宇宙:在虚拟世界里遨游星辰大海

元宇宙是我们探索内心世界需求的一种可能路径&#xff0c;寄托着我们对智慧社会生活的一种向往。针对当前元宇宙热潮产生的一系列问题&#xff0c;我们需要以积极审慎的态度&#xff0c;稳步推动元宇宙产业健康有序发展。 元宇宙总在前进的路上发展 其实&#xff0c;早在几十年…

6.Mysql主从复制

文章目录 Mysql主从复制读写分离概念&#xff1a;读写分离的作用&#xff1a;读写分离的作用条件&#xff1a;主从复制与读写分离mysq支持的复制类型主从复制的工作过程配置时间同步主服务器配置从服务器配置 读写分离MySQL 读写分离原理目前较为常见的 MySQL 读写分离分为以下…

java 影像资料管理系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目

一、源码特点 JSP 影像资料管理系统 是一套完善的系统源码&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;以及相应配套的设计文档&#xff0c;系统主要采用B/S模式开发。 研究的基本内容是基于Web的影像资料管理系…