为大模型添加记忆体,GBASE南大通用驶入向量赛道

news2024/10/7 18:20:58

984448801db0c269873e318b264100a6.png

26e1ffae006b17a75d1e71ab8acabfeb.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


理解、生成、逻辑、记忆是人工智能的四大核心能力。

一段人类的日常对话通常可以分解为引子、记忆、分析三个部分。计算机自然语言处理的解法,AI科学家归纳出一个CPV结构:以ChatGPT为代表的大模型承担“分析”,Vector Database(向量数据库)承担“记忆”,Prompt(提示词)承担“引子”。

向量数据库,正是计算机记忆体一般的存在。AI 2.0时代,一度落寞的向量数据库又一次站在技术最前沿,成为数据库厂商竞相投入研发的对象。

向量数据库,一个计算机超级大脑

向量数据库处理和存储音频、视频、图像等非结构化数据,通过向量嵌入实现相似度检索、模糊匹配,输出概率上最符合条件的答案,在大模型兴起之前便已广泛应用于以图搜图、哼歌识曲等场景。

作为一个超级记忆体,向量数据库可以解决大模型预训练成本高、无长期记忆、知识更新不足的问题,突破大模型在时间上、空间上的限制,加速大模型落地于行业场景。正因为如此,ChatGPT横空出世之后,向量数据库也火爆出圈,成为资本竞逐的对象。

2023年4月,向量数据库厂商Qdrant、Chroma、Weaviate、Pinecone相继获得融资,其中Pinecone融资1亿美元。国内上市公司星环科技、云创数据也经历一波股价上涨。

7月,腾讯云正式发布向量数据库Tencent Cloud VectorDB。9月,国产数据库“老四家”之一的GBASE南大通用在天津软博会期间发布向量数据库GBase Cloud Vector DB。向量数据库与大模型结合,正成为一个超级大脑,将AI 2.0时代引向深入。

GBase向量数据库,支持大模型应用

南大通用的向量数据库GBase Cloud Vector DB在GBase 8a集群架构的基础上开发,一方面继承了GBase 8a高可用、高扩展性性、高安全性的特性,另一方面又通过存储数据向量、使用相似度度量,实现向量数据库的功能。

向量数据库GBase Cloud Vector DB采用存算分离架构,各层均可独立扩展,协调服务层拥有express引擎和向量引擎,存储服务层增加向量类型和索引的存储文件,计算服务层增加向量类型计算支持和向量类常用索引检索算法。整个分布式集群系统既可支持业务职能、报表分析、决策支持等传统分析业务,又可应对图像处理、推荐系统、自然语言处理和机器学习等向量数据业务。

据南大通用董事长丁明峰介绍,向量数据库GBase Cloud Vector DB可处理大规模高维度的向量数据,支持2048维度以上浮点型向量数据的存储和相似度检索,可广泛应用于自然语言处理、图像检索和视频分析等使用场景。GBase Cloud Vector DB可与大模型结合,提升大模型的数据时效性,为大模型提供私域下的专业数据,让大模型拥有长期记忆储存和专业领域知识。

南大通用,打进金融、电信核心系统

2004年成立的南大通用总部位于天津,是国内最早创立的独立数据库厂商之一,与达梦数据、人大金仓、神舟通用并称为国产数据库四朵金花。

经过二十年的发展,南大通用一方面保持交易型数据库、分析型数据库的国内领先水平,另一方面又紧跟云化、分布式等技术演进趋势,不断推出数据库产品。向量数据库GBase Cloud Vector DB的推出,正是南大通用不断创新、持续迭代的又一例证。

数据库与操作系统、中间件并列为三大基础软件,是基础软件皇冠上的明珠。作为第一批国家级专精特新小巨人企业,南大通用一直专注于数据库基础软件研发,产品核心技术、底层代码自主可控。在国家信创产业迅猛发展的大背景下,南大通用与其它国产数据库厂商一起,致力于国产软件生态建设,加快重点行业的国产化替代。

通过构建涵盖数据管理全生命周期、全技术栈的数据产品体系,南大通用在自主研发的GBase系列数据库基础上推出场景化解决方案,为客户量身定制数据库产品和服务。据丁明峰介绍,南大通用的数据库产品已在金融、电信等行业的核心系统实现规模化应用。

文:Bugle-X / 数据猿

85935ffec4dbf44afbb6e74a78decc90.jpeg

e63ad8c119390fe10c9582b846b0f0ae.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/973716.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vmware 网络恢复断网和连接

如果你的 虚拟机无法联网了,比如: vmware 无法将网络更改为桥接状态: 没有未桥接的主机网络适配器 等各种稀奇古怪的问题; 按照下面操作 还远默认设置 包你解决各种问题!

Pycharm----将Anaconda建立的环境导入

首先打开项目设置,点击添加 随后点击现有环境,点击三个。。。号进行添加 最后找到你Anaconda安装文件夹,envs找到你建立的环境名称,找到python.exe将它导入即可让现在的python环境为你建立的环境,同时还需要更改终端方…

接口自动化测试系列-接口测试

接口测试工具-postman 利用postman完成接口测试:官网。 接口一般包含: url:请求地址,如:https://www.baidu.com/ method:请求方式,get,post,update,delete等 headers:请求头 body/params:请求体,post一般存在body中。get请求放在…

苹果手机隔空投送怎么用?隔空投送的使用教程来了!

如何实现苹果设备之间快速高效地传输各种数据?相信我,使用【隔空投送】是大家的不二选择。苹果手机的【隔空投送】功能,即大家口中常说的“Airdrop”,能够让苹果用户实现近距离传输照片、视频、文件等。苹果手机隔空投送怎么用&am…

安科瑞电能质量监测与治理系统的解决方案-安科瑞黄安南

01 电能质量问题及现象 02 电能质量标准及选型 03 安科瑞电能质量产品及服务 04 经典案例分析

实现卓越供应链:RFID技术的革命性应用

在现代制造业中,供应链和物流的高效运作至关重要,它不仅影响着生产效率,还直接关系到企业的竞争力和客户满意度。为了应对这些挑战,越来越多的企业开始关注智能制造RFID智能设备,将其应用于供应链和物流管理&#xff0…

在OpenStack私有云上安装配置虚拟机

文章目录 零、学习目标一、登录大数据实训云二、创建网络三、创建路由四、添加接口五、创建端口六、添加安全组规则七、创建实例(一)实例规划(二)创建实例 - ied(三)创建实例 - master、slave1与slave2&…

Cesium 根据鼠标点击生成点击点的坐标信息

Cesium 根据鼠标点击生成点击点的坐标信息 一、需求二、分析1. 创建鼠标点击事件2. 点击生成坐标但不是经纬度,而是笛卡尔坐标系下的坐标,这个时候需要做一次转换3. 完整代码 三、数据保存 一、需求 在日常开发中 ,会遇到根据鼠标点击生成对应…

MindSponge分子动力学模拟——使用迭代器进行系统演化(2023.09)

技术背景 在前面几篇博客中,我们已经介绍过使用MindSponge去定义一个系统以及使用MindSponge计算一个分子系统的单点能。这篇文章我们将介绍一下在MindSponge中定义迭代器Updater,并使用Sponge对系统进行演化,最后使用CallBack对输出结果进行…

Spring——Spring的控制反转IOC

摘要 IoC 不是一种技术,只是一种思想,一个重要的面向对象编程的法则,它能指导我们如何设计出松耦合、更优良的程序。传统应用程序都是由我们在类内部主动创建依赖对象,从而导致类与类之间高耦合,难于测试;…

msvcp140.dll是什么东西?msvcp140.dll丢失的5个常用解决方法

今天,我将为大家带来计算机丢失msvcp140.dll修复教程。在我们的日常生活和学习中,计算机问题是无处不在的。有时候,我们可能会遇到一些困扰,比如计算机丢失msvcp140.dll文件。msvcp140.dll是Windows系统中非常重要的动态链接库文件…

代码随想录算法训练营第二十七天| 131.分割回文串

131.分割回文串 本题较难,大家先看视频来理解 分割问题,明天还会有一道分割问题,先打打基础。 代码随想录 视频讲解:带你学透回溯算法-分割回文串(对应力扣题目:131.分割回文串)| 回溯法精讲…

CS420 课程笔记 P6 - 游戏逆向中的虚拟内存

文章目录 IntroVirtual memoryExample!Static example Intro 在上个视频中,我们知道有些地址在你重进游戏时就会无效,有的有时有效,我们需要了解称为虚拟内存的东西 记住这些信息:当你双击打开 Squally.exe 游戏时,系…

【C++ 学习 ⑲】- 多态(下)

目录 一、虚函数表和多态的原理 1.1 - 虚函数表 1.2 - 多态的原理 二、单继承和多继承关系中的虚函数表 2.1 - 单继承关系中的虚函数表 2.2 - 多继承关系中的虚函数表 三、纯虚函数和抽象类 一、虚函数表和多态的原理 1.1 - 虚函数表 问:sizeof(b) 是多少&a…

使用docker部署db2

1.使用docker部署db2 1.1 拉db2镜像 将db2镜像拉起到本地。 docker pull ibmcom/db21.2启动容器 docker run -d -p 50000:50000 --name db2 --privilegedtrue -e DB2INST1_PASSWORDdbPassword DBNAMEjumpdb -e LICENSEaccept -v /usr/local/db2:/database ibmcom/db2实例化…

选择成都优优聚的优势是什么?

美团代运营是一种服务模式,旨在帮助商家提升线上销售业绩,并有效降低经营风险。通过专业团队的运营管理,商家可以获得更加稳定和可靠的线上业务经营。美团代运营提供了一整套解决方案,包括线上推广、店铺运营、商品管理、客户服务…

武汉旅游地

原文链接:https://www.cnblogs.com/MrFlySand/p/17678215.html 发表时间:2023年9月4日21:59:14 更新时间:2023年9月4日21:59:06 东湖飞鸟世界(动物园) 地址:东湖风景区沿湖大道20号时间:9:00-17:00交通:地铁…

远距离WiFi模组方案,实现移动设备之间高效通信,无人机远程图传应用

随着科技的不断进步,无线通信技术也在日新月异地发展。其中,WiFi技术已经成为现代生活中不可或缺的一部分。 从室内到室外,WiFi的应用场景正在不断扩大,为我们的日常生活和工业生产带来了极大的便利。 WiFi技术,即无…

斩获两大年度奖项,这家厂商如何决胜汽车智能化下半场

汽车智能化决战下半场的鼓声已经敲响。 一方面,智能座舱正在向3.0时代迈进,域集中式架构、多域融合已经成为了全新的市场趋势。 另一方面,软件正在成为车企构建差异化产品的重要手段,未来将成为车企盈利的重要组成部分。在这样的…

【算法与数据结构】700、LeetCode二叉搜索树中的搜索

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引&#xff0c;可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析&#xff1a;二叉搜索树的性质&#xff1a;左节点键值 < 中间节点键值 < 右节点键值。那么我们根据此性质&am…