突破AI迷雾:英特尔携手星环科技打造向量数据库革新方案,直降大模型幻觉

news2024/11/24 12:45:55

去年爆火的大模型,正在从百模大战走向千行百业落地应用。不过行业数据规模有限,企业数据隐私安全的要求等等因素,都让行业大模型的准确率面临挑战。近期发布的《CSDN AI 开发者生态报告》数据显示,“缺乏数据/数据质量问题”在大模型技术开发者面临的问题中,占据首位。


具体来说,行业领域大模型需要有对行业(如医学、法律、科研)高深专业术语的理解、完成特定的行业领域任务,并且对大模型输出结果要求准确,无法如个人用户一样接受大模型的反复多次推理。

RAG 技术有效降低模型幻觉,加速行业大模型落地

检索增强生成技术 RAG(Retrieval-Augmented Generation)应时而生。在 RAG 系统中,使用向量数据库进行信息检索是系统能够正常运行的核心功能之一,通过 embedding 技术将问题和知识库内容转换为向量,基于相似性找到最相关的文档并提供给大模型生成答案。

采用 RAG 技术可以有效地解决大模型在知识更新不及时、数据安全、存在幻觉等方面的问题,通过向量数据库、图数据库等作为大模型的外置知识库,使大模型具有更高的精确度,因此,在今年受到技术界的广泛关注。RAG 与向量数据库成为了行业模型落地的优选项。

在云计算时代拥有自研大数据技术的资深数据厂商星环科技,正在进一步基于 RAG 技术与星环科技向量数据库 Transwarp Hippo,利用行业与企业中存在的大量半结构化和非结构化数据,去提升行业大模型的准确性。

Transwarp Hippo 是一款企业级云原生分布式向量数据库,支持存储、索引以及管理海量的向量式数据集,解决向量相似度检索以及高密度向量聚类等问题。Hippo 具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,以及数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,能够很好的满足企业针对海量向量数据的高实时性检索等场景需求。

CPU 助力大模型优化创新,星环科技与英特尔发布向量数据库解决方案

不过,大模型与数据系统的性能提升绝非易事,企业落地大模型,除了要确保模型的实时性、隐私安全和准确性之外,还有考虑系统性能、扩展性,以及部署实施成本等因素。为了系统软硬件结合调优,提升向量数据库性能,并降低企业落地大模型的成本,星环科技与英特尔联合发布了向量数据库解决方案。

结合英特尔至强可扩展处理器多方面的性能优势,并把软硬件进行深度融合,英特尔携手星环科技打造了一个整体更加高性能的解决方案,值得注意的是,这也是一个用 CPU 去实现大模型优化的创新方案。英特尔中国软件技术合作事业部总经理唐炯表示:“和星环科技的合作,能帮助英特尔从更完整的、端到端的客户需求角度来理解数据存储、数据治理、智能分析等技术需求,为中国市场交付更能够满足用户综合需求和使用习惯的硬件产品。”

具体来说,该解决方案得益于英特尔至强可扩展处理器里集成的 AVX512 扩展指令集,重写向量距离计算函数,降低向量计算所需 CPU 指令与 CPU Cycle 数量,能够充分发挥处理器高内存带宽优势。另外,方案采用 NUMA 友好的向量计算负载调度算法,避免 CPU 远程内存访问造成 CPU Stalling,充分发挥了英特尔至强可扩展处理器的多核性能优势。第三,基于数据离散度的浮点数矢量化算法,以及充分利用 VNNI 指令集,该方案进一步提升了向量计算的性能。

方案中使用的 AVX-512 是英特尔至强可扩展处理器中的一项集成内置加速器功能——英特尔® 高级矢量扩展 512(英特尔® AVX-512)。AVX-512提供针对 AI、分析、科学模拟、金融模拟和其他涉及基于矢量计算的计算密集型任务的内置加速,而无需其他独立加速器,从而在降低复杂性的同时也控制了成本。得益于Hippo向量数据库和至强可扩展处理器的性能优势,软硬件一体的联合解决方案整体性能可以实现20%-30%左右的提升



联合方案用向量数据库可以解决大模型领域知识实时性低、数据隐私安全、模型幻觉等问题,通过软硬件的深度优化,能够满足海量、高纬度向量数据处理对性能的极致需求,并具备低时延和高精确度等优势。对于企业而言,该方案可以让 AI 数据系统按需进行水平扩展,以容器化技术支持服务弹性扩/缩容,满足企业未来发展对海量、高维度向量数据存储和计算的需求,降低大模型二次训练的成本,并且通过系统自带 Embedding 工具和模型、高扩展、高性能等特性提升企业在大模型建设方面的总体拥有成本效益。

星环科技基础架构部副总经理刘熙指出,“与英特尔联合研发,共同优化星环科技的数据库产品,让向量数据库在通用 x86 服务器上就可以获取 AI 应用所需要的性能和特性。”此外,数智融合趋势下,AI 对数据的需求还有很多。刘熙也分享了对大数据技术的趋势观察和星环科技的实践成果,分别是湖仓集一体化、实时数据和历史数据融合分析、利用大数据技术增强大模型能力、利用大模型来增强大数据分析

而本次联合发布方案已经不是星环科技与英特尔第一次合作。刘熙表示早前双方已经联合研发推出了分析型数据库软硬件一体的解决方案。现在英特尔与星环的深层合作已经遍及 AI 大模型各层,希望全方位助力企业落地大模型并实现降本增效。

回到《CSDN AI 开发者生态报告》,我们能够看到,除了数据问题,让大模型技术落地的开发工作无比庞杂,开发者面临的问题还有如 AI 大模型技术基础设施不足、缺乏和难招聘 AI 技术人才,以及监管、法律风险与合规性等问题。灵活、性价比永远是企业落地新兴技术的关注重点,而基于 CPU 构建的 AI 数据方案,可以让企业更灵活的通过软硬件技术,落地大模型与 AI 应用,对大多数企业而言是更具可行性的技术路线。我们将持续关注大模型创新技术与应用落地实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1649276.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RS2103XH 功能和参数介绍及规格书

RS2103XH 是一款单刀双掷(SPDT)模拟开关芯片,主要用于各种模拟信号的切换和控制。下面是一些其主要的功能和参数介绍: 主要功能特点: 模拟信号切换:能够连接和断开模拟信号路径,提供灵活的信号路…

set_input_delay的理解

1,set_input_delay约束理解 input_delay是指输入的数据到达FPGA的pad引脚时相对于时钟边沿的延迟有多大,单位是ns,数值可以是正,也可以是负。通过set_input_delay约束告诉编译器输入时钟和输入数据的相位关系。如下图所示假设时钟…

uniapp的app端软件更新弹框

1:使用html PLUS实现:地址HTML5 API Reference (html5plus.org),效果图 2:在app.vue的onLaunch生命周期中,代码如下: onLaunch: function() {let a 0let view new plus.nativeObj.View(maskView, {backg…

PyRun_SimpleString(“import cv2“); 报错解决

#include <Python.h> #include <iostream>using namespace std;int main() {Py_Initialize();if (!Py_IsInitialized()){printf("初始化失败&#xff01;");return 0;}PyRun_SimpleString("import sys");PyRun_SimpleString("sys.path.ap…

【大模型】LLaMA-1 模型介绍

文章目录 一、背景介绍二、模型介绍2.1 模型结构2.2 模型超参数2.3 SwiGLU 三、代码分析3.1 模型结构代码3.2 FairScale库介绍 四、LLaMA家族模型4.1 Alpaca4.2 Vicuna4.3 Koala(考拉)4.4 Baize (白泽)4.5 Luotuo (骆驼&#xff0c;Chinese)4.6 其他 参考资料 LLaMA&#xff08…

本地运行AI大模型简单示例

一、引言 大模型LLM英文全称是Large Language Model&#xff0c;是指包含超大规模参数&#xff08;通常在十亿个以上&#xff09;的神经网络模型。2022年11月底&#xff0c;人工智能对话聊天机器人ChatGPT一经推出&#xff0c;人们利用ChatGPT这样的大模型帮助解决很多事情&am…

如何将 ONLYOFFICE 协作空间服务器版更新至 2.5

最近我们发布了 ONLYOFFICE 协作空间 2.5 云端版。好消息&#xff0c;该文档协作平台的自托管版本也已推出。现在&#xff0c;您可以轻松更新协作空间的实例&#xff0c;在本地尝试所有新功能。阅读本文了解更多信息。 ONLYOFFICE 协作空间 2.5 新功能 更新到 ONLYOFFICE 协作…

Type-C转音频(USB2.0数据传输)+PD充电芯片乐得瑞LDR6500/LDR6023

LDR6500 USB-C DRP 接口 USB PD 通信芯片概述 Type-C转音频(USB2.0数据传输)PD充电芯片乐得瑞LDR6500LDR6500是乐得瑞科技针对USB Type-C标准中的Bridge设备而开发的USB-C DRP&#xff08;Dual Role Port&#xff0c;双角色端口&#xff09;接口USB PD&#xff08;Power Deliv…

彻底解决python的pip install xxx报错(文末附所有依赖文件)

今天安装pip install django又报错了&#xff1a; C:\Users\Administrator>pip install django WARNING: Ignoring invalid distribution -ip (d:\soft\python\python38\lib\site-pac kages) Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple Collecting djan…

redis持久化存储

Redis的持久化机制 Redis是一个基于内存的数据库&#xff0c;它的数据是存放在内存中&#xff0c;内存有个问题就是关闭服务或者断电会丢失。Redis的数据也支持写到硬盘中&#xff0c;这个过程就叫做持久化。 Redis提供如下两种持久化方式 RDB&#xff08;Redis DataBase&am…

【计算机毕业设计】基于SSM++jsp的网络游戏公司官方平台系统【源码+lw+部署文档+讲解】

目录 第1章 绪论 1.1 课题背景 1.2 课题意义 1.3 研究内容 第2章 开发环境与技术 2.1 MYSQL数据库 2.2 JSP技术 2.3 SSM框架 第3章 系统分析 3.1 可行性分析 3.1.1 技术可行性 3.1.2 经济可行性 3.1.3 操作可行性 3.2 系统流程 3.2.1 操作流程 3.2.2 登录流程 3.2.3 删除信息流…

我写了一套几乎无敌的参数校验组件!基于 SpEL 的参数校验组件「SpEL Validator」

前言 大家好&#xff0c;我是阿杆&#xff0c;不是阿轩。 参数校验这个东西&#xff0c;很多情况下都是比较简单的&#xff0c;用 NotNull、Size 等注解就可以解决绝大多数场景&#xff0c;但也有一些场景是这些基本注解解决不了的&#xff0c;只能用一些其他的方式处理&…

【极速前进】20240423-20240428:Phi-3、fDPO、TextSquare多模态合成数据、遵循准则而不是偏好标签、混合LoRA专家

一、Phi-3技术报告 论文地址&#xff1a;https://arxiv.org/pdf/2404.14219 ​ 发布了phi-3-mini&#xff0c;一个在3.3T token上训练的3.8B模型。在学术基准和内部测试中的效果都优于Mixtral 8*7B和GPT-3.5。此外&#xff0c;还发布了7B和14B模型phi-3-small和phi-3-medium。…

环形链表理解||QJ141.环形链表

在链表中&#xff0c;不光只有普通的单链表。之前写过的的一个约瑟夫环形链表是尾直接连向头的。这里的环形链表是从尾节点的next指针连向这链表的任意位置。 那么给定一个链表&#xff0c;判断这个链表是否带环。qj题141.环形链表就是一个这样的题目。 这里的思路是用快慢指…

面试笔记——多线程使用场景

线程池使用场景&#xff08;CountDownLatch&#xff0c; Future&#xff09; CountDownLatch CountDownLatch&#xff08;闭锁/倒计时锁&#xff09;用来进行线程同步协作&#xff0c;等待所有线程完成倒计时&#xff08;一个或者多个线程&#xff0c;等待其他多个线程完成某件…

经典面试题之滑动窗口专题

class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {// 长度最小的子数组 // 大于等于 targetint min_len INT32_MAX;// 总和int sum 0;int start 0; // 起点for(int i 0; i< nums.size(); i) {sum nums[i];while(sum > targe…

【如此简单!数据库入门系列】之效率基石 -- 磁盘空间管理

文章目录 1 前言2 磁盘空间管理3 磁盘空间管理的实现4 存储对象关系5 总结6 系列文章 1 前言 如何将表中的记录存储在物理磁盘上呢&#xff1f; 概念模式中&#xff0c;记录&#xff08;Record&#xff09;表示表中的一行数据&#xff0c;由多个列&#xff08;字段或者属性&…

mysql5.7数据库安装及性能测试

mysql5.7数据库安装及性能测试 记录Centos7.9下安装mysql 5.7并利用benchmark工具简单测试mysql的性能。 测试机&#xff1a;centos7.9 配置&#xff1a;4C8G40G 1. 下安装mysql5.7 安装mysql5.7&#xff1a; # 通过官方镜像源安装$ wget http://dev.mysql.com/get/mysql57-com…

如何用virtualbox 来跑openwrt 镜像?

1.下载好openwrt源代吗&#xff0c;编译之前先配置&#xff0c;让编译产生x86的virtualbox 镜像&#xff1a; 编译完成之后会产生vdi镜像文件&#xff0c; 在virtualbox 中创建一虚拟机&#xff0c;类型选择linux,版本other linux 64: 内存选择512&#xff1a; 这个地方把镜像…

【牛客】【模板】二维前缀和

原题链接&#xff1a;登录—专业IT笔试面试备考平台_牛客网 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 二维前缀和板题。 二维前缀和&#xff1a;pre[i][j]a[i][j]pre[i-1][j]pre[i][j-1]-pre[i-1][j-1]; 子矩阵 左上角为(x1,y1) 右下角(x2,y2…