《向量数据库指南》——AI应用长文本与RAG技术爬坡

《向量数据库指南》——AI应用长文本与RAG技术爬坡

news2025/2/23 3:39:58

技术爬坡

长文本的技术爬坡方向

推理质量不能有所下降，如何在保质保量的做长文本的推理，是一件非常困难的事。
解决了能力问题之后，还要解决贵且慢的问题。前面讲到两个瓶颈，一个是推理成本会特别高，一个是首token会特别慢。在一个阶段解决好这两个问题之后，待上下文窗口再提升到下一个里程碑，这两个问题又会出现。
但还是要持续去研究expand context window, 因为有一个现象表明，当长文本能力上去之后，有很多附带的能力会涌现出来。
具体到以后长度能到多长，现在行业没有共识。具体的技术，从实验室环境到真正的生产环境，会有很大的gap。10 Million 的模型， 100 Million的模型可能已经有了，但是可能推不到生产。主要是延迟特别高，或者精度特别的差。

RAG的技术爬坡方向

整个链路变得更长了，远远比半年之前变得更复杂，开始有更多的技术栈被加入进来。
大概 6- 12 个月之前，市场对于 RAG 的印象是：先embedding 模型抽象出一个向量，然后导入向量数据库里边，然后搜索出向量背后代表的短文本块，放入大语言模型。
6个月之前，甚至三五个月之前࿰

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2053584.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

深度学习基础案例3--构建CNN卷积神经网络实现对不同天气的识别(测试集准确率百分之90+)

深度学习基础案例3--构建CNN卷积神经网络实现对不同天气的识别(测试集准确率百分之90+)

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊基础阶段目标目标熟悉CNN、RNN神经网络，了解yolo、transfomer等模型熟练使用Pytorch框架，了解tensorflow 本次目标了解CNN神经网络…

阅读更多...

使用ToDesk云电脑3个月，这5个功能点越用越爽！

使用ToDesk云电脑3个月，这5个功能点越用越爽！

在过去的三个月里，小埋有幸深度体验了ToDesk云电脑这一创新科技产品，它不仅彻底改变了我的工作方式，还让我在日常学习和娱乐中享受到了前所未有的便捷与高效。下面就跟着小埋，一起来看看 ToDesk云电脑使用体验极佳的五大功能特…

阅读更多...

解决银河麒麟V10登录循环的方法

解决银河麒麟V10登录循环的方法

解决银河麒麟V10登录循环的方法一：进入命令行二：删除.Xauthority文件三：重启系统 💖The Begin💖点点关注，收藏不迷路💖 在使用银河麒麟桌面操作系统V10时，有时可能会遇到一个令人头…

阅读更多...

JavaScript - 对象

JavaScript - 对象

Array 数组定义 var 变量名 new Array(元素列表)；//方式一 var 变量名 [ 元素列表 ]；//方式二访问 arr[ 索引] 值； 属性 length : 设置或返回数组中元素的数量方法 forEach() : 遍历数组中每个有值的元素&…

阅读更多...

Spring cloud alibaba(一）nacos

Spring cloud alibaba(一）nacos

一、注册中心作用：解决微服务之间复杂的调用关系； 实现思路： 服务注册：就是将提供某个服务的模块信息注册到一个公共组件上去服务发现：就是新注册这个服务模块能够及时的呗其它调用者发现，不管是服务新增…

阅读更多...

前端开发中的大屏布局方案：使用 rem 单位与动态设置 html 的 font-size

前端开发中的大屏布局方案：使用 rem 单位与动态设置 html 的 font-size

使用 rem 单位与动态设置 html 的 font-size 前言随着设备尺寸的多样化，网页需要能够在不同大小的屏幕上提供良好的用户体验。传统的布局方式（如使用 px）在不同分辨率下可能会导致布局失真。为了解决这个问题，我们可以通过动态…

阅读更多...

微分方程（Blanchard Differential Equations 4th）中文版Section3.3

微分方程（Blanchard Differential Equations 4th）中文版Section3.3

具有实特征值的线性系统的相图在前面的部分，我们看到直线解在求解某些线性微分方程系统的通解中起着主导作用。为了求解这样的系统，我们首先使用代数方法计算系数矩阵的特征值和特征向量。当我们找到一个实特征值和一个相关的特征向量时，就可以写出对应的直线解。此外，在…

阅读更多...

Element-02.组件-Table表格

Element-02.组件-Table表格

一.常见组件-表格二.具体操作 <template><el-table:data"tableData"borderstyle"width: 100%"><el-table-columnprop"date"label"日期"width"180"></el-table-column><el-table-columnprop&q…

阅读更多...

使用Apache POI和POI-OOXML实现word模板文档自动填充功能

使用Apache POI和POI-OOXML实现word模板文档自动填充功能

最近接到一个新的需求，用户创建好模板文件保存到模板库，然后使用在线文档编辑器打开模板时，将系统数据填充到模板文件并生成新的word文件，然后在线编辑，研究使用Apache POI和POI-OOXML实现了这个功能。 Maven依赖 <…

阅读更多...

AI提效实例-借助AI高效生成Markdown格式的超链接

AI提效实例-借助AI高效生成Markdown格式的超链接

我在学习谷粒商城的过程中，每集都写一篇博客笔记，为了方便查找，把所有博客都汇总到一起谷粒商城笔记汇总，如下。现在一共有142篇笔记。之前每发表一篇就把地址记录下来，虽然麻烦，还可忍受。后来有点懈…

阅读更多...

Pcie学习笔记（24）

Pcie学习笔记（24）

Ordering and Receive Buffer Flow Control 流量控制(FC)用于防止接收端缓冲区溢出，并使其符合定义的排序规则。请注意，请求者使用流量控制机制来跟踪代理中可用的队列/缓冲区空间，如图2-48所示。也就是说，流控制是点对点的(跨一…

阅读更多...

模型优化之剪枝

模型优化之剪枝

文章目录什么是神经网络剪枝剪枝的好处不同粒度的剪枝剪枝的分类非结构化剪枝结构化剪枝哪些层的参数更容易被剪掉剪枝效果什么是神经网络剪枝神经网络剪枝在训练期间删除连接密集张量将变得稀疏（用零填充）可以通过结构化块（ n m nm nm&…

阅读更多...

【无标题】playbook的基本使用

【无标题】playbook的基本使用

1、使用ansible安装并启动ftp服务 [root1 ~]# vim /etc/ansible/hosts s0 ansible_ssh_host10.0.0.12 ansible_ssh_port22 ansible_ssh_userroot ansible_ssh_pass1 s1 ansible_ssh_host10.0.0.13 ansible_ssh_port22 ansible_ssh_userroot ansible_ssh_pass1 s2 ansible_s…

阅读更多...

Android 12系统源码_屏幕设备（二）DisplayAdapter和DisplayDevice的创建

Android 12系统源码_屏幕设备（二）DisplayAdapter和DisplayDevice的创建

前言在Android 12系统源码_屏幕设备（一）DisplayManagerService的启动这篇文章中我们具体分析了DisplayManagerService 的启动流程，本篇文章我们将在这个的基础上具体来分析下设备屏幕适配器的创建过程。一、注册屏幕适配器系统是在Disp…

阅读更多...

43.x86游戏实战-DXX寻找吸怪坐标

43.x86游戏实战-DXX寻找吸怪坐标

免责声明：内容仅供学习参考，请合法利用知识，禁止进行违法犯罪活动！ 本次游戏没法给内容参考于：微尘网络安全工具下载： 链接：https://pan.baidu.com/s/1rEEJnt85npn7N38Ai0_F2Q?pwd6tw3 提…

阅读更多...

Xshell中弹出“ssh服务器拒绝了密码请再试一次”时，如何解决

Xshell中弹出“ssh服务器拒绝了密码请再试一次”时，如何解决

在使用Xshell连接Ubuntu系统时，可能会弹出这个错误可能原因如下密码输入错误Ubantu系统默认禁止root用户登录ssh。解决方法： 1. 先用root登录 (由于我买的是云服务器，所以拿这个来举例） 注：要在本地shell中登录…

阅读更多...

基于jqury和canvas画板技术五子棋游戏设计与实现(论文+源码)_kaic

基于jqury和canvas画板技术五子棋游戏设计与实现(论文+源码)_kaic

摘要网络五子棋游戏如今面临着一些新的挑战和机遇。一方面，网络游戏需要考虑到网络延迟和带宽等因素，保证游戏的实时性和稳定性。另一方面，网络游戏需要考虑到游戏的可玩性和趣味性，以吸引更多的玩家参与。本文基于HTML5和Canv…

阅读更多...

银河麒麟V10忘记Root密码怎么办？

银河麒麟V10忘记Root密码怎么办？

银河麒麟V10忘记Root密码怎么办？ 一：进入GRUB模式二：输入GRUB账号密码三：修改启动参数四：修改root密码五：重启系统六：验证root密码 💖The Begin💖点点关注，收…

阅读更多...

就想刷题过？新手必看的华为认证题库最强背题经验技巧

就想刷题过？新手必看的华为认证题库最强背题经验技巧

华为认证作为网络和IT领域的重要资格认证，其难度不容小觑。许多考生为了顺利通过考试，选择背题库作为备考策略。 （重点说一下啊，不提倡刷题，能学知识，把技术学透，肯定是最佳的。） …

阅读更多...

Java基于数据库、乐观锁、悲观锁、Redis、Zookeeper分布式锁的简单案例实现（保姆级教程）

Java基于数据库、乐观锁、悲观锁、Redis、Zookeeper分布式锁的简单案例实现（保姆级教程）

1. 分布式锁的定义分布式锁是一种在分布式系统中用来协调多个进程或线程对共享资源进行访问的机制。它确保在分布式环境下，多个节点（如不同的服务器或进程）不会同时访问同一个共享资源，从而避免数据不一致、资源竞争等问题。 2…

阅读更多...

推荐文章

最新文章