使用Azure AI Search和LlamaIndex构建高级RAG应用

使用Azure AI Search和LlamaIndex构建高级RAG应用

news2026/2/13 21:23:25

RAG 是一种将公司信息合并到基于大型语言模型（LLM）的应用程序中的常用方法。借助 RAG，AI 应用程序可以近乎实时地访问最新信息，团队可以保持对其数据的控制。

在 RAG 中，您可以评估和修改各个阶段以改进结果，它们分为三类：预检索、检索和检索后。

预检索可提高使用查询重写等技术检索的数据的质量。
检索使用混合搜索和语义排序等高级技术改进结果。
检索后侧重于优化检索信息和增强提示。

LlamaIndex 为初学者和有经验的开发人员提供了一个全面的框架和生态系统，以在其数据源上构建 LLM 应用程序。

Azure AI Search是一个信息检索平台，具有尖端的搜索技术和无缝的平台集成，专为任何规模的高性能生成式 AI 应用程序而构建。

我们在预检索中使用LlamaIndex 进行查询转换，并使用 Azure AI 搜索进行高级检索，可以生成构建更好的RAG应用程序。

预检索技术和优化查询编排

为了优化预检索，LlamaIndex 提供了查询转换，这是一项优化用户输入的强大功能。一些查询转换技术包括：

路由：保持查询不变，但标识查询应用到的相关工具子集。将这些工具输出为相关选项。
查询重写：保持工具不变，但以各种不同的方式重写查询，以针对相同的工具执行。
子问题：将查询分解为不同工具上的多个子问题，由其元数据标识。
ReAct 代理工具选取：给定初始查询，确定（1）要选取的工具，以及（2）要在工具上执行的查询。

以查询重写为例：查询重写使用 LLM 将初始查询重新表述为多种形式。这使开发人员能够探索数据的不同方面，从而产生更细致和准确的响应。通过重写查询，开发人员可以生成多个查询，用于集成检索和融合检索，从而获得更高质量的检索结果。利用 Azure OpenAI，可以将初始查询分解为多个子查询。

请考虑以下初始查询：

“作者怎么了？”

如果问题过于宽泛，或者似乎不太可能在我们的语料库文本中找到直接的比较，建议将问题分解为多个子查询。

子查询：

“作者最近写的一本书是什么？”
“作者获得过什么文学奖吗？”
“有没有即将举行的活动或对作者的采访？”
“作者的背景和写作风格是什么？”
“围绕作者有什么争议或丑闻吗？”

子问题查询引擎

LlamaIndex 的一大优点是，像这样的高级检索策略是内置在框架中的。例如，可以使用子问题查询引擎在一个步骤中处理上述子查询，该引擎将问题分解为更简单的问题，然后将答案组合成一个响应。

response = query_engine.query("What happened to the author?")

使用 Azure AI 搜索进行检索

为了增强检索功能，Azure AI 搜索提供混合搜索和语义排名。混合搜索同时执行关键字和向量检索，并应用融合步骤（倒数秩融合（RRF））从每种技术中选择最佳结果。

语义排名器在初始 BM25 排名或 RRF 排名结果上添加辅助排名。该二级排名使用多语言深度学习模型来推广语义上最相关的结果。

通过将“query_type”参数更新为“semantic”，可以很容易地启用语义排名器。由于语义排名是在 Azure AI 搜索堆栈中完成的，因此我们的数据显示，语义排名器与混合搜索相结合是提高相关性的最有效方法。

此外，Azure AI 搜索还支持矢量查询中的筛选器。您可以设置筛选器模式，以便在矢量查询执行之前或之后应用筛选器：

预筛选模式：在查询执行前应用筛选，减少向量搜索算法查找相似内容的搜索表面积。预滤波通常比后滤波慢，但有利于召回率和精确度。
筛选后模式：在查询执行后应用筛选器，缩小搜索结果范围。后过滤比选择更注重速度。

总结

通过与 LlamaIndex 的协作，可以提供更简单的方法来优化预检索和检索，以实现高级 RAG应用。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1625404.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

大型企业高效内部协同，向日葵SDK私有化部署案例解析

大型企业高效内部协同，向日葵SDK私有化部署案例解析

大型集团企业的内部，沟通协作的重要性不言而喻，我们时常能听到关于所谓“大企业病”的吐槽，多数也是源于企业内部沟通协作效率低，进而导致内耗加重。甚至我们可以这么说，越是发展壮大的集团企业，其内部的沟…

阅读更多...

力扣刷题学习（跟随视频学着刷）

力扣刷题学习（跟随视频学着刷）

使用入门视频链接【手把手带你刷Leetcode力扣｜各个击破数据结构和算法｜大厂面试必备技能【已完结】-哔哩哔哩】 https://b23.tv/vIcRT61 时空复杂度时间： 空间：主要有O(1)和O(n)两种，只用计算开辟的内存&#xff…

阅读更多...

3月份牛奶线上市场数据分析：销售额累计近18亿元

3月份牛奶线上市场数据分析：销售额累计近18亿元

随着消费者健康意识的提升，牛奶作为日常营养补充品，其市场需求逐年增加。线上市场具有购买便捷性、价格透明性等优势，越来越多的消费者倾向于线上购买。今年3月份，牛奶乳品市场呈现稳定发展状态。根据鲸参谋数据显示&#xff0c…

阅读更多...

深度解析1688关键字搜索API接口：技术实现与应用探索

深度解析1688关键字搜索API接口：技术实现与应用探索

1688关键字搜索API接口的技术实现主要依赖于阿里巴巴开放平台提供的API服务。商家和开发者通过调用这些API接口，可以实现商品的搜索、排序、筛选、分页等功能。具体来说，技术实现主要包括以下几个步骤： 注册并获取API密钥：首先&am…

阅读更多...

python爬虫插件XPath的安装

python爬虫插件XPath的安装

概要 XPath Helper是一款专用于chrome内核浏览器的实用型爬虫网页解析工具。XPath可以轻松快捷地找到目标信息对应的Xpath节点，获取xpath规则，并提取目标信息，并进行校对测试；可对查询出的xpath进行编辑，正确编辑的结…

阅读更多...

一文解析golang中的协程与GMP模型

一文解析golang中的协程与GMP模型

文章目录前言1、线程实现模型1.1、用户级线程与内核级线程1.2、内核级线程模型1.3、用户级线程模型1.3、两级线程模型 2、GMP模型2.1、GMP模型概述2.1、GMP v1版本 - GM模型2.2、GMP v2版本 - GMP模型2.3、GMP相关源码2.4 调度流程2.5 设计思想 3.总结前言并发(并行&#x…

阅读更多...

Golang-Gin 框架写的免杀平台，内置分离、捆绑等多种BypassAV方式

Golang-Gin 框架写的免杀平台，内置分离、捆绑等多种BypassAV方式

Golang-Gin 框架写的免杀平台，内置分离、捆绑等多种BypassAV方式 Golang-Gin 框架写的免杀平台，内置分离、捆绑等多种BypassAV方式。 cool 时间线： Golang Gin 框架写的免杀平台- (2021.11.12)Golang Gin 框架写的免杀平台，更…

阅读更多...

CVPR往年论文查看

CVPR往年论文查看

这个就是查看论文的网站：https://openaccess.thecvf.com/ 先别急， 看完再操作，听话！！ 如果你要查看CVPR2022年的论文那么就在网站后加上CVPR2022 例如:https://openaccess.thecvf.com/CVPR2022 如果是2023年的那么…

阅读更多...

赋能智慧校园！A3D数字孪生可视化，轻量又高效！

放假之后，学生们会逐步返学，大量人员出入校园，安全更是不容忽视，如何在短时间内对大批人员及设施进行智能监管？数字化转型是关键手段，我们可以融合线上线下数据，搭建3D立体的智慧校园&#xff0…

阅读更多...

RoadBEV：鸟瞰图中的道路表面重建

RoadBEV：鸟瞰图中的道路表面重建

1. 代码地址 GitHub - ztsrxh/RoadBEV: Codes for RoadBEV: road surface reconstruction in Birds Eye View 2. 摘要本文介绍了RoadBEV：鸟瞰图中的道路表面重建。道路表面条件（特别是几何形状）极大地影响了自动驾驶汽车的驾驶性能。基于…

阅读更多...

【C#】Stopwatch计时器

【C#】Stopwatch计时器

使用Stopwatch检查C#中代码块的执行时间，比如歌曲，图片的下载时间问题首先，我们可看到Stopwatch 类内部的函数。根据需求，我们具体可使用到 Start() 开始计时，Stop() 停止计时等 //创建 Stopwatch 实例 Stopwatch …

阅读更多...

ELK 日志分析系统（二）

ELK 日志分析系统（二）

一、ELK Kibana 部署 1.1 安装Kibana软件包 #上传软件包 kibana-5.5.1-x86_64.rpm 到/opt目录 cd /opt rpm -ivh kibana-5.5.1-x86_64.rpm 1.2 设置 Kibana 的主配置文件 vim /etc/kibana/kibana.yml --2--取消注释，Kiabana 服务的默认监听端口为5601 server.po…

阅读更多...

AWR报告采集

AWR报告采集

一、windows下采集自动负载信息库（Automatic Workload Repository，AWR）是在Oracle 10g中被引入的，缺省地被安装到Oracle10g数据库中，用于收集关于该特定数据库的操作统计信息和其他统计信息。AWR的采样工作由后台进程…

阅读更多...

2018.3SDK工具融合bit文件不成功_microblaze加载程序不成功

2018.3SDK工具融合bit文件不成功_microblaze加载程序不成功

2018.3SDK工具融合bit文件不成功_microblaze加载程序不成功描述：正常开发流程是vivado端把PL端开发好了，导出HDF平台文件，然后SDK根据HDF文件创建工程，完成PS端的开发工作，这时候就要下载调试了，发现SDK的做法是把vivado导出的bit文件和SDK编译谁生成的elf文件进行了融…

阅读更多...

Idea：通义千问插件

Idea：通义千问插件

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录一、通义千问大模型二、程序编写助手三、Idea安装通义千问插件总结提示：以下是本篇文章正文内容，下面案例可供参考一、通义千问大模型…

阅读更多...

力扣HOT100 - 200. 岛屿数量

力扣HOT100 - 200. 岛屿数量

解题思路： 岛屿题目一般使用dfs。 1.判断是否越界 2.用0，1，2三个状态标识当前格子的状态（三个状态比两个状态更清晰） 3.向周围四个方向遍历 class Solution {public int numIslands(char[][] grid) {int cnt 0;fo…

阅读更多...

SpringBoot - java.lang.NoClassDefFoundError: XXX

SpringBoot - java.lang.NoClassDefFoundError: XXX

问题描述以 json-path 为例：java.lang.NoClassDefFoundError: com/jayway/jsonpath/Configuration 原因分析编译不报错，但是运行时报错。遇到这样类似的问题，首先就要想到是不是 Jar 包冲突引起的，或者引入的不是理想的 Jar…

阅读更多...

深度学习的炼金术：转化数据为黄金的秘密

深度学习的炼金术：转化数据为黄金的秘密

深度学习的炼金术：转化数据为黄金的秘密 1 引言在现代深度学习的壮阔疆域中，数据是王冠上耀眼的宝石，而性能优化则是锻造这顶王冠的炼金术。这份融合了数据和算法魔力的艺术，不仅仅依赖于强大的计算资源和复杂的网络结构&#x…

阅读更多...

VScode使用cmake编译

VScode使用cmake编译

一：输入 ctrlshiftp打开用于命令执行的输入框二：输入cmake，选择quick start 模式三：选择版本最高的gcc版本四：输入项目名称选择C 五：选择executable 这样便创建好了最简单的cmake例程，一个…

阅读更多...

OSPF的协议特性

OSPF的协议特性

路由汇总的概念 l 路由汇总（ Route Aggregation ），又称路由聚合（Route Summarization），指的是把一组明细路由汇聚成一条汇总路由条目的操作 l 路由汇总能够减少路由条目数量、减小路由表规模&#xff0…

阅读更多...

推荐文章

最新文章