大模型范式下的知识检索增强实践(非常详细)零基础入门到精通,收藏这一篇就够了

news2024/11/18 16:50:57

导读

OpenKG新开设“TOC专家谈”栏目,推送OpenKG TOC(技术监督委员会)专家成员的观点文章。本期邀请到阿里巴巴通义实验室自然语言处理方向负责人黄非研究员介绍通义大模型在知识检索增强方面的一些实践。

随着人工智能技术的飞速发展,大模型以其强大的自然语言理解和生成能力,在诸多领域展现出前所未有的潜力。然而,面对瞬息万变的信息环境、海量的专业知识需求以及对精准性、时效性的严苛要求,纯粹依赖模型内部参数固化知识的大模型有时显得力有未逮。在此背景下,“检索增强”的技术应运而生,旨在通过巧妙结合外部知识库与大模型的核心能力,实现知识处理与智能交互效能的显著提升。以下是对检索增强这一前沿技术的专家访谈,旨在引导读者了解相关技术发展动态和前沿实践。

通义大模型

通义系列大模型是由阿里巴巴集团通义实验室研发的一系列大型预训练模型,代表了阿里巴巴在人工智能领域的先进技术与研究成果。这些模型以其强大的语言理解、生成、推理和多模态处理能力,广泛应用于各类场景,致力于实现接近人类智慧的通用智能,并推动AI技术在各行各业的落地应用。

通义大模型已经广泛应用于众多实际场景中,特别是在阿里巴巴集团内部产品得到深度集成和应用。如阿里云、钉钉、天猫等。

大模型知识检索增强(RAG)

大模型时代的检索增强技术是指在当前以大规模预训练语言模型为主导的自然语言处理(NLP)背景下,对检索增强策略进行的革新和发展。大模型,如GPT系列等,凭借其庞大的参数规模,对广泛的通用知识进行压缩表示学习,实现了强大的语言理解与生成能力,已经在诸多NLP任务中取得了突破性进展。然而,即使是最先进的大模型也存在知识边界、时效性不足、缺乏特定领域知识等问题。检索增强技术在此背景下扮演了重要角色,通过巧妙地融入外部知识源,进一步提升大模型的性能和适用范围,具体而言是一种结合信息检索技术和现代大模型技术,来提升模型性能和泛化能力的技术策略。它的核心思想是利用外部存储的知识库(如文本数据库、知识图谱、多模态信息等)在模型推理过程中实时获取相关信息,以此辅助模型做出更准确、更具上下文信息的决策。

在工业界实际应用中,传统的RAG方法仍面临诸多挑战。首先,单一的Query文本表示方法存在一些局限性,无法准确捕捉复杂语义的文档关联性,仅能确定相关性,而无法进行深入的语义理解。其次,RAG所需的意图理解,query 改写,检索生成等技术在训练过程中依赖标注数据,而获取大规模线上Query标注数据异常困难且成本高昂,限制了其在实际应用中的可行性和效率。

最近,我们在RAG场景下和浙江大学陈华钧老师团队合作做了两个工作,一个是通过优化RAG最为核心的组件–Query改写,通过基于排序反馈增强RAG有效提升通义大模型开放域知识问答的效果,另一个是基于检索增强来提升大模型的NLU能力,分别介绍如下:

基于排序反馈增强RAG方法

当RAG链路中使用原始Query没能检索到可回答的文档时,我们就需要通过对原Query进行改写来实现对相关搜索文档的扩充。现阶段,尽管大模型自身可以实现Query改写,但因其高昂的调用成本,RAG链路中小型改写模型仍非常重要。目前学术界和工业界改进小型Query改写模型的主要思路之一是基于强化学习反馈。然而,过去对于改写的反馈通常基于标注数据如特定数据集的标注文档或特定任务的标注答案等。在通义的开放域问答场景往往缺乏这样的标注,此外依赖标注数据的反馈思路缺乏足够的泛化能力。

针对上述问题,我们提出了面向RAG场景的基于排序(Reranker)反馈的Query改写方法。Reranker的目标和功能是对于文档和原始Query之间的相关性进行打分,最后根据分数对检索文档进行重排,因此Reranker在不需要标注文档的情况下,可以利用开放域搜索引擎的检索结果来提供信号,并且这个信号与Query改写的目标高度一致。基于Reranker的改写反馈信号,我们的改写训练框架同时支持在线实时的(PPO等)以及离线的(DPO、KTO等)反馈训练,以实现开放域问答效果的提升。

基于语言模型随机点过程的上下文学习方法

除了开放域问答之外,RAG还可以应用于更多任务如NLU。然而,当前通义RAG系统因缺乏大量的标注数据而在NLU等实际应用上存在限制。事实上,获取大规模的线上Query标注数据既困难又昂贵。针对这一问题,我们探索了如何通过主动学习的方式降低标注成本 ,提出了一种基于语言模型随机点过程的上下文学习标注选择机制,旨在优化大模型的少量样本学习能力,选择性标注位于标准示例检索之前。

我们提出的语言模型随机点过程(LM-DPP)方法通过结合大模型的困惑度(Perplexity)来评估每个候选实例的不确定性,并构建一个Gram矩阵(Gram matrix)来平衡候选实例的不确定性和多样性。应用多项式时间最大后验(Maximum a Posteriori, MAP)推断来识别最有用的实例子集进行标注。

通过在12个分类和2个生成数据集上进行实验,我们验证了LM-DPP的有效性,并展示了其在不同大模型上的通用性。在资源有限的情况下,该方法为如何有效地利用大模型进行标注和RAG在低资源场景下的NLU应用提供了新思路。

检索增强与AI智能体

当前,通义RAG技术已深度融入阿里巴巴集团旗下的多项核心应用,包括通义千问、阿里云百炼以及阿里云AI助理,以及办公协作平台钉钉等等,显著提升了这些应用在信息检索、对话交互与定制化模型构建等方面的能力。

在通义千问这一智能问答平台上,通义RAG技术扮演着关键角色。面对用户提出的涉及实时信息查询、新闻事件更新、市场动态追踪等需求时,通义RAG能够迅速从互联网的海量资源中精准检索到最相关、最新的数据,并以此为依据生成准确且即时的回答。这种融合检索与生成机制的方式确保了通义千问在应对瞬息万变的信息环境时,仍能提供高度时效性与可靠性的支持,满足用户对实时信息获取的高期待。

在阿里云百炼平台上,通义RAG则助力外部企业实现基于自身数据的个性化大模型构建。企业客户通过安全上传其独有的业务数据,通义RAG系统能够有效整合这些数据与云端大规模预训练模型的力量,形成对企业特有知识深度理解和精准建模的专属大模型服务。

对于阿里云AI助理这一服务于阿里云产品咨询的对话式智能助手而言,通义RAG的应用进一步增强了其专业性与响应效率。用户通过自然对话方式提出关于阿里云各项产品和服务的疑问时,AI助理不仅依赖于内置的知识库,更利用通义RAG的检索能力,实时抓取阿里云官方资料、最新公告、技术文档等权威来源信息,确保回复内容的准确性与全面性。这种即时检索与对话生成的无缝结合,使得用户在寻求技术支持、了解产品特性或规划云解决方案时,能够获得如同与资深专家交谈般的流畅体验。

总结与展望

在工业领域,RAG模块的复杂多样性和链路的错综复杂性带来了诸多挑战,其中包括但不限于检索库中存在的噪音等问题。如何精准识别用户意图并实现鲁棒且自动的知识检索增强过程,如何结合通用知识库(如互联网),专业知识库,私有域的知识库,以及提供个性化智能体,是我们亟待解决的任务。自动化构建高质量的检索增强知识库、设计原生支持检索和规划的大模型架构,是关键的技术路径。

在未来,我们期望通过结合规划知识库等技术进一步提升大模型执行检索和推理、规划能力,通过基于参数与符号相结合的弹性可编辑知识库等技术提升大模型的知识更新能力,不断探索并推动大模型和智能体的自主进化新技术。

AI大模型学习福利

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

四、AI大模型商业化落地方案

img

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI绘画 Stable Diffusion图像的脸部细节控制——采样器全解析

大家好,我是画画的小强 我们在运用AI绘画 Stable Diffusion 这一功能强大的AI绘图工具时,我们往往会发现自己对提示词的使用还不够充分。在这种情形下,我们应当如何调整自己的策略,以便更加精确、全面地塑造出理想的人物形象呢&a…

数据特征采样在 MySQL 同步一致性校验中的实践

作者:vivo 互联网存储研发团队 - Shang Yongxing 本文介绍了当前DTS应用中,MySQL数据同步使用到的数据一致性校验工具,并对它的实现思路进行分享。 一、背景 在 MySQL 的使用过程中,经常会因为如集群拆分、数据传输、数据聚合等…

24_嵌入式系统输入输出设备

目录 GPIO原理与结构 A/D接口基本原理 A/D接口原理 A/D转换的重要指标 D/A接口基本原理 D/A接口原理 DAC的分类 D/A转换器的主要指标 键盘接口基本原理 键盘接口原理 用I/O口实现键盘接口 显示接口基本原理 基本结构和特点 基本原理 LCD种类 市面上出售的LCD的类…

python怎么样将一段程序无效掉

1、python中可以用注释屏蔽一段语句,具体方法如下,首先打开一段python的示例程序: 2、然后单行注释的方法是在语句前面加上#,程序运行后添加注释的地方的语句会被自动跳过,这里可以看到将打印变量a的语句添加注释就没有…

STM32F1+HAL库+FreeTOTS学习5——内核中断管理及中断控制函数

STM32F1HAL库FreeTOTS学习5——中断管理和临界段代码保护 中断简介中断优先级寄存器拓展FreeRTOS中PendSV和Systick中断优先级配置三个中断屏蔽寄存器FreeRTOS中断管理函数代码验证 上一期我们学习了FreeRTOS中任务挂起与恢复,在中断服务程序中恢复任务过程中&#…

利用谷歌云serverless代码托管服务Cloud Functions构建Gemini Pro API

谷歌在2024年4月发布了全新一代的多模态模型Gemini 1.5 Pro,Gemini 1.5 Pro不仅能够生成创意文本和代码,还能理解、总结上传的图片、视频和音频内容,并且支持高达100万tokens的上下文。在多个基准测试中表现优异,性能超越了ChatGP…

竞赛选题 协同过滤电影推荐系统

文章目录 1 简介1 设计概要2 课题背景和目的3 协同过滤算法原理3.1 基于用户的协同过滤推荐算法实现原理3.1.1 步骤13.1.2 步骤23.1.3 步骤33.1.4 步骤4 4 系统实现4.1 开发环境4.2 系统功能描述4.3 系统数据流程4.3.1 用户端数据流程4.3.2 管理员端数据流程 4.4 系统功能设计 …

【Proteus】按键的实现『⒉种』

🚩 WRITE IN FRONT 🚩 🔎 介绍:"謓泽"正在路上朝着"攻城狮"方向"前进四" 🔎🏅 荣誉:2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评…

13-错误-ERROR: duplicate key value violates unique constraint “ux_xxx“

13-错误-ERROR: duplicate key value violates unique constraint “ux_xxx” 更多内容欢迎关注我(持续更新中,欢迎Star✨) Github:CodeZeng1998/Java-Developer-Work-Note 技术公众号:CodeZeng1998(纯纯…

Vite: Bundler实现JavaScript的AST解析器—词法分析、语义分析

概述 基于前文,我们写了一个迷你版的 no-bundle 开发服务,也就是 Vite 开发阶段的 Dev Server,而在生产环境下面,处于页面性能的考虑,Vite 还是选择进行打包(bundle),并且在底层使用 Rollup 来完成打包的过…

liunx清理服务器内存和日志

1、查看服务器磁盘占用情况 # 查看磁盘占用大小 df -h 2、删除data文件夹下面的日志 3、查看每个服务下面的日志输出文件,过大就先停掉服务再删除out文件再重启服务 4、先进入想删除输入日志的服务文件夹下,查看服务进程,杀掉进程&#xff…

【算法】(C语言):二分查找

二分查找: 获取查找区域的中间位置。若中间位置的数据就是要找的值,则返回true。若要找的值 小于 中间位置的数据,则往左边查找。若要找的值 大于 中间位置的数据,则往右边查找。重复1和2,若没有要找的值,…

Mall,正在和年轻人重新对话

【潮汐商业评论/原创】 结束了一下午的苦闷培训,当Cindy赶到重庆十字大道时,才发现十字路口上的巨大“飞行棋”在前两天就已经撤展了。 “来了又错过,就会觉得遗憾,毕竟这样的路口不多,展陈又不可能会返场。” 飞行棋…

【机器学习】机器学习在AI Agent中的影响与作用

文章目录 🚀Al Agent是什么📕Al Agent的工作原理与技术💪Al Agent应用领域🚀智能家居应用🌈医疗健康领域⭐金融服务行业🌂交通运输管理🎬教育培训应用 🔒Al Agent优势与挑战✊Al Age…

苹果获得OpenAI董事会观察员职位、Runway最新估值40亿美元

ChatGPT狂飙160天,世界已经不是之前的样子。 更多资源欢迎关注 据知情人士透露,苹果应用商店(App Store)负责人、前营销主管Phil Schiller被选中担任这一职位。这位知情人士说,作为董事会观察员,他不会以正…

【综合能源】计及碳捕集电厂低碳特性及需求响应的综合能源系统多时间尺度调度模型

目录 1 主要内容 2 部分程序 3 实现效果 4 下载链接 1 主要内容 本程序是对《计及碳捕集电厂低碳特性的含风电电力系统源-荷多时间尺度调度方法》方法复现,非完全复现,只做了日前日内部分,并在上述基础上改进升级为电热综合电源微网系统&…

【uni-app】基础

一、官网 网址:https://zh.uniapp.dcloud.io/tutorial/其他辅助网页讲解:https://www.wenjiangs.com/doc/7y94pldun2插件下载free:https://ext.dcloud.net.cn/ 二、提示框 用uni.showToast提醒的次数超过7个字的时候就会导致文字显示不全&…

SSL证书遇到问题时的解决方案

当SSL证书遇到问题时,可能会影响到网站的安全性和用户体验,常见的问题包括证书过期、域名不匹配、证书链不完整、证书颁发机构不受信任、私钥丢失或损坏等。 一、证书过期 解决方法:更新或续订证书。这通常涉及联系你的SSL证书提供商&#…

ACL 2024 | CoCA:自注意力的缺陷与改进

近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 T…

Shopee Live的订单量在泰国猛增超40倍!然鹅,泰国站佣金费率上调,还有得做吗?

Shopee,作为东南亚地区电子商务领域的佼佼者,不仅在区域内树立了行业标杆,更在泰国这一充满活力的市场中占据了举足轻重的地位。其创新的商业模式与不断优化的服务体验,赢得了广大消费者的青睐与信赖。近日,Shopee官方…