基于火山引擎云搜索服务和豆包模型搭建 RAG 推理任务

news2025/1/21 2:53:14

大语言模型(LLM,Large language model)作为新一轮科技产业革命的战略性技术,其核心能力在于深层语境解析与知识融合。在生成式人工智能方向主要用于图像生成,书写文稿,信息搜索等。当下的 LLM 模型是基于大量数据训练的,目的是让它们掌握广泛的普遍知识,这些知识被储存在它们神经网络的权重(也就是参数记忆)里。但是,如果我们要求 LLM 生成的回答涉及到它训练数据之外的知识,比如最新的、专有的或某个特定领域的信息,这时就可能出现事实上的错误(我们称之为“幻觉”)。

RAG (Retrieval-Augmented Generation,检索增强生成)的核心思想是让语言模型在生成回答或文本时能够动态地从外部知识库中检索相关信息。这种方法能够提高模型生成内容的准确性、可靠性和透明度,同时减少“幻觉”

本文将介绍如何基于火山引擎云搜索服务和方舟平台来构建专属的 RAG 智能问答系统。系统使用 OpenSearch 作为外部知识库,火山豆包作为大语言模型,全流程构建在火山引擎平台上。本次实践采用的语料为火山引擎云搜索服务知识库,将语料处理后存入 OpenSearch 索引中,同时通过部署在云搜索服务 ML 节点上的 Embedding 模型,将原始语料额外转化为向量字段存储在同一个 OpenSearch 索引中,方便后续做混合查询召回。

在查询流程中,用户通过对话框输入问题,RAG 应用会将用户输入的问题通过 Embedding 模型转化为向量,然后使用云搜索服务 OpenSearch 的混合查询功能查询问题向量和问题文本召回 Top n 的文档结果,再将文档结果发送给豆包大模型,最后按照要求根据文档内容回答用户的问题。

准备资源

创建云搜索 ML 服务

登陆火山引擎云搜索控制台,创建实例集群,版本选用 Opensearch 2.9.0实例创建完成后可根据实际需求,开通实例和 Dashboards 的公网访问。

1.进入实例详情页->ML 服务,配置 CPU /内存比例后启用。

2.进入模型服务->公共模型,启动一个模型用于语义嵌入 Embedding,推荐使用 PEG,配置参数后启动。

开通大模型服务

1.进入火山引擎方舟控制台,在模型推理下创建推理接入点,接入模型建议选用 Doubao-pro-32k(或者Doubao-lite-32k),创建完成后可以获取到接入点 Endpoint。

2.进入 API Key 管理,创建 API Key 并记录。

# 填充如下内容,后续会用在rag模型中。
{
  "model32k": {
    "host": "https://ark.cn-beijing.volces.com/api/v3",
    "endpoint": "ep-xxxx-xx",
    "apikey": ""
  }
}

配置 NAT 网关

通过配置 NAT 网关使私有网络内部的实例允许通过 NAT 网关访问到公网,用于连接大模型服务。

首先进入火山引擎 NAT 网关控制台,创建公网 NAT 网关。这里需要注意私有网络和子网一定要和云搜索服务实例所在的网络保持一致,可选用自动配置或手动配置:

  • 自动配置会开启私网下所有 ECS 的公网访问,需绑定 EIP(公网 IP);

  • 选择手动配置后需要自行配置公网 IP 和访问规则。

搭建步骤

导入任务数据

1.这里演示为基于火山引擎云搜索服务文档语料搭建的推理任务,所以在创建任务时选择模板代码-云搜索文档任务,大家在具体使用中可以根据需求用其他语料库进行搭建。

2.增加 Config 参数,参考如下模板填入。

参数

说明

task

"migrate" : 表示启动迁移任务

"init": 表示只创建索引

其他或不填: 表示从原始文档进行构建,如果需要运行此任务请提工单咨询

dim

向量维度, 根据 embedding 模型的长度进行填充,例如 PEG 模型为 1024

opensearch

"username" : OpenSearch 的用户名

"password" : OpenSearch 的密码

"host" : 云搜索接入点域名

"port" : 云搜索接入点端口

"index" : 迁移的目标索引名称,将处理好的云搜索文档数据迁移到此索引

'{
        "task":"migrate",
        "dim": 1024,
        "opensearch": {
            "username": "opensearch的用户名",
            "password": "opensearch的密码",
            "host": "云搜索接入点域名",
            "port": 9200,
            "schema": "https",
            "index": "迁移的索引名称"
        }
   }'

3.本文演示添加的依赖为云搜索文档任务配置依赖,如果需要额外依赖可以自行在配置中添加。

运行语义嵌入任务

1.选择 xc_import_embed 模板任务,Config 参数说明:

参数

说明

opensearch

"username": "admin", "password": "k", "host": "opensearch-o-xxx.escloud.volces.com", "port": 9200, "schema": "https", "index": "cloud_serach", # 源索引 "target_index": "cloud_serach" #目标索引,源索引和目标索引名称相同,即使用同一个索引。

embedding

模型调用信息复制过来

field_dict

需要进行语义嵌入的字段这里必须填入以下值

{ "full_title": "full_title_knn", "summary": "summary_knn", "content.summary": "content.summary_knn" }

'{
        
    "opensearch": {
        "username": "xxx",
        "password": "xxx",
        "host": "opensearch-o-xxxx.escloud.ivolces.com",
        "port": 9200,
        "schema": "https",
        "index": "cloud_serach",
        "target_index": "cloud_serach"
    },
    "embedding": {
           调用信息复制过来
    },
    "field_dict": {
            "full_title": "full_title_knn",
            "summary": "summary_knn",
            "content.summary": "content.summary_knn"
    }
}'

2.文中实践需要添加的依赖配置如下:

启动 RAG 推理服务

1.在 TOS Bucket 中上传 RAG 推理服务配置。

|-rag-demo
|--rag_config.json
|--config.json

config.json内容

{}

rag_config.json 的格式为:

参数

说明

opensearch

Index 为用来检索的索引名称,需要与文档、语义任务的索引名称相同,其他配置同上不再赘述

llm.model32k

Host:火山方舟的 api 地址,这里的例子是北京地区的地址

Endpoint: 火山方舟推理服务的 endpoint

API Key: 火山方舟的 apikey

embeddings

调用信息复制过来

2.创建推理服务(打开私网访问)并启动

完成前面的所有配置操作后,已经可以在相同 VPC 环境的 ECS 中,通过 RAG 模型的调用信息验证云搜索服务文档推理任务了。可以直接在 ECS 命令行中运行调用信息,查看到持续输出 txt 文本内容。

RAG 推理服务演示

为了更加直观的演示云搜索服务文档的 RAG 推理服务,本文借助火山引擎 API 网关产品,为 RAG 推理服务配置一个固定的公网域名。通过直接在浏览器中的固定访问地址访问 RAG 推理服务,并在可视化页面咨询云搜索服务产品的各种问题。

配置公网访问

1.进入火山引擎 API 网关控制台创建实例,为保证网络畅通需要选择和云搜索实例相同的私有网络和子网。创建完成后进入实例继续创建服务。

2.接下来创建 Upstream,后端服务选用固定域名,域名和端口从刚刚启用的 RAG 调用信息内获取。

3.并在服务内创建路由,路径选用前缀匹配;Upstream 选用固定域名,使用刚刚创建的 Upstream。

推理问答

创建完成后进入服务列表就可以获取到公网访问域名,拼接 RAG 推理服务的完整访问地址,格式为 http://[url]/?model=[model_name],其中 url 替换为在 API 网关中获取到的服务公网访问域名,model_name 替换为 RAG 模型的名称后就可以在浏览器中通过刚才拼接好的固定域名访问 RAG 推理服务,并在可视化页面中咨询本文所用到的云搜素服务文档库的相关问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2033709.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【扒网络架构】backbone、ccff

backbone CCFF 还不知道网络连接方式,只是知道了每一层 backbone backbone.backbone.conv1.weight torch.Size([64, 3, 7, 7])backbone.backbone.layer1.0.conv1.weight torch.Size([64, 64, 1, 1])backbone.backbone.layer1.0.conv2.weight torch.Size([64, 64,…

Vue3封装tabs切换组件

效果如下&#xff1a; 代码如下&#xff1a; <template><div class"tabs-container"><div class"tabs-header"><div v-for"tab in tabs" :key"tab.name" class"tab" click"handleTabClick(tab)&…

TikTok美区账号起号攻略:广告投流和矩阵营销怎么选?

在TikTok美区市场&#xff0c;品牌和卖家可以选择不同的策略来提升曝光率和销售业绩&#xff0c;对于品牌成功至关重要。现在TikTok Shop的两个主流玩法是广告投流和账号矩阵营销&#xff0c;各有其独特优势和适用场景。下面我将对这两种策略综合分析&#xff0c;分别介绍其主要…

告别笨重工具,LICEcap:你的高效GIF录制方案,快来体验!

前言 你是否曾有过这样的烦恼&#xff1a;想要向朋友展示一段精彩的操作&#xff0c;却发现录屏软件要么太过笨重&#xff0c;要么录制的视频文件庞大难以分享&#xff1f;嘿&#xff0c;朋友们&#xff0c;今天小江湖就要给大家安利一款神器——LICEcap&#xff0c;它绝对能让…

速学nvm Nodejs版本管理与nrm源管理

速学nvm Nodejs版本管理与nrm源管理 nvm Nodejs版本管理nvm是什么&#xff1f;nvm安装下载版本&#xff1a;安装步骤&#xff1a;nvm常用指令&#xff1a; nrm源管理nrm是什么&#xff1f;&#xff1f;nrm全局安装nrm常用指令 nvm Nodejs版本管理 NVM 是一种用于管理多个主动节…

自主开发的数据采集监控平台对使用方有什么优势?

蓝鹏测控自主开发的LP-SCADA数据采集监控平台&#xff0c;更具自主性&#xff0c;完全可以根据使用方的需求进行系统定制&#xff0c;如&#xff1a;功能、显示、界面、采集数量、数据分析等。 自主开发 基于WEB的一套数据采集系统平台&#xff0c;同各种设备及三方系统建立通…

用LLM搭建100个应用:从0到1搭建自己的Windows贾维斯

从ChatGPT发布至今&#xff0c;确实所有的应用都值得用大模型重新做一遍。国内外对基底大模型卷了又卷&#xff0c;新生的应用也在模型的迭代过程中&#xff0c;起起伏伏。 但可以坚信的是&#xff0c;AGI的方向和每个时代人们永远在变的不变的需求。 而求外不如求己&#xff0…

人像后期精修 调色+精修笔记(精修+化妆+美术)

色彩调节 关于调色曲线的学习&#xff1a; 学习链接&#xff1a;一看就懂的曲线调色教程【手机摄影后期】_哔哩哔哩_bilibili 从左向右就是由暗部越来越到亮部 越靠近右侧的越是亮部 精修常用技巧 学习视频&#xff1a;【PS精修教程】2024最详细最全的PS人像精修全套68集&a…

机器学习入门(五):K近邻算法API K值选择问题

目录 1. K 近邻算法 API 1.1 Sklearn API介绍 1.2 鸢尾花分类示例代码 1.3 小结 2. K 值选择问题 2.1 K取不同值时带来的影响 2.2 如何确定合适的K值 2.3 GridSearchCV 的用法 2.4 小结 1. K 近邻算法 API K近邻&#xff08;K-Nearest Neighbors, KNN&#xff09;算法作…

(附源码)SSM动漫展示系统的开发-计算机毕设 25454

SSM动漫展示系统的开发 摘 要 21世纪&#xff0c;全球网络化&#xff0c;科技在突飞猛进。我们的生活也随之发生了极大的变化。随着计算机的普及&#xff0c;我们社会和经济生活中的各个领域也在发生改变。人们进行信息交流的深度与广度在不断增加,这使得传统的行业模式也要跟随…

【乐吾乐大屏可视化组态编辑器】发送指令

发送指令 在线使用&#xff1a;https://v.le5le.com/ 发送指令是指将数据通过通信接口下发到设备 1. 拖动图元&#xff08;以按钮为例&#xff09;到画布&#xff0c;右侧切换到交互面板&#xff0c;添加单击事件。 2. 点击“添加动作”&#xff0c;动作类型选择“发送数据”…

图像文本擦除无痕迹!复旦提出EAFormer:最新场景文本分割新SOTA!(ECCV`24)

文章链接&#xff1a;https://arxiv.org/pdf/2407.17020 git链接&#xff1a;https://hyangyu.github.io/EAFormer/ 亮点直击 为了在文本边缘区域实现更好的分割性能&#xff0c;本文提出了边缘感知Transformer&#xff08;EAFormer&#xff09;&#xff0c;该方法明确预测文…

JS 【详解】sourcemap

sourcemap 的作用 JS 上线时要压缩、混淆&#xff0c;线上的 JS 报错信息无法识别行、列&#xff0c;sourcemap 可解决这个问题 sourcemap 的原理 sourcemap 文件中&#xff0c;保存了 JS 代码压缩后和压缩前的对应关系 怎样找到 sourcemap 文件 方法1&#xff1a;将 JS 的后缀…

以太彩光网 VS PON网络 谁更适合企业级园区

耿望阳 中建协绿建与智能分会专家委副主任、华南理工大学建筑设计研究院电气(智能化)顾问总工 光进铜退的背后,折射的是时代的变迁,技术的进步。自2009年起,光纤技术至今早已潜移默化渗透到人们工作和生活每个角落,全光网已经具备了未来的确定性,而对于企业级市场来说,该怎么…

c语言第12天

指针的引入 为函数修改实参提供支持。 为动态内存管理提供支持。 为动态数据结构提供支持。 为内存访问提供另一种途径。 指针概述 内存地址&#xff1a;系统为了内存管理的方便&#xff0c;将内存划分为一个个的内存单元&#xff08;1个内存单元占1个字 节&#xff09;&…

opencv 深度图视差图可视化案例

参考:https://www.cnblogs.com/zyly/p/9373991.html(图片这里面下载的) https://blog.csdn.net/He3he3he/article/details/101053457 双目测距论文: http://www.shcas.net/jsjyup/pdf/2016/9/%E5%9F%BA%E4%BA%8E%E5%8F%8C%E7%9B%AE%E7%AB%8B%E4%BD%93%E8%A7%86%E8%A7%89%E…

【51蛋骗鸡矩阵键盘组合键的使用】2021-12-28

组合键以第一按键所在的行列除外可以和任意的按键组合&#xff0c;每一个都可以和剩下的9个组合。 unsigned char JianPanShaoMiao(/*使用行列反转扫描法*/) { unsigned char H15,L240,Ys0;P1H;if(P1!15){ while(Ys);//消抖HP1;P1L;LP1;while(Ys);//消抖 // while(P1!240);/…

Temu测评自养号的基本概念和目的

在跨境电商领域&#xff0c;自养号的创建与维护已成为提升业务效率、规避平台风险的关键策略。实现稳定、高效、安全的Temu测评自养号运营。 环境系统构建&#xff1a;掌握核心技术&#xff0c;规避依赖风险 市场上的现成解决方案往往缺乏定制化风控能力&#xff0c;自建系统则…

车载 | 硬体: 教你如何进行校准高通QCA6595的Wi-Fi频偏

在高通QCA6595产品在投入使用前&#xff0c;进行频率校准是关键步骤&#xff0c;以保障其与其他设备的顺畅搜索和连接稳定性。本文旨在提供一份全面的操作指南&#xff0c;助您完成校准流程。 首先&#xff0c;根据下图指示&#xff0c;完成QCA6595芯片与电脑、测试仪器之间的…

软件测试下的AI之路(6)

😏作者简介:博主是一位测试管理者,同时也是一名对外企业兼职讲师。 📡主页地址:【Austin_zhai】 🙆目的与景愿:旨在于能帮助更多的测试行业人员提升软硬技能,分享行业相关最新信息。 💎声明:博主日常工作较为繁忙,文章会不定期更新,各类行业或职场问题欢迎大家…