无代码开发AI服务 - 利用向量库Kendra和Llama大模型在亚马逊云科技AWS上创建RAG知识库

news2025/1/16 6:59:06

简介:

小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案,帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWS AI最佳实践,并应用到自己的日常工作里。

上次我们介绍了我们利用ElasticSearch作为向量库构建RAG知识库。本次我将介绍用Amazon原生托管向量库服务Kendra,结合亚马逊云科技热门AI模型管理服务Amazon SageMaker,无代码形式手把手开发一个用户的个性化推荐系统。本文将通过利用Kendra向量化、语义搜索模型将用户数据文档生成向量并保存,最后利用RAG和Amazon Bedrock上的Llama大语言模型在Kendra中进行语义搜索结合用户输入问题生成回复。我将带领大家编写一步一步的细节代码和展示实际的生成式AI实操项目,0基础学会AI核心技能。本架构设计全部采用了云原生Serverless架构,提供可扩展和安全的AI应用解决方案。本方案架构图如下:

项目开发背景知识

Amazon SageMaker

Amazon SageMaker 是一款全面的机器学习模型托管服务,旨在帮助开发者和数据科学家快速构建、训练和部署机器学习模型。SageMaker 提供了丰富的工具和功能,如内置的 Jupyter Notebook、自动模型调优和托管训练环境,使整个机器学习工作流程更加简化和高效。

特别值得一提的是 SageMaker 的 Canvas 功能。Canvas 是一个无代码界面,允许用户通过拖放操作创建机器学习模型。即使没有编程经验,业务分析师和非技术用户也可以通过 Canvas 轻松构建、训练和部署机器学习模型,从而大大降低了机器学习的门槛。

Amazon Kendra

Amazon Kendra 是一款智能搜索服务,利用机器学习技术来改进搜索结果的准确性和相关性。Kendra 可以集成到各种应用中,为用户提供基于自然语言理解的精确搜索体验。无论是企业内部的知识库搜索,还是网站上的内容搜索,Kendra 都能显著提升搜索效率。

通过 Amazon SageMaker 和 Amazon Kendra,开发者可以利用强大的机器学习和智能搜索工具,构建高效、智能的应用程序,提升业务运营效率和用户体验。

本方案包括的内容:

  • 部署 Amazon Kendra 作为知识库。

  • 使用 Amazon SageMaker Canvas开发和部署AI基础模型。

  • 将 Amazon Kendra 用作大模型的外部知识库并调用测试。

项目搭建具体步骤:

1. 首先我们进入亚马逊云科技控制台,点击进入Amazon Bedrock服务

 2. 查看我们将使用的LLM大语言模型Titan Text G1 Premier

 3. 接下来我们进入Kendra服务,点击创建索引Index,索引主要的作用是提升检索的速度和准确度

4. 我们为索引命名“lab-index”

 5. 接下来我们为Kendra授权,用于导出日志和运行状态监控信息,再保持其他配置默认,点击创建

 6. 等待Kendra创建完成,我们再点击"add data source"添加数据源

 7. 由于我们想从S3中添加数据,我们这里选择S3 data connector

 8. 将数据连接命名为“s3-data”, 其他配置保持默认,语言选择英文

9. 为S3连接添加必要的IAM权限,

10. 添加数据源S3桶

11. 配置数据同步的模式,只同步增量数据,并设置同步频率为“仅需要时同步”,保持其他配置默认,点击创建

12.  创建完成后,点击“sync now”开始同步

13. 接下里我们进入到SageMaker中,创建一个新的SageMaker Canvas无代码开发AI模型

14.  我们打开Canvas

 15. 点击Canvas中的左侧边栏下的“Gen AI”功能,可以调用Kendra搜索文档向量,并Bedrock上的大语言模型生成内容。进入后点击部署模型托管服务器。我们选择实例类型“ml.g5.2xlarge”,并点击部署。

16. 我们对部署的RAG知识库进行测试,输入问题“What were major Amazon investments in the year 2018?”

17. 我们得到了基于向量库搜索生成的问题回答

18. 同时SageMaker Canvas也支持大模型回复的参数配置,如Temperature, Top P, Top K等

 

以上就是在亚马逊云科技上利用Kendra和SageMaker无代码形式开发大模型AI知识库的全部步骤。欢迎大家关注小李哥,未来获取更多国际前沿的生成式AI开发方案!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1979694.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网鼎杯comment二次注入

靶机网址:BUUCTF在线评测 进来就是这个界面,点击发帖后需要进行登录。 从界面可以看出用户是zhangwei,密码是zhangwei***,密码的最后三位需要进行暴力破解。 这里需要用到工具Burp Suite进行抓包。 这就是抓到的包,我…

【大模型从入门到精通8】openAI API 提升机器推理:高级策略2

这里写目录标题 示例定义处理输入的函数链式思考提示示例:结构化系统和用户提示获取并展示模型的回答实现内心独白结论与最佳实践 示例 设置环境 在深入实施之前,设置必要的环境至关重要。这包括加载 OpenAI API 密钥并导入相关的 Python 库。以下代码块…

Chapter 25 面向对象

欢迎大家订阅【Python从入门到精通】专栏,一起探索Python的无限可能! 文章目录 前言一、初识对象二、成员方法三、类和对象 前言 面向对象编程(OOP)是Python编程中的一个核心概念,它能帮助程序员更好地组织和管理代码…

01 计算机系统基础-2

操作系统 进程管理 进程管理是操作系统的核心,但如果设计不当,就会出现死锁的问题。如果一个进程在等待一件不可能发生的事,则进程就死锁了。而如果一个或多个进程产生死锁,就会造成系统死锁。基于死锁产生机制及解决方案&#…

LeetCode Hard|【460. LFU 缓存】

力扣题目链接 LFU全称是最不经常使用算法(Least Frequently Used),LFU算法的基本思想和所有的缓存算法一样,一定时期内被访问次数最少的页,在将来被访问到的几率也是最小的。 相较于 LRU 算法,LFU 更加注重…

MATLAB霍夫曼表盘识别系统

MATLAB霍夫曼表盘识别系统 一、介绍 本设计为基于MATLAB的表盘指针识别,算法原理是基于hough变换。可检测压力表,石英手表,电表刻度,气压表等带指针刻度的表盘。通过hough检测直线和圆的关系,得出指针夹角&#xff0…

保形分位数回归(CQR)

目录 简介1 介绍提纲式总结 分位数回归从数据中估计分位数 3 共性预测4 保形分位数回归(CQR)两个定理 6 实验7 结论 简介 保形预测是一种构造在有限样本中获得有效覆盖的预测区间的技术,无需进行分布假设。尽管有这种吸引力,但现有的保形方法可能是不必…

(C题老外游中国)2024年华数杯大学生数学建模竞赛解题思路完整代码论文集合

我是Tina表姐,毕业于中国人民大学,对数学建模的热爱让我在这一领域深耕多年。我的建模思路已经帮助了百余位学习者和参赛者在数学建模的道路上取得了显著的进步和成就。现在,我将这份宝贵的经验和知识凝练成一份全面的解题思路与代码论文集合…

Open3D 三维重建-Delaunay Triangulation (德劳内三角剖分)

目录 一、概述 1.1原理 1.2实现步骤 1.3应用 二、代码实现 2.1关键函数 2.2完整代码 三、实现效果 3.1原始点云 3.2重建后点云 Open3D点云算法汇总及实战案例汇总的目录地址: Open3D点云算法与点云深度学习案例汇总(长期更新)-CSD…

MySQL--日志管理

前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 一、日志简介 MySQL日志主要分为4类,使用这些日志文件,可以查看MySQL内部发生的事情。这4类日志分别是: 错误日志&#xff1…

程序编译及链接

你好!感谢支持孔乙己的新作,本文就程序的编译及链接与大家分析我的思路。 希望能大佬们多多纠正及支持 !!! 个人主页:爱摸鱼的孔乙己-CSDN博客 ​ ​ 1.翻译译环境与运行环境 当我们进行程序设计时&…

Android Graphics 显示系统 - 计算FPS的原理与探秘Present Fence

“ 最近忙着新房子装修的事情,这篇计划内的文章拖了好久一直没有足够的时间来写作,终于挤出些儿时间来继续研究学习了。” 整了四个晚上终于拼凑出一篇文章,虽说是讲FPS计算原理,但该文涉及的知识点还是蛮多的,特别是对…

webpack的loader机制

webpack的loader机制 loader本质上就是导出函数的JavaScript模块。导出的函数,可以用来实现内容的转换。 /* * param{string|Buffer} content 源文件的内容 * param{object} [map] SourceMap数据 * param{any} [meta] meta数据,可以是任何数据 * */ fu…

黑马头条vue2.0项目实战(五)——首页—频道编辑

目录 1. 使用页面弹出层 1.1 页面弹出层简单使用 1.2 创建频道编辑组件 1.3 页面布局 2. 展示我的频道 3. 展示推荐频道列表 3.1 获取所有频道 3.2 处理展示推荐频道 4. 添加频道 5. 编辑频道 5.1 处理编辑状态 5.2 切换频道 5.3 让激活频道高亮 5.4 删除频道 6.…

K8S Docker搭建RocketMQ Dledger高可用集群

本篇文章回顾在华润基于K8S和Docker云设施搭建初步高可用具备failover的RocketMQ集群。RocketMQ版本是5.0.0。 目前现状 采用Dledger模式部署集群,3台namesrv,3台broker,namesrv每台1g的Docker部署,broker每台2g的Docker部署。测…

Hyper-V创建虚拟机安装OpenEulerOS

文章目录 下载OpenEulerHyper-V创建虚拟机 下载OpenEuler 进入官网下载,我选择的是 openEuler 24.03 LTS ,选择第一个版本即可: Hyper-V创建虚拟机 点击新建->虚拟机: 点击下一步: 输入虚拟机名称&#xff0c…

AMD Product Specifications - AMD 产品规格汇总

AMD Product Specifications - AMD 产品规格汇总 1. Desktop, Laptop and Workstation Processor Specifications (台式处理器、笔记本电脑处理器和工作站处理器规格)2. Server Processor Specifications (服务器处理器规格)3. Embedded Processor Specifications (嵌入式处理器…

element-ui表格1.0.0.1,表格的属性

前言:基于vue2element-ui的理论转实践的使用 第一组:数据显示 利用v-bind:data在table绑定数据源,将数据利用prop的属性传入到table-column,渲染到表格中 正片开始 首先,常用的属性(作者常用&#xff09…

书生大模型_InternLM + LlamaIndex RAG 实践

1.任务要求 基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前InternLM2-Chat-1.8B模型不会回答,借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力,截图保存。 来源: https://github.…

鸿蒙媒体开发【媒体会话-提供方】音频和视频

媒体会话-提供方 介绍 本示例主要展示了媒体会话(媒体提供方)的相关功能,使用ohos.multimedia.avsession等接口实现媒体提供方与媒体播控中心自定义信息的交互功能。 注意: 此示例仅展示媒体提供方的相关功能,如果需…