LLM应用架构 LLM application architectures

news2025/2/26 14:29:58

在本课程的最后一部分,您将探讨构建基于LLM的应用程序的一些额外考虑因素。首先,让我们把迄今为止在本课程中所见的一切汇总起来,看看创建LLM驱动应用程序的基本组成部分。您需要几个关键组件来创建端到端的应用程序解决方案,从基础设施层开始。该层提供了计算、存储和网络,以提供LLMs,并托管应用程序组件。您可以利用您的本地基础设施,或者通过按需和按使用量计费的云服务提供此基础设施。
在这里插入图片描述

接下来,您将包括您希望在应用程序中使用的大型语言模型。这些可能包括基础模型,以及您根据特定任务进行了自定义的模型。这些模型部署在适合您推理需求的基础设施上。考虑到您是否需要与模型进行实时或准实时交互。
在这里插入图片描述

您还可能需要从外部来源检索信息,例如在检索增强生成部分讨论的那些。
在这里插入图片描述

您的应用程序将从大型语言模型返回完成内容给用户或消费应用程序。根据您的用例,您可能需要实现一种机制来捕获和存储输出。例如,您可以构建在会话期间存储用户完成内容以增加LLM的固定上下文窗口大小的容量。
在这里插入图片描述

您还可以从用户那里收集反馈,这可能对进一步的微调、调整或评估在应用程序成熟时很有用。
在这里插入图片描述

接下来,您可能需要使用大型语言模型的其他工具和框架,以帮助您轻松实施本课程中讨论的某些技术。例如,您可以使用Len Chains内置库来实施PowReact或思维链提示等技术。您还可以利用模型中心来集中管理和共享模型,以供应用程序使用。
在这里插入图片描述

在最后一层,通常会有某种用户界面,应用程序将通过该界面进行访问,例如网站或REST API。这一层还包括与应用程序交互所需的安全组件。
在这里插入图片描述

从高层次来看,这个架构堆栈代表了构建生成式AI应用程序的各种组成部分。无论是人类最终用户还是通过其API访问您的应用程序的其他系统,您的用户都将与整个堆栈进行交互。正如您所看到的,模型通常只是构建端到端生成式AI应用程序的一部分。
在这里插入图片描述

恭喜您完成了完整的生成式AI项目生命周期。希望您感到已经形成了一些关于在构建LLM应用程序时需要考虑的重要问题的直觉。

  1. 本周,您了解了如何通过使用一种名为“强化学习与人类反馈”的技术,或简称RLHF,微调模型,以使其与人类偏好(如帮助、无害和诚实)保持一致。
  2. 鉴于RLHF的流行,存在许多现有的RL奖励模型和人类对齐数据集,使您能够快速开始对模型进行对齐。在实践中,RLHF是一种非常有效的机制,可用于改善模型的对齐性,降低其响应的毒性,并让您更安全地将模型用于生产。
  3. 您还学会了通过压缩、量化或修剪模型来优化模型以用于推理的重要技术。这可以减小为在生产环境中提供LLMs所需的硬件资源的数量。
  4. 最后,您还探讨了通过结构化提示和与外部数据源和应用程序的连接来帮助模型在部署中表现更好的方法。

LLMs可以在应用程序中充当理性引擎的精彩角色,充分利用它们的智能来支持令人兴奋和实用的应用程序。像Lang Chain这样的框架正在使快速构建、部署和测试LLM驱动的应用程序成为可能,对于开发人员来说是一个非常令人兴奋的时刻。

在TEA的课程结尾,我们将探讨一些正在积极研究的领域,这些领域可能会在未来几个月和年份中塑造该领域的发展轨迹。

Reference

https://www.coursera.org/learn/generative-ai-with-llms/lecture/LLhcT/llm-application-architectures

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1087607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

个人财务预算系统BudgetBee

什么是 BudgetBee ? BudgetBee 是一个个人财务预算系统。通过 BudgetBee,您可以轻松管理您的个人财务。它可以帮助您跟踪您的支出和收入,以便您可以减少支出并增加储蓄。 镜像下载 官方没有在 docker hub 上发布镜像,而是采用了自…

idea中导入eclipse的javaweb项目——tomact服务(保姆级别)

idea中导入eclipse的javaweb项目——tomact服务(保姆级别) 1. 导入项目2. Project Settings下的各种配置步骤2.1 检查/修改 jdk 的引入2.2 配置Modules-Dependencies2.2.1 删掉eclipse相关的多余配置2.2.2 删掉jar包2.2.3 添加tomcat的依赖 2.3 配置Libr…

Semi D2C 设计稿转代码框架

TL;DR Semi Design 是抖音前端团队开发的设计系统,包括 Semi UI 组件库,DSM 设计系统定制,D2C 设计稿转代码等方向。本文主要介绍 Semi D2C的能力边界,与其他方案的差异,探索历程,底层实现原理 / 难点。阅读时间 30-45min。可以做什么,不可以做什么? D2C 为 Design to…

ros协议的最佳解决方案

在网络通信中,ros(点对点隧道协议)是一种常用的VPN(虚拟专用网络)协议,用于建立安全的连接。然而,由于ros协议的漏洞和安全性问题,我们需要采取一些措施来加强其安全性。在本文中&am…

基于片段的分子生成网络 (FLAG)使用方法及案例测评

本文来源于中国科技大学计算机科学与技术学院刘淇教授课题组于2023年发表在ICLR2023上的文章《MOLECULE GENERATION FOR TARGET PROTEIN BINDING WITH STRUCTURAL MOTIFS》。 在本文中,作者提出了一个基于片段的分子生成网络,FLAG (Fragment …

STM32 多功能按键中断

key1 开关实现led1亮灭,key2开关实现蜂鸣器开关,key3开关实现风扇开关 main.c #include "uart.h" #include "key_it.h" #include "led.h" int main() {char c;char *s;uart4_init();//串口初始化all_led_init();key_it_config();fengshan_init…

2023年中国脱皮芝麻生产工艺、产量及消费量分析[图]

白芝麻在一般的油脂生产中是不脱皮的,但是直接食用时最好进行脱皮处理。原因在于芝麻种皮或角质层中纤维和草酸盐含量(2%~3%草酸钙螯合物)较高,使得其油和粕不能作为人类的蛋白质资源,只能用作牛的饲料或肥料。因此&am…

MarkDown制作思维导图

MarkDown制作思维导图 很实用的markdown转xmind思维导图教程 1、markdown导出OPML文件 💡 Typora 导出,需要安装 Pandoc,安装后重启电脑即可导出 2、xmind选择导入OPML格式 💡 思维导图markdown的标题生成,因此可能要…

【嵌入式】堆栈与单片机内存

堆栈 在片内RAM中,常常要指定一个专门的区域来存放某些特别的数据 它遵循顺序存取和后进先出(LIFO/FILO)的原则,这个RAM区叫堆栈。 其实堆栈就是单片机中的一些存储单元,这些存储单元被指定保存一些特殊信息,比如地址&#xff0…

自动驾驶学习笔记(三)——场景设计

#Apollo开发者# 学习课程的传送门如下,当您也准备学习自动驾驶时,可以和我一同前往: 《自动驾驶新人之旅》免费课程—> 传送门 《2023星火培训【感知专项营】》免费课程—>传送门 文章目录 前言 场景设计平台 场景地图 场景基本…

颠覆出海营销,机器学习带来买量新变化

这几年出海营销的神话都是机器学习给的: 机器学习显著降低CPI、机器学习大幅提高下载量、机器学习低成本撬动大流量... 此前,用户增长每一步都高度依赖营销人员的运营经验;现在,机器学习正在完全颠覆买量模式拓展营销格局&#…

【线下沙龙】低成本高效率构建您的业务系统

全球企业都在向数字化迈进,但在各类行业调查中表明,只有不到20%的前沿企业通过其数字化转型而获得了成功,大部分企业都将高昂的时间和成本花费在了数字化技术的实施和培训上面。很多企业在转型的过程中面临着众多挑战:…

pycharm中快速对比两个.py文件

在学习一个算法的时候,就想着自己再敲一遍代码,结果最后出现了一个莫名其妙的错误,想跟源文件对比一下到底是在哪除了错,之前我都是大致定位一个一个对比,想起来matlab可以快速查找出两个脚本文件(.m文件)的区别&#…

基于深度学习的“语义通信编解码技术”框架分类

目录 基于神经网络的语义提取基于神经网络的语义信源编码基于神经网络的语义信源信道联合编码基于神经网络的语义编码与数字调制联合设计参考文献 基于神经网络的语义提取 在现有的信源编码前端加上一个语义提取神经网络[53] ,如图所示。语义提取神经网络的输入是原…

linux 安装python django pip 遇到的问题

Python解决SSL不可用问题 解决方案: 首先要明白python版本需要和openssl的版本需要相对匹配的,在Python3.7之后的版本,依赖的openssl,必须要是1.1或者1.0.2之后的版本,或者安装了2.6.4之后的libressl,linux…

使用AIGC快速涨粉

1、newbing 2、输入提示词: 我想拍一个抖音短视频,请帮我选题,要求吸引人的 3、根据他的回答,选中一个有代表性的。 请产生《我用抖音教你如何做出超级美味的巧克力蛋糕,只需要三分钟,简单又好吃》的脚本 …

MobaXterm使sftp目录与cmd目录同步

MobaXterm使sftp目录与cmd目录同步 创建session时在ssh菜单栏中选择Advanced SSH settings其中SSH-browser type 选择SCP(enhanced speed) 勾选Follow SSH path

人体行走电压测试仪的使用说明

人体行走电压测试仪是一种用于测试人体静电电压的仪器,通常由控制单元、传感器、显示屏等组成。以下是人体行走电压测试仪的使用说明: 连接电源:将测试仪的电源线插入电源插座,并将另一端插入测试仪的电源接口。 连接传感器&…

SpringMVC之框架搭建开发实例请求的处理流程

什么是springmvc Spring Web MVC是一种基于Java的实现了MVC设计模式的、请求驱动类型的、轻量级Web框架。 项目中加入springmvc支持 导入依赖 <properties><project.build.sourceEncoding>UTF-8</project.build.sourceEncoding><maven.compiler.sourc…

应用在汽车发动机温度检测中的高精度温度传感芯片

汽车发动机是为汽车提供动力的装置&#xff0c;是汽车的心脏&#xff0c;决定着汽车的动力性、经济性、稳定性和环保性。根据动力来源不同&#xff0c;汽车发动机可分为柴油发动机、汽油发动机、电动汽车电动机以及混合动力等。 常见的车用温度传感器有进气温度传感器、变速器…