AIGC: 从两个维度快速选择大模型开发技术路线

news2024/11/19 11:17:48

在当今人工智能飞速发展的时代,大模型开发技术路线的选择至关重要。本文将从两个维度出发,为大家快速介绍不同的大模型开发技术路线,帮助你在开发过程中做出明智的决策。

在这里插入图片描述

一、两个维度解析

  1. 传入大模型的信息
    • 低要求:传入的信息相对简单、基础,不需要过多的复杂处理。
    • 高要求:传入的信息丰富、详细,可能需要进行特定的整理和预处理。
  2. 对大模型能力的要求
    • 低要求:期望大模型完成较为简单的任务,对其性能和功能要求不高。
    • 高要求:需要大模型具备强大的能力,能够处理复杂的任务和问题。

二、技术路线介绍

  1. 提示工程

    • 简介:提示工程是一种通过设计合适的提示来引导大模型生成特定输出的技术。它通常使用简单的文本提示,让大模型根据提示进行回答或生成内容。
    • 维度适配说明:两个维度要求都低。因为提示工程使用的提示通常比较简单,对传入大模型的信息要求不高;同时,它主要用于生成相对简单的回答或内容,对大模型能力的要求也较低。
    • 应用开发例子:例如在智能客服中,可以使用提示工程让大模型根据用户的问题快速给出简单的回答。
  2. RAG(Retrieval-Augmented Generation)

    • 简介:RAG 是一种结合检索和生成的技术。它首先从外部知识库中检索相关信息,然后将这些信息传入大模型进行生成。
    • 维度适配说明:对传入大模型的信息要求高,因为需要从外部知识库中检索高质量的信息;对大模型能力要求低,因为主要依赖检索到的信息进行生成,对大模型自身的能力要求相对较低。
    • 应用开发例子:在知识问答系统中,可以使用 RAG 技术从大量的文档中检索相关信息,然后让大模型根据这些信息回答用户的问题。
  3. AGENT

    • 简介:AGENT 是一种具有自主决策和行动能力的智能体。它可以根据环境的变化和任务的要求,自主地选择行动方案,并与环境进行交互。
    • 维度适配说明:对两个维度都是高要求。因为 AGENT 需要处理复杂的环境和任务,所以对传入大模型的信息要求高;同时,它需要具备强大的决策和行动能力,对大模型的能力要求也很高。
    • 应用开发例子:在智能游戏中,可以使用 AGENT 技术让游戏角色根据游戏场景和任务要求自主地做出决策和行动。
  4. 大模型微调

    • 简介:大模型微调是在已有的预训练大模型的基础上,通过少量的特定任务数据进行微调,使其适应特定的任务和领域。
    • 维度适配说明:对传入大模型的信息要求低,因为主要是在预训练模型的基础上进行微调;对大模型能力要求高,因为需要通过微调让大模型在特定任务上表现出更好的性能。
    • 应用开发例子:在医疗领域,对于医学影像诊断任务,可以利用大模型微调技术。首先使用预训练的大模型,然后收集特定的医学影像数据集,对大模型进行微调,使其能够准确地识别和诊断各种医学影像中的疾病。又如在金融领域的风险评估任务中,通过收集金融市场数据和企业财务数据等特定任务数据,对预训练大模型进行微调,使其能够更准确地评估金融风险。

三、不同技术结合适配更多场景

在实际应用中,单一的技术路线可能无法满足复杂的场景需求。不同技术的结合可以发挥各自的优势,适配更多的场景。

例如,AGENT 和 RAG 的结合可以在复杂的信息检索和决策场景中发挥强大的作用。AGENT 具有自主决策和行动能力,可以根据任务要求主动探索环境并获取信息。而 RAG 可以从外部知识库中检索相关信息,为 AGENT 的决策提供更多的依据。

在智能推荐系统中,AGENT 可以代表用户进行探索和交互,根据用户的兴趣和行为不断调整推荐策略。同时,RAG 可以从大量的商品信息和用户评价中检索相关内容,为 AGENT 提供更准确的推荐依据。这样的结合可以提高推荐系统的准确性和个性化程度,更好地满足用户的需求。

四、总结

不同的大模型开发技术路线适用于不同的场景和需求。如果你对传入大模型的信息和对大模型能力的要求都比较低,可以选择提示工程;如果你需要从外部知识库中检索信息并进行生成,可以选择 RAG;如果你需要处理复杂的任务和环境,对大模型的能力要求很高,可以选择 AGENT;如果你需要在特定任务上提高大模型的性能,可以选择大模型微调。而不同技术的结合可以适配更多的复杂场景,为大模型的开发和应用带来更多的可能性。在实际应用中,你可以根据具体的需求和情况,选择合适的技术路线或技术组合,以实现最佳的开发效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2178181.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【D3.js in Action 3 精译_025】3.4 让 D3 数据适应屏幕(中)—— 线性比例尺的用法

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第一部分 D3.js 基础知识 第一章 D3.js 简介(已完结) 1.1 何为 D3.js?1.2 D3 生态系统——入门须知1.3 数据可视化最佳实践(上)1.3 数据可…

Activity的生命周期分析

目录 Activity的生命周期全面分析 典型情况下的生命周期分析 异常情况下的生命周期分析 情况1:资源相关的系统配置发生改变导致Activity被杀死并重新创建 Activity的生命周期全面分析 在Android开发中,Activity的生命周期是非常重要的概念。它描述了…

数仓建模:DataX同步Mysql数据到Hive如何批量生成建表语句?| 基于SQL实现

目录 一、需求 二、实现步骤 1.数据类型转换维表 2.sql批量生成建表语句 三、小结 如果觉得本文对你有帮助,那么不妨也可以选择去看看我的博客专栏 ,部分内容如下: 数字化建设通关指南 专栏 原价99,现在活动价39.9&#x…

前端使用xlsx-js-style导出Excel,带样式,并处理合并单元格边框显示不全和动态插入表头解决

一、在学习之前,先给出一些学习/下载地址: xlsx-js-style下载地址 https://github.com/gitbrent/xlsx-js-style 或者 https://www.npmjs.com/package/xlsx-js-style SheetJS中文教程: https://xlsx.nodejs.cn/docs/csf/cell 二、先看样…

双指针---(部分地更新)

双指针 复写零 给你一个长度固定的整数数组 arr ,请你将该数组中出现的每个零都复写一遍,并将其余的元素向右平移。 注意:请不要在超过该数组长度的位置写入元素。请对输入的数组 就地 进行上述修改,不要从函数返回任何东西。 …

Tableau 瀑布图应用示例

通过探索 10 个示例,将瀑布图的应用拓展到更深层次的业务分析! 作为一种直观展示数据变化的图表,瀑布图被广泛应用在业务分析中。同时,借助 Tableau 2024.2 中的 Viz Extensions,如今我们可以快速在 Tableau 中实现瀑布…

Vue3-TS-Lodash:理解Lodash / 常用方法积累

一、Lodash官网 Lodash 简介 | Lodash中文文档 | Lodash中文网 二、理解Lodash Lodash 是一个一致性、模块化、高性能的 JavaScript 实用工具库。它提供了大量的函数来帮助你处理数组、数值、对象、字符串等,使你的代码更加简洁、易读和高效。Lodash 的设计哲学是…

25基于python的文本冒险岛游戏(源码+游戏简介+python代码学习攻略)校园招聘面试

基于python的文本冒险岛游戏(源代码游戏简介python代码学习)资源-CSDN文库https://download.csdn.net/download/m0_72216164/89817518 开头附上工作招聘面试必备问题噢~~包括综合面试题、无领导小组面试题资源文件免费!全文干货。 工作招聘无…

HarmoneyOS--Ability(能力)、窗口、通知

标题 文章目录 一、什么是Ability?二、使用步骤(单例和多例)三、窗口四、通知 一、什么是Ability? 开发模式提供的开发功能抽象的描述。 其中重要的是UiAbility,界面组件能力,负责所有界面的处理。 通过配置可以变更单例,多例,指定实例,在module.json5中进行配置 如: 单例:l…

FreeRTOS的中断管理

前言 FreeRTOS的任务有优先级,MCU的硬件中断有中断优先级,这是两个不同的概念,FreeRTOS的任务管理要用到硬件中断,使用FreeRTOS时候也可以使用硬件中断,但是硬件中断ISR的设计要注意一些设计原则,在本节中我…

RVC变声器入门

主要参考资料: RVC变声器官方教程:10分钟克隆你的声音!一键训练,低配显卡用户福音!: https://www.bilibili.com/video/BV1pm4y1z7Gm/?spm_id_from333.337.search-card.all.click&vd_sourcedd284033cd0c4d1f3f59a2…

RocketMQ消息发送之广播模式

前言 在前面的文章中我们回顾了RocketMQ的顺序消息和乱序消息,以及里面包含的乱序消息和全局消息,RocketMQ支持多种消息类型和消费模式 今天这篇文章主要介绍RocketMQ的广播消息。希望文章能为正在学习RocketMQ相关知识的大佬们提供帮助! 广…

全自动ai生成视频MoneyPrinterTurbo源码 在线ai生成视频源码

介绍: 现在短视频这么火爆,流量就是金钱。 如果能全自动的生成短视频,是不是很容易带来流量,赚到马内。 MoneyPrinter 这个开源项目就可以自动生成短视频,而且质量还不错,不是那种低质的营销视频。 使用…

画个心,写个花!Python Turtle库带你玩转创意绘图!

文章目录 前言一、Turtle 库基础介绍二、画布设置三、画笔属性设置1.画笔颜色设置2.画笔粗细与速度设置3.画笔形状设置 四、画笔移动函数五、画笔控制函数六、实战案例一:“花”字绘制七、实战案例二:心型图案绘制总结 前言 Python 的 turtle 库是一种简…

【MySQL内置数据库】 mysql

目录 统计 columns_priv component db default_roles engine_cost func general_log global_grants gtid_executed help_category help_keyword help_relation help_topic innodb_index_stats innodb_table_stats ndb_binlog_index password_history plugin…

【RocketMQ】SpringBoot整合RocketMQ

🎯 导读:本文档详细介绍了如何在Spring Boot应用中集成Apache RocketMQ,并实现消息生产和消费功能。首先通过创建消息生产者项目,配置POM文件引入RocketMQ依赖,实现同步消息发送,并展示了如何发送普通字符串…

STM32+ADC+扫描模式

1 ADC简介 1 ADC(模拟到数字量的桥梁) 2 DAC(数字量到模拟的桥梁),例如:PWM(只有完全导通和断开的状态,无功率损耗的状态) DAC主要用于波形生成(信号发生器和音频解码器) 3 模拟看门狗自动监…

Ract vs Vue 你更喜欢谁?

React 和 Vue 是当今最受欢迎的两个前端框架,各自有其独特的特点和优势。以下是对这两个框架的详细比较和分析,以帮助你了解它们的异同和适用场景: React 简介 React 是由 Facebook 开发和维护的一个开源 JavaScript 库,主要用于…

OpenAI员工流失的背后:地盘争夺、倦怠、薪酬要求

近日,OpenAI的CTO Mira Murati宣布离职,同一天,首席研究官Bob McGrew、研究副总裁Barret Zoph也宣布离职。 据统计,这已经是2024年第11起OpenAI高管离职事件了。 至今,开启“ChatGPT时刻”的四位OpenAI领袖&#xff…

河南移动:核心营业系统稳定运行超300天,数据库分布式升级实践|OceanBase案例

河南移动,作为电信全业务运营企业,不仅拥有庞大的客户群体和业务规模,还引领着业务产品与服务体系的创新发展。河南移动的原有核心营业系统承载着超过6000万的庞大用户量,管理着超过80TB的海量数据,因此也面临着数据规…