透过生活小故事,轻松理解大模型开发的五种核心方法

news2024/9/24 0:16:35

大家好,我是大圣,今天聊一下大模型开发的几种方法。

大模型开发常用方法

前言

人工智能的世界听起来复杂神秘,但其实它与我们的日常生活有着许多相似之处。即使你对大模型开发一无所知,也能通过生活中的简单故事,理解其中的奥秘。

本文将以贴近生活的五个场景,通俗易懂地讲解大模型开发中的五种核心方法:提示词工程和外部函数、Agent设计、RAG设计(检索增强生成)、微调以及预训练。让我们一同走进这些故事,揭开大模型背后的设计理念和本质区别。

1. 提示词工程和外部函数

生活场景:查找食谱中的烹饪步骤

小张想要在家做一道新的菜肴,但他不确定具体的烹饪步骤。他对着手机说:“如何制作宫保鸡丁?”手机上的语音助手无法直接给出答案,于是它连接到美食网站(外部函数),获取了详细的食谱和步骤。

解释:

提示词工程:小张的提问是一个明确的指令,帮助语音助手理解他的需求。

外部函数:语音助手调用了美食网站的API,获取所需的信息。

设计理念与本质

本质:利用明确的指令(提示词),让模型理解用户意图,并调用外部资源完成任务。

使用场景:需要实时信息或特定功能支持时,如查询天气、导航、股票行情等。

2. Agent设计

生活场景:旅行计划的自动安排

李女士计划去云南旅游,但她工作繁忙,没有时间安排细节。她使用了一款智能旅行应用,只需输入目的地和时间,应用就自动为她安排了机票、酒店、景点门票,并规划了行程路线。

解释:

Agent设计:智能旅行应用作为一个自主代理,自动执行多项任务,协调各项服务。

设计理念与本质:

本质:模型具备自主决策和任务执行能力,能够调用多个功能完成复杂任务。

使用场景:自动化处理多步骤任务,如智能客服、个人助理、流程自动化等。

3. RAG设计(检索增强生成)

生活场景:写论文时查找最新资料

大学生小李正在写一篇关于人工智能的论文,需要引用最新的数据和研究。他在论文写作软件中输入了关键词,软件自动从学术数据库中检索相关资料,并将信息整合,供小李参考。

解释:

RAG设计:软件先从外部数据库中检索信息,然后将这些信息用于生成有用的内容。

设计理念与本质:

本质:模型结合检索和生成能力,提供准确且最新的回答。

使用场景:需要获取最新信息或专业知识的场景,如学术研究、市场分析、技术支持等。

4. 微调

生活场景:定制化健身计划

健身爱好者小王想要一份针对自己身体状况的训练计划。他在健身应用中输入了自己的体能数据和目标。应用根据他的信息,生成了一份个性化的训练计划,比通用的计划更适合他。

解释:

微调:健身应用根据小王的个人数据,对通用的训练模型进行了调整,提供了更适合他的方案。

设计理念与本质:

本质:在通用模型的基础上,使用特定数据进行训练,使模型在特定领域或针对特定用户表现更佳。

使用场景:需要个性化或专业化的应用,如定制化推荐、专业领域辅助等。

5. 预训练

生活场景:学习一门新的语言

小刘决定学习法语,他报名参加了一个语言培训班。课程从基础的字母、发音开始,逐步学习词汇和语法。经过一段时间的学习,他打下了坚实的基础,能够进行日常交流。

解释:

预训练:小刘先学习了大量的基础知识,为之后的深入学习做好了准备。

设计理念与本质:

本质:模型在大量通用数据上进行训练,学习基础知识和模式,为后续任务提供基础。

使用场景:作为各种下游任务的基础,预训练模型具备基本的理解和生成能力。

总结:

提示词工程和外部函数:就像我们在需要特定信息时,通过明确的提问,获取专业的答案。

Agent设计:类似于智能应用自动为我们处理复杂的事务,节省时间和精力。

RAG设计:当我们需要最新或专业的信息时,先查找资料,再整合为自己的知识。

微调:根据个人需求或特定领域,对通用方案进行调整,获得更好的效果。

预训练:先打好基础,掌握通用知识,再应用于各种具体的任务中。

写在最后

目的

本篇文章的目的就是想让大家明白大模型开发的这五种方案的概念,后面我会对每一种方案会详细说怎么实现。

个人感悟

互联网技术更新日新月异,我们到底要不要卷技术,我最近也在思考,欢迎大家来讨论。最后说一句,学习好累!

本文由博客一文多发平台 OpenWrite 发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2158856.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实验十八:IIC-EEPROM实验

这个实验比较复杂,是目前第一个多文件项目 KEY1-4:P3^0-P3^3 IIC_SCL=P2^1; IIC_SDA=P2^0; //定义数码管位选信号控制脚 LSA=P2^2; LSB=P2^3; LSC=P2^4; 代码 main.c #include "public.h" #in

常见汽车零部件ASIL等级示例

ASIL(Automotive Safety Integrity Level,汽车安全完整性等级)评级系统是ISO 26262标准中定义的一套风险分类体系,用于评估道路车辆中电子电气系统(E/E系统)功能安全的风险程度,并确保这些系统在…

Linux相关概念和重要知识点(6)(make、makefile、gdb)

1.make、makefile (1)什么是make、makefile? 在我们写完代码后,要编译运行,如果有多个.c文件就需要每次都自己用gcc -o来处理,这十分麻烦。当我们想要自定义多个文件的处理时,我们会浪费很多时…

MatrixOne助力一道创新打造高性能智能制造AIOT系统

客户简介 深圳一道创新(ETAO Innovation)成立于2012年,是一家创新型软件及信息技术服务商,致力于制造戏份行业—电子制造业的数字转型服务,构建万物互联的智能工程。一道创新致力于把先进的软件系统、数字平台、人工智…

拯救者Legion R9000X 2021R(82K8)原厂Win10与Windows11系统恢复镜像下载

LENOVO联想拯救者R9000X锐龙版2021款【82K8】预装OEM系统WIN11/10安装包,恢复原装出厂时开箱状态一模一样 链接:https://pan.baidu.com/s/15dGwacsEG0G8pOiZAHyXaQ?pwd0xgk 提取码:0xgk 联想原装出厂系统自带所有驱动、出厂主题壁纸、系统…

得物App荣获新奖项,科技创新助力高质量发展

近日,备受瞩目的2024中国国际服务贸易交易会(简称“服贸会”)在北京盛大开幕,这一全球唯一的国家级、国际性、综合型服务贸易盛会再次汇聚了全球服务贸易领域的精英与前沿成果。服贸会由商务部和北京市政府携手打造,并…

大数据系统调优:从DAG到单机

目标:优化T10的时效性全局DAG调度层优化:提前任务开始时间: 1. 优化慢结点:T10依赖了T4,T7,T8, 其中T8为瓶颈,如果T8能提前点完成,T10可以早点开始,就能早点完成 2. 快结点做更多预计算…

Android Studio 真机USB调试运行频繁掉线问题

一、遇到问题 Android Studio使用手机运行项目时,总是频繁掉线,连接很不稳定,动不动就消失,基本上无法使用 二、问题出现原因 1、硬件问题:数据线 换条数据线试试,如果可以,那就是数据线的…

如何登录通义灵码,快速开启AI编码之旅?

通义灵码个人版开发者可以使用阿里云账号登录通义灵码 IDE 端插件,本文介绍个人版开发者登录 IDE 端插件的操作指南。 登录通义灵码 步骤 1:准备工作 已成功注册阿里云账号,具体操作可参考:账号注册(PC端)…

通信工程学习:什么是SDN软件定义网络

SDN:软件定义网络 SDN(Software Defined Network),即软件定义网络,是一种新兴的网络架构和技术,它实现了网络控制平面与数据转发平面的分离,并通过软件平台进行集中控制和管理。以下是SDN的详细…

02 BlockChain-- ETH

以太坊与比特币有什么不同? 以太坊立足比特币创新之上,于 2015 年启动,两者之间有一些显著不同。 从宏观的方面: 比特币就仅仅是比特币;以太坊(Ethereum)包括以太币(Ether&#x…

ubuntu中如何查看类型(函数)定义的头文件

问题: 1.该如何查找函数,或者数据类型的头文件? 方法: 1.使用vim搭配ctags 2.使用vscode 使用vscode查看头文件位置的步骤: 1.例如下图,我想添加包含file_operations的头文件 2.双击选中数据类型&#xf…

network request to https://registry.npmjs.org/xxx failed, reason: connect ETIM

目录: 1、问题描述2、解决方案3、npm镜像仓库替换 1、问题描述 npm install 时,报错:npm ERR! network request to https://registry.npmjs.org/postcss-pxtorem failed, reason: connect ETIMEDOU npm ERR! code ETIMEDOUT npm ERR! errno…

DSP学习00-F28379D学习准备(了解一个工程的构成)

叠甲 我也算初学F28379D,不对之处请大家斧正。不同型号的DSP在外设配置的函数上有一些区别,但是掌握一种对其他型号的来说则难度不大。对于我们而言学习DSP最终还是要用于算法验证,而DSP资源的最大化利用、代码效率提升等则是后话。 软件准…

【ASE】第一课_双面着色器

今天我们一起来学习ASE插件,希望各位点个关注,一起跟随我的步伐 今天我们来学习双面着色器,对颜色和贴图进行差值,双面显示不同的效果 最终效果: 思路: 1.先确定前后面的贴图和颜色 贴图(Alb…

华为高级交换技术笔记 2024-2025

2024-2025 一、9/31.通信模型和封装2.以太网3.MAC地址4.以太网帧5.MAC地址表的建立 二、9/61.交换机的数据的处理2.以太网帧的分类3.广播域4.vlan技术开发背景 一、9/3 1.通信模型和封装 2.以太网 3.MAC地址 4.以太网帧 5.MAC地址表的建立 二、9/6 1.交换机的数据的处理 2.以…

[SAP ABAP] 数据字典外键关联

SE11创建自定义数据库表 学校表(ZDBT_SCH_437) 表有3个组成字段: ① MANDT (参考数据元素为MANDT,主键) ② SCHID 学校ID (参考新建数据元素ZDE_SCHID_437,主键,NUMC4) ③ SCHNAME 学校名称 (CHAR20) 学生表(ZDBT_STU_437) 表有7个…

codeforces round974 div3 分层图 树形dp

A Robin Helps 问题&#xff1a; 思路&#xff1a;模拟 代码&#xff1a; #include <bits/stdc.h> using namespace std;const int N 2e5 10;void solve() {int n, k;cin >> n >> k;vector<int> a(n 1);for(int i 1; i < n; i ) cin >&…

着色器(Vertex Shader)基础

什么是顶点着色器 顶点着色器处理顶点并告知它们在“剪辑空间”中的坐标,该空间使计算机可以轻松了解哪些顶点对摄像机可见,哪些顶点不可见,必须剪切或“剪切”掉。 这使得 GPU 在后期阶段的速度更快,因为它们需要处理的数据较少。 它们通过接收来自顶点列表中的单个顶…

手写数字识别案例分析(torch,深度学习入门)

在人工智能和机器学习的广阔领域中&#xff0c;手写数字识别是一个经典的入门级问题&#xff0c;它不仅能够帮助我们理解深度学习的基本原理&#xff0c;还能作为实践编程和模型训练的良好起点。本文将带您踏上手写数字识别的深度学习之旅&#xff0c;从数据集介绍、模型构建到…