LLMs 生成式人工智能项目生命周期备忘单Generative AI Project Lifecycle Cheat Sheet

news2024/12/26 11:38:03

到目前为止,在本课程中,从选择模型到微调模型,再到将其与人类偏好对齐,这一切都将在您部署应用程序之前发生。为了帮助您规划生成式AI项目生命周期的各个阶段,这个速查表提供了每个工作阶段所需的时间和精力的一些指示。正如您之前所见,预训练大型语言模型可能是一个巨大的工作。由于模型架构决策、所需的大量训练数据和所需的专业知识,这个阶段是您将面临的最复杂的阶段。
在这里插入图片描述

不过请记住,通常情况下,您将以现有的基础模型为基础开始开发工作。您可能能够跳过这个阶段。

如果您正在使用基础模型,您可能会通过提示工程来开始评估模型的性能,这需要较少的技术专业知识,也不需要对模型进行额外的训练。
在这里插入图片描述

如果您的模型没有达到您的需求,接下来您将考虑提示调整和微调。根据您的用例、性能目标和计算预算,您将尝试的方法可能从全面微调到参数高效微调技术,如laura或提示调整不等。这项工作需要一定程度的技术专业知识。但由于微调在相对较小的训练数据集上可能非常成功,因此这个阶段可能在一天内完成。
在这里插入图片描述

使用来自人类反馈的强化学习来对齐您的模型可以很快完成,一旦您有了训练的奖励模型。您可能会尝试看是否可以使用现有的奖励模型来进行这项工作,就像您在本周的实验中看到的那样。
在这里插入图片描述

然而,如果您必须从头开始训练奖励模型,由于收集人类反馈所需的工作量,可能需要很长时间。

最后,在上一个视频中学到的优化技术通常在复杂性和工作量方面处于中间位置,但假设对模型的更改不会太大地影响性能,可以迅速进行。
在这里插入图片描述

经过所有这些步骤后,您希望已经培训和微调了一个适用于您特定用例的优化部署的LLM。祝贺您!在本课程的最后一系列视频中,您将探讨LLM性能的其余问题,您可能需要在启动应用程序之前解决,以及可以克服这些问题的技术。让我们继续前进,看看接下来的内容。

Reference

https://www.coursera.org/learn/generative-ai-with-llms/lecture/VaOBV/generative-ai-project-lifecycle-cheat-sheet

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1068662.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python学习之5个让日常编码更方便简单的库

今天为大家分享 5 个让日常编码更简单的 Python 库,全文3900字,阅读15分钟。 一、sh https://github.com/amoffat/sh 如果曾经在 Python 中使用过 subprocess 库,那么我们很有可能对它感到失望,它不是最直观的库,可…

Centos7安装docker 和docker-compose记录(0报错顺利安装)

文章目录 前言一、docker的安装二、docker-compose的安装总结 前言 我居然没有记录过Centos7安装docker的笔记,真是不可思议。每次vps安装docker都要看网上的文章,而且都非常坑,方法千奇百怪,最后还是决定自己来记录一个完整又方…

Jupyter notebook怎么设置自动跳转问题

1.点击开始,就可以看到Jupyter,然后点击 2.结果就这样: 3你可以复制地址到浏览器,结果: 但是这么做很麻烦,所以有没有更好的办法呢?当然有下面就开始介绍 1.打开cmd(winr,输入cmd),输入以下命令…

第二证券:突发!A股T+0?刚刚,紧急回应!

沪深生意所急迫回应 6日,商场传出一个消息,传延伸A股生意时刻和部分票可日内T0一次。一个版本是提早至9点,然后下午延伸至15:30,另一个版本是上午推延至12点,下午延伸至16:00。 7日&#xff0…

TimeWise-Jira工时管理插件6.0.0发布!对比测评某知名工时插件,谁的数据处理性能更胜一筹?

近期,龙智自研插件TimeWise for Jira(Jira工时管理插件)发布了重要更新——6.0.0版本。这次升级主要针对报表性能做出了优化与提升。 对于企业级应用而言,具高效处理大规模数据的能力是最为关键。龙智深谙国内用户需求&#xff0…

阿里云关系型数据库RDS详细介绍PolarDB_MySQL_MariaDB_SQL Server_PostgreSQL

阿里云RDS关系型数据库大全,关系型数据库包括MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等,NoSQL数据库如Redis、Tair、Lindorm和MongoDB,阿里云百科分享阿里云RDS关系型数据库大全: 目录 阿里云RDS关系型数据库大全 …

【Axure高保真原型】自适应多行输入框

今天和大家分享自适应多行文本框的原型模板,我们可以在输入框里输入文字,随着文字的数量,输入框的高度也会自动调整……具体效果可以打开下方原型地址体验或者点击下方视频观看 【原型效果】 【Axure高保真原型】自适应多行输入框 【原型预览…

重装系统Win10专业版步骤和详细教程

在Windows 10专业版中,使用一键重装系统能够迅速恢复系统到出厂默认状态,以便重新开始。一键重装系统的步骤相对简单,但确保备份重要文件和软件是重要的一步。本文将详细介绍如何一键重装系统Win10专业版的步骤和教程,确保您能轻松…

智能穿戴领域,健康鞋步力宝品牌引领新商业模式发展

智能时代正在将我们带向一个从学习驱动到全面普及的新境界。这个趋势的深远影响不仅改变了我们的生活方式,更改变了我们对智能的理解。当今的智能穿戴,已经越来越成为更多人日常生活的必需品,不论是日常佩戴无感成为腕上伴侣,还是…

【Java】Scanner.nextLine() 返回空行/不起作用(吸收换行符)

解决方法直达 问题描述 使用 Java 的 Scanner 类来读取数据的时候容易遇到的一个坑是 nextLine() 莫名其妙地就无法使用了。 具体表现为:好像 nextLine() 没执行就直接返回空字符串了。 例如 Scanner scanner new Scanner(System.in); System.out.println(&quo…

【three.js】简介和本地部署

跟着b站大佬学习three.js,让你实现3d前沿技术不是梦! 由于访问three.js官网是国外的网站,非常慢Three.js – JavaScript 3D Library 因此我们可以访问b站大佬在国内搭建好的本地three.js官网,大家访问如下链接即可,…

git项目删除业务代码、并清除所有提交记录,以此为基础创建出一个干净仓库、再另建一个远程代码库推上去

1、先把项目的.git文件夹删除,里面全是之前项目的提交记录 2、在本地项目地址启动git Bash Here后 执行命令 git remote add origin 远程仓库地址 注意后面接的是远程仓库地址 远程仓库要提前把代码块建好 3、如果出现报错:Updates were rejected because the remote conta…

论文阅读--On optimization methods for deep learning

深度学习的优化方法研究 论文信息:Le Q V, Ngiam J, Coates A, et al. On optimization methods for deep learning[C]//Proceedings of the 28th International Conference on Machine Learning, ICML 2011, Bellevue, Washington, USA, June 28 - July 2, 2011. …

JAVA NIO深入剖析

4.1 Java NIO 基本介绍 Java NIO(New IO)也有人称之为 java non-blocking IO是从Java 1.4版本开始引入的一个新的IO API,可以替代标准的Java IO API。NIO与原来的IO有同样的作用和目的,但是使用的方式完全不同,NIO支持面向缓冲区的、基于通道的IO操作。NIO将以更加高效的方…

【已解决】Python读取sql数据,报错:Not an executable object,解决方案

【已解决】Python读取sql数据,报错:Not an executable object,解决方案 1.报错内容: 通过Python连接sql,读取sql中数据,报错:Not an executable object。具体代码及报错内容见下: …

为什么mac上有的软件删除不掉?

对于Mac用户来说,软件卸载通常是一个相对简单的过程。然而,有时你可能会发现某些软件似乎“顽固不化”,即使按照常规方式尝试卸载,也依然存在于你的电脑上。这到底是为什么呢?本文将探讨这一问题的可能原因。 1.卸载失…

实用指南:如何解决企业组网中网络卡顿问题?

随着互联网的发展,企业逐步将办公应用系统部署在内网服务器或者上云了,导致很多日常工作都需要网络才能访问。员工在工作的时候网络不给力,卡顿半天也打不开,非常影响工作效率和心情。 在企业组网过程中,网络卡顿现象的…

解决mysql去掉字段空格:中间空格,左侧空格,右侧空格,两端空格,水平制表符(tab键或者\t)空格,换行键(\n)空格,回车键(Enter键)空格

1. 复现错误 今天,查看我禅道上的日志,发现有这个错误: 数据库查询处的字段,存在空格,那么,怎么解决这个问题呢? 2. 解决思路 首先打开控制台,查看所调用的接口。 通过接口找到对应…

线程的概念及使用

1.C11 Thread线程库的使用 本文详细介绍C11 线程库的基本使用,包括如何创建线程、启动线程、等待线程完成、如何分离线程。 创建线程 线程的概念及使用 线程:进程内一个相对独立的、可调度的执行单元,是系统独立调度和分派CPU的基本单位指运行中的程序…

再创佳绩!移远通信RG500U-EA 5G模组获得全球首个紫光展锐V510平台GCF 认证

近日,移远通信工规级5G模组RG500U-EA顺利通过GCF认证,成为全球首款通过该认证的基于紫光展锐V510平台的5G模组。 GCF认证是一种国际性的产品一致性认证,该认证的通过,表明移远通信RG500U-EA模组满足不同运营商的规范要求&#xff…