生成式AI和大语言模型 Generative AI LLMs

news2025/1/16 3:56:16

在这里插入图片描述
在“使用大型语言模型(LLMs)的生成性AI”中,您将学习生成性AI的基本工作原理,以及如何在实际应用中部署它。

通过参加这门课程,您将学会:

  • 深入了解生成性AI,描述基于LLM的典型生成性AI生命周期中的关键步骤,从数据收集和模型选择,到性能评估和部署
  • 详细描述为LLMs提供动力的变换器架构,它们是如何被训练的,以及微调如何使LLMs能够适应各种特定的用例
  • 使用经验性的缩放法则来优化模型的目标函数,跨数据集大小、计算预算和推断要求
  • 应用最先进的训练、调整、推断、工具和部署方法,以在项目的特定约束条件下最大化模型的性能
  • 在听取行业研究人员和从业者的故事后,讨论生成性AI为企业带来的挑战和机会

对于那些对LLMs的工作原理有良好基础理解的开发者,以及了解训练和部署它们背后的最佳实践的人,他们将能够为公司做出明智的决策,并更快地构建工作原型。这门课程将帮助学习者建立关于如何最好地利用这一令人兴奋的新技术的实用直觉。

这是一门中级课程,所以您应该有一些Python编码的经验,以便从中获得最大的收益。您还应该熟悉机器学习的基础知识,如有监督和无监督学习、损失函数、以及将数据分为训练、验证和测试集。如果您已经参加了DeepLearning.AI的机器学习专项课程或深度学习专项课程,那么您将准备好参加这门课程,并深入探讨生成性AI的基础知识。

我们将讨论大型语言模型、它们的使用案例、模型如何工作、提示工程、如何生成创意文本输出,并为生成性AI项目概述一个项目生命周期。
在这里插入图片描述

考虑到您对这门课程的兴趣,可以肯定地说,您已经有机会尝试一个生成性AI工具或希望这样做。无论是聊天机器人、
在这里插入图片描述
从文本生成图像,
在这里插入图片描述

还是使用插件帮助您开发代码,
在这里插入图片描述

您在这些工具中看到的都是一台能够创建模仿或接近人类能力的内容的机器。

生成性AI是传统机器学习的一个子集。支撑生成性AI的机器学习模型通过在由人类最初生成的大量内容数据集中找到统计模式来学习这些能力。大型语言模型经过数周和数月的时间,在数万亿的词上进行了训练,并使用了大量的计算能力。我们称之为基础模型的这些模型,拥有数十亿的参数,展现出超越语言本身的突现性质,研究人员正在解锁它们分解复杂任务、推理和解决问题的能力。
在这里插入图片描述

这里是一系列基础模型的集合,有时被称为基础模型,以及它们在参数方面的相对大小。稍后您将更详细地了解这些参数,但现在,请将它们视为模型的记忆。模型的参数越多,记忆就越多,事实证明,它可以执行的任务也越复杂。在整个课程中,我们将用这些紫色的圆圈代表LLM,在实验室中,您将使用一个特定的开源模型,flan-T5,来执行语言任务。通过直接使用这些模型或应用微调技术将它们适应您的特定用例,您可以迅速构建定制解决方案,而无需从头开始训练新模型。

现在,虽然为多种模式创建了生成性AI模型,包括图像、视频、音频和语音,但在这门课程中,您将重点关注大型语言模型及其在自然语言生成中的用途。您将了解它们是如何构建和训练的,如何通过文本与它们互动,这些文本被称为提示。以及如何为您的用例和数据微调模型,以及如何与应用程序一起部署它们来解决您的商业和社会任务。

与语言模型互动的方式与其他机器学习和编程范式大不相同。在那些情况下,您使用正式化的语法编写计算机代码与库和API互动。相反,大型语言模型能够接受自然语言或人类编写的指令,并像人类一样执行任务。您传递给LLM的文本被称为提示。可用于提示的空间或记忆称为上下文窗口,这通常足够容纳几千个词,但因模型而异。
在这里插入图片描述

在这个例子中,您要求模型确定Ganymede在太阳系中的位置。提示传递给模型,模型然后预测下一个词,因为您的提示包含了一个问题,这个模型生成了一个答案。模型的输出称为完成,使用模型生成文本的行为称为推断。完成包括原始提示中包含的文本,后跟生成的文本。您可以看到这个模型很好地回答了您的问题。它正确地识别出Ganymede是木星的一颗卫星,并为您的问题生成了一个合理的答案,说明这颗卫星位于木星的轨道内。

在整个课程中,您将看到许多这种风格的提示和完成的示例。
在这里插入图片描述

参考

  • https://www.coursera.org/programs/hsbc-finance-people-and-personal-development-dnger/learn/generative-ai-with-llms
  • https://www.coursera.org/learn/generative-ai-with-llms/lecture/IrsEw/generative-ai-llms

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/896803.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

opencv-yolov8-目标检测

import cv2 from ultralytics import YOLO# 模型加载权重model YOLO(yolov8n.pt)# 视频路径cap cv2.VideoCapture(0)# 对视频中检测到目标画框标出来 while cap.isOpened():# Read a frame from the videosuccess, frame cap.read()if success:# Run YOLOv8 inference on th…

opencv-疲劳检测-眨眼检测

#导入工具包 from scipy.spatial import distance as dist from collections import OrderedDict import numpy as np import argparse import time import dlib import cv2FACIAL_LANDMARKS_68_IDXS OrderedDict([("mouth", (48, 68)),("right_eyebrow",…

opencv-目标追踪

import argparse import time import cv2 import numpy as np# 配置参数 ap argparse.ArgumentParser() ap.add_argument("-v", "--video", typestr,help"path to input video file") ap.add_argument("-t", "--tracker", …

单发多框检测(SSD)【动手学深度学习】

单发多框检测模型主要由一个基础网络块和若干多尺度特征块串联而成。基本网络用于从输入图像中提取特征,可以使用深度卷积神经网络,原论文中选用了在分类层之前阶段的VGG,现在也常用ResNet替代。 我们可以设计基础网络,使它输出的高和宽较大,这样基于该特征图生成的锚框数…

亿赛通电子文档安全管理系统 RCE漏洞复现

0x01 产品简介 亿赛通电子文档安全管理系统(简称:CDG)是一款电子文档安全加密软件,该系统利用驱动层透明加密技术,通过对电子文档的加密保护,防止内部员工泄密和外部人员非法窃取企业核心重要数据资产&…

Lnton羚通关于【PyTorch】教程:torchvision 目标检测微调

torchvision 目标检测微调 本教程将使用Penn-Fudan Database for Pedestrian Detection and Segmentation 微调 预训练的Mask R-CNN 模型。 它包含 170 张图片,345 个行人实例。 定义数据集 用于训练目标检测、实例分割和人物关键点检测的参考脚本允许轻松支持添加…

3 个 ChatGPT 插件您需要立即下载3 ChatGPT Extensions You need to Download Immediately

在16世纪,西班牙探险家皮萨罗带领约200名西班牙士兵和37匹马进入了印加帝国。尽管印加帝国的军队数量达到了数万,其中包括5,000名精锐步兵和3,000名弓箭手,他们装备有大刀、长矛和弓箭等传统武器。但皮萨罗的军队中有100名火枪手,…

居然有这么好用的调试工具

居然有这么好用的调试工具 基本收发虚拟示波器GPIO操作PWM输出AD-DAIIC操作SPI操作GPS显示模块设置 基本收发 软件具备最常用的串口收发功能,可以在需要发送的数据最后选择添加一些常用的附加数据: 支持2通道COM口同时接收,目前自己最常用的…

ARM(实验二)

uart4.h #ifndef __H__ #define __H__#include "stm32mp1xx_rcc.h" #include "stm32mp1xx_gpio.h" #include "stm32mp1xx_uart.h"//RCC/GPIO/UART4章节初始化 void hal_uart4_init();//发送一个字符函数 void hal_put_char(const char str);//发…

Java进阶(4)——结合类加载JVM的过程理解创建对象的几种方式:new,反射Class,克隆clone(拷贝),序列化反序列化

目录 引出类什么时候被加载JVM中创建对象几种方式1.new 看到new : new Book()2.反射 Class.forName(“包名.类名”)如何获取Class对象【反射的基础】案例:连接数据库方法 3.克隆(拷贝)clone浅拷贝深拷贝案例 序列化和反序列化对象流-把对象存…

中大型无人机远程VHF语音电台系统方案

方案背景 中大型无人机在执行飞行任务时,特别是在管制空域飞行时地面航管人员需要通过语音与无人机通信。按《无人驾驶航空器飞行管理暂行条例》规定,中大型无人机应当进行适航管理。物流无人机和载人eVTOL都将进行适航管理,所以无人机也要有…

python ORM框架 sqlAlchemy

背景 最近在研究mysql的ORM框架,忽然看到了一个pip的包sqlalchemy,让我觉得很神奇,用下来的感觉和java的hibernate差不多,后边的链式查询又让我觉得和我很喜欢用的mybatis plus差不多,于是抱着好奇加上学习的态度&…

神经网络简单理解:机场登机

目录 神经网络简单理解:机场登机 ​编辑 激活函数:转为非线性问题 ​编辑 激活函数ReLU 通过神经元升维(神经元数量):提升线性转化能力 通过增加隐藏层:增加非线性转化能力​编辑 模型越大,…

OpenCV 玩转图像和视频

为什么学OpenCV? • OpenCV ⽀持对图像缩放、旋转、绘制⽂字图形等基础操作 • OpenCV 库包含了很多计算机视觉领域常⻅算法:⽬标检测、⽬标跟踪等 OpenCV 简介 • OpenCV (Open Source Computer Vision) 是计算机视觉和机器学习软件库 • Intel 1999…

特殊数字专题

特殊数字 1.奇数2.偶数3.完数4.素数5.回文数6.水仙花数7.中位数9.随机数11.求年份&#xff1a;闰年12.求数字&#xff1a;两个整数的最大公约数及最小公倍数 1.奇数 代码案例&#xff1a; //输出所有1-1000之间的奇数 #define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h&…

Java虚拟机(JVM):虚拟机栈溢出

一、概念 Java虚拟机栈溢出&#xff08;Java Virtual Machine Stack Overflow&#xff09;是指在Java程序中&#xff0c;当线程调用的方法层级过深&#xff0c;导致栈空间溢出的情况。 Java虚拟机栈是每个线程私有的&#xff0c;用于存储方法的调用和局部变量的内存空间。每当…

Java二分法查找

二分法&#xff1a;首先需要一个由小到大排序好的数组&#xff0c;先找到其中间值&#xff0c;然后进行比较如果比较中间值大的话则向前找。如果比要找的小&#xff0c;则向后找。 代码实现&#xff1a; //定义查询方法 public static int searchTarget(int[] nums, int targ…

用户新增预测(Datawhale机器学习AI夏令营第三期)

文章目录 简介任务1&#xff1a;跑通Baseline实操并回答下面问题&#xff1a;如果将submit.csv提交到讯飞比赛页面&#xff0c;会有多少的分数&#xff1f;代码中如何对udmp进行了人工的onehot&#xff1f; 任务2.1&#xff1a;数据分析与可视化编写代码回答下面的问题&#xf…

【CSS动画02--卡片旋转3D】

CSS动画02--卡片旋转3D 介绍代码HTMLCSS css动画02--旋转卡片3D 介绍 当鼠标移动到中间的卡片上会有随着中间的Y轴进行360的旋转&#xff0c;以下是几张图片的介绍&#xff0c;上面是鄙人自己录得一个供大家参考的小视频&#x1f92d; 代码 HTML <!DOCTYPE html>…

上半年营收19亿,金融壹账通第二增长曲线“加速上坡”

8月16日&#xff0c;壹账通金融科技有限公司&#xff08;下称“金融壹账通”&#xff09;发布了截至2023年6月30日中期业绩报告。 根据财报&#xff0c;2023年上半年&#xff0c;金融壹账通实现营收18.99亿元&#xff0c;毛利润为6.96亿元&#xff1b;归母净利润率从-26.1%提升…