什么是AI预训练模型?

news2024/11/26 0:53:08

什么是预训练模型?

在这里插入图片描述

预训练 AI 模型是一种深度学习模型,在大型数据集上进行训练以完成特定任务,它可以按原样使用或定制以满足多个行业的应用需求。

想象一下,试图教一个蹒跚学步的孩子什么是独角兽。 一个好的起点可能是展示该生物的子图像并描述其独特的特征。

现在想象一下,试图教人工智能机器什么是独角兽。 从哪里开始呢?

预训练的 AI 模型提供了一个解决方案。

预训练 AI 模型是一种深度学习模型——一种类脑神经算法的表达,它可以根据数据发现模式或做出预测——在大型数据集上进行训练以完成特定任务。 它可以按原样使用,也可以进一步微调以满足应用程序的特定需求。

为什么使用预训练的 AI 模型?

开发人员可以使用预训练模型并自定义它们以满足他们的要求,而不是从头开始构建 AI 模型。

要构建 AI 应用程序,开发人员首先需要一个可以完成特定任务的 AI 模型,无论是识别神马、检测自动驾驶汽车的安全隐患,还是根据医学成像诊断癌症。 该模型需要大量有代表性的数据来学习。

这个学习过程需要遍历几层输入数据,并在每一层强调与目标相关的特征。

例如,要创建一个可以识别独角兽的模型,可以先给它输入独角兽、马、猫、老虎和其他动物的图像。 这是传入的数据。

预先计算的概率表示(称为权重)可以节省时间、金钱和精力。 已经使用这些权重构建并训练了一个预训练模型。

使用具有大量准确代表性权重的高质量预训练模型可以提高 AI 部署的成功机会。 可以修改权重,并且可以将更多数据添加到模型中以进一步自定义或微调它。

基于预训练模型的开发人员可以更快地创建 AI 应用程序,而不必担心处理大量输入数据或计算密集层的概率。

换句话说,使用预训练的 AI 模型就像得到一件裙子或衬衫,然后根据您的需要对其进行剪裁,而不是从布料、线和针开始。

预训练的 AI 模型通常用于迁移学习,并且可以基于多种模型架构类型。 一种流行的架构类型是 transformer 模型,这是一种通过跟踪顺序数据中的关系来学习上下文和意义的神经网络。

据人工智能公司 Clarifai 平台高级副总裁 Alfredo Ramos 称,Clarifai 是 NVIDIA Inception 项目的主要合作伙伴,预训练模型可以将 AI 应用程序开发时间缩短一年,并节省数十万美元的成本 .

预训练模型如何推动 AI 发展?

由于预训练模型简化并加快了 AI 开发,许多开发人员和公司使用它们来加速各种 AI 用例。

预训练模型推动人工智能发展的主要领域包括:

  • 自然语言处理。 预训练模型用于翻译、聊天机器人和其他自然语言处理应用程序。 大型语言模型,通常基于 transformer 模型架构,是预训练模型的扩展。 预训练 LLM 的一个例子是 NVIDIA NeMo Megatron,它是世界上最大的人工智能模型之一。
  • 语音人工智能。 预训练模型可以帮助语音 AI 应用程序在不同语言中即插即用。 用例包括呼叫中心自动化、人工智能助手和语音识别技术。
  • 计算机视觉。 就像上面的独角兽例子一样,预训练模型可以帮助人工智能快速识别生物——或者物体、地方和人。 通过这种方式,预训练模型可以加速计算机视觉,为体育、智慧城市等领域的应用程序提供类似人类的视觉能力。
  • 卫生保健。 对于医疗保健应用程序,预训练的 AI 模型(如 NVIDIA BioNeMo 服务和框架的一部分)MegaMolBART 可以理解化学语言并了解现实世界分子中原子之间的关系,从而为科学界提供了一个强大的工具来更快地发现药物。
  • 网络安全。 预训练模型为实施基于人工智能的网络安全解决方案提供了一个起点,并扩展了人类安全分析师更快检测威胁的能力。 示例包括人和机器的数字指纹识别,以及异常、敏感信息和网络钓鱼的检测。
  • 艺术和创意工作流程。 为了支持最近的人工智能艺术浪潮,预训练模型可以通过 GauGAN 和 NVIDIA Canvas 等工具帮助加速创意工作流程。

预训练的 AI 模型可以跨行业应用,因为它们的定制和微调可以为用例带来无限的可能性。

在哪里可以找到预训练的 AI 模型

谷歌、Meta、微软和 NVIDIA 等公司正在发明尖端的模型架构和框架来构建 AI 模型。

这些有时会在模型中心或作为开源发布,使开发人员能够微调预训练的 AI 模型,提高其准确性并扩展模型存储库。

NVIDIA NGC——GPU 优化的人工智能软件、模型和 Jupyter Notebook 示例的中心——包括预训练模型以及人工智能基准测试和训练方法,这些都是为与 NVIDIA 人工智能平台一起使用而优化的。

NVIDIA AI Enterprise 是一套完全托管、安全、云原生的 AI 和数据分析软件套件,包括未经加密的预训练模型。 这使得希望将 NVIDIA 预训练模型集成到他们的自定义 AI 应用程序中的开发人员和企业能够查看模型权重和偏差,提高可解释性并轻松调试。

GitHub、Hugging Face 等中心也提供了数以千计的开源模型。

重要的是,预训练模型使用透明、可解释、符合隐私、征得同意且不带偏见的道德数据进行训练。

NVIDIA 预训练人工智能模型

为了帮助更多开发人员将 AI 从原型转移到生产,NVIDIA 提供了几种可以开箱即用的预训练模型,包括:

  • NVIDIA SegFormer,一种用于简单、高效、强大的语义分割的转换器模型——可在 GitHub 上获得。
  • NVIDIA 专门构建的计算机视觉模型,为智能城市、停车管理和其他应用程序训练了数百万张图像。
  • NVIDIA NeMo Megatron 是世界上最大的可定制语言模型,是 NVIDIA NeMo 的一部分,NVIDIA NeMo 是一个开源框架,用于为对话式 AI、语音 AI 和生物学构建高性能和灵活的应用程序。
  • NVIDIA StyleGAN,一种基于样式的生成器架构,用于生成对抗网络或 GAN。 它使用迁移学习来生成各种风格的无限绘画。

此外,用于构建和部署语音 AI 应用程序的 GPU 加速软件开发套件 NVIDIA Riva 包括十种语言的预训练模型。

MONAI 是 NVIDIA 和伦敦国王学院开发的用于医疗保健研究的开源 AI 框架,其中包括用于医学成像的预训练模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/143727.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[NOIP2017 提高组] 奶酪(C++,并查集)

题目背景 NOIP2017 提高组 D2T1 题目描述 现有一块大奶酪,它的高度为 hhh,它的长度和宽度我们可以认为是无限大的,奶酪中间有许多半径相同的球形空洞。我们可以在这块奶酪中建立空间坐标系,在坐标系中,奶酪的下表面…

用纯C实现单链表

前言 什么是单链表?链表是一种物理存储结构上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的 。链表的创建 需要创建一个小项目工程 创建三个文件 ⭐SListNode.h放单链表的头文件,函数声明 ⭐SListNode.c放单…

springcloud之Gateway服务网关

1.Gateway服务网关 Spring Cloud Gateway 是 Spring Cloud 的一个全新项目,该项目是基于 Spring 5.0,Spring Boot 2.0 和 Project Reactor 等响应式编程和事件流技术开发的网关,它旨在为微服务架构提供一种简单有效的统一的 API 路由管理方式…

游戏行业(北区)客户沙龙丨阿里云用户组北京站

2022 年 8 月 30 日,阿里云在北京举办了第 9 场阿里云用户组(AUG)活动,活动主题为“游戏行业(北区)客户沙龙”吸引了众多技术从业者及企业管理者来到现场交流分享。 通过本次活动,参会企业在不同…

Java探针技术详解

简介 在JVM中运行中,类是通过classLoader加载.class文件进行生成的。在类加载器加载.class文件生成对应的类对象之前时,我们可以通过修改.class文件内容(就是字节码修改技术),达到修改类的目的。JDK提供了对字节码进行…

rhel配置zfs

rhel配置zfs环境声明ZFS简介ZFS块指针的结构ZFS的存储池布局rhel8/rhel9安装zfs始终在启动时加载OpenZFS模块开机自启zfs服务zfs基本操作查看磁盘创建pool和ZFS文件系统创建一个存储池设置zfs挂载点为多个用户创建起始目录向池中添加更多空间修改文件系统名称删除文件系统修改存…

数据库的存储引擎和事务

Mysql默认使用INNODB存储引擎 数据库中的各表均被(在创建表时)指定的存储引擎来处理。 服务器可用的引擎依赖于以下因素:MySql的版本、服务器在开发时如何被配置、启动选项 为了解当前服务器中有哪些存储引擎可用,可使用show e…

2022 年 项目中常用的工具函数

目录1. 数字千分位化,支持保留小数点2. 前端生成 uuid3. 传入日期换算出是周几4. 通过计算 text-indent 偏移的负值,实现文字居右隐藏, 右侧对齐 ...text5. 时间格式化函数6. 防抖和节流7. 前端文件流下载8. 后端返回 无格式化时间处理为格式化 20220101…

回收租赁商城系统功能拆解03讲-商品分类

回收租赁系统适用于物品回收、物品租赁、二手买卖交易等三大场景。 可以快速帮助企业搭建类似闲鱼回收/爱回收/爱租机/人人租等回收租赁商城。 回收租赁系统支持智能评估回收价格,后台调整最终回收价,用户同意回收后系统即刻放款,用户微信零…

【C语言进阶】指针进阶-回调函数

作者:匿名者Unit 目录一.函数指针数组1.定义2.转移表二.回调函数1.定义2.qsort的使用3.冒泡模拟实现qsort一.函数指针数组 1.定义 在之前我们已经了解过了函数指针: int(*p)(int,int)&add;我们还可以将函数的地址存放在数组,也就是函数指针数组 int (*p[10…

Qt音视频开发10-ffmpeg内核硬解码

一、前言 为了极大的降低CPU的占用,实现硬解码(也叫硬件加速)非常有必要,一个视频文件或者一路视频流还好,如果增加到64路视频流呢,如果是4K、8K这种高分辨率的视频呢,必须安装上硬解码才是上上…

初始Spring

初始Spring SSM框架的老大是:Spring大管家,无处不在 Spring是应用了很多优秀的设计模式,对于项目的实现,提供了优秀的解决方案;Spring是一个轻量级(低侵入) 框架.类与类之间的解耦合 IOC控制反转 实现大管家 AOP 增强,面向切面编程&…

QT—QPalette调色板类

Qt提供的调色板类QPalette专门用于管理部件的外观显示,相当于部件或对话框的调色板,管理他们所有的颜色信息。每个部件都包含一个QPalette对象,在显示时,按照它的QPalette对象中对各部分各状态下的颜色的描述进行绘制。示例点击左…

C语言-数据的存储-浮点数的存储(8.2)​​​​​​​

目录​​​​​​​ 思维导图&#xff1a; 浮点型在内存中的存储 1.1一个经典的例子 1.2 浮点数存储规则 1.3实践举例 写在最后&#xff1a; 思维导图&#xff1a; 浮点型在内存中的存储 1.1一个经典的例子 #include <stdio.h>int main() {int n 9;//以整形的形式…

SHELL脚本学习 --- 第七次作业(awk)

SHELL脚本学习 — 第七次作业 思路&#xff1a; 1&#xff0c;df -h获取磁盘情况&#xff0c;先用grep过滤出根分区所属行&#xff0c;然后awk打印相应的域 2&#xff0c;首先把多个空格缩成一个&#xff0c;然后用grep找到ens160所属的IP&#xff0c;在awk中使用正则匹配inet…

C++ STL 容器类和迭代器

一、STL容器类 1.1 STL介绍 容器就是盛放东西的东西&#xff0c;这里被盛放的一般是数据对象&#xff0c;用来盛放的是容器类容器类的内核就是&#xff1a;数据结构 算法STL(Standard Template Library,标准模板库)STL从广义上分为:容器(container)算法(algorithm)迭代器(it…

在泰国旅居的第5天,我定了两个新目标

点击上方 "大数据肌肉猿"关注, 星标一起成长点击下方链接&#xff0c;进入高质量学习交流群今日更新| 1052个转型案例分享-大数据交流群我在12月14号写了2023年&#xff0c;重新扬帆起航&#xff01;&#xff0c;里面说了2023年开始全球旅居办公&#xff0c;而在元旦…

历史大讲堂:这是老古董 苹果第一代Macintosh详解

还记得这个苹果吗&#xff1f;这是美国苹果公司的图标。今天我们就来借着苹果最出名的第一代个人电脑唠一唠苹果的前世今生。 这一代个人电脑 已经有鼠标了&#xff08;右下角&#xff09;&#xff0c;虽然非常的古老 macOS第一代系统就运行在这个上。这里我们也来唠一唠Macin…

Spring Boot学习笔记(十二)Spring Boot整合Quartz

一、自定义配置类 不使用springBoot的自动配置类&#xff0c;而是自定义配置类。 1、导入依赖 pom文件&#xff1a; <dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifact…

Android---Toolbar

目录 Toolbar Toolbar 加上 menu Toolbar 设置 Theme 完整 Demo Toolbar Toolbar 是在 Android 5.0 开始推出的一个 Materal Design 风格的导航控件 &#xff0c;Google 非常推荐大家使用 Toobar 来作为 Android 客户端的导航栏&#xff0c;以此来取代之前的 Actionbar。与 …