AI模型推理(1)——入门篇

news2024/12/30 3:49:35

前言

本文主要介绍AI模型推理的相关基础概念,为后续云原生模型推理服务的学习做准备。

初识模型部署

对于深度学习模型来说,模型部署指让训练好的模型在特定环境中运行的过程。相比于常规的软件部署,模型部署会面临更多的难题:

1、运行模型所需的环境难以配置。深度学习模型通常是由一些框架编写,比如 Pytorch、TensorFlow。可能由于框架规模、依赖环境的限制,这些框架不适合在手机等生产环境安装。

2、深度学习模型的结构通常比较庞大,需要大量的算力才能满足实时运行的需求。模型运行的效率需要优化。

因为这些难题的存在,模型部署不能靠简单的环境配置与安装完成。经过工业界和学术界数年的探索,模型部署有了一条流行的流水线:

  •  为了让模型最终能够部署到某一环境上,开发者们可以使用任意一种深度学习框架来定义网络结构,并通过训练确定网络中的参数。
  • 之后,模型的结构和参数会被转换成一种只描述网络结构的中间表示一些针对网络结构的优化会在中间表示上进行。有时候我们也会将这里的中间表示称为模型文件。
  • 最后,用面向硬件的高性能编程框架(如CUDA、OpenCL)编写,能高效执行深度学习网络算子的推理引擎会把中间表示转换成特定的文件格式(有时候也可以不用转换这一步,直接加载中间表示),并在对应的硬件平台上高效运行模型。

参考:

模型部署入门教程(一):模型部署简介 - 知乎 (zhihu.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/476946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SPI机制详细讲解

文章目录 SPI机制案例分析建立DriverManager建立MysqlDriver来实现扩展建立OracleDriver来实现扩展测试spitest 源码分析ServiceLoader类的结构reload加载类LazyIterator类parse解析URL对象方法parseLine方法 SPI机制 SPI ,全称为 Service Provider Interface&…

Bridge模式如何配置

Bridge模式案例(一) 基于Docker引擎启动Nginx WEB容器,默认以Bridge方式启动Docker容器,会动态DHCP给Docker容器分配IP、网关等信息,操作指令如下: 查看镜像列表 docker images#运行新的Nginx容器 dock…

ChatGPT实现代码解释

代码解释 新手程序员在入门之初,最好的学习路径就是直接阅读其他人的代码,从中学会别人是怎么写的,为什么这么写。过去,这个学习过程可能需要广泛阅读官方文档,在 GitHub issue 上提问,上 Stack Overflow …

内网渗透(六十)之AS-REP Roasting攻击

AS-REP Roasting攻击 AS-REP Roasting是一种针对用户账户进行离线爆破的攻击方式。但是该攻击方式使用上比较受限,因为其需要用户账户设置“不要求Kerberos预身份验证”选项。而该选项默认是没有勾选的。Kerberos域身份验证发生在Kerberos身份验证的第一阶段(AS_REQ&AS_…

手记系列之四 ----- 关于使用MySql的一些经验

前言 本篇文章主要介绍的关于本人在使用MySql记录笔记的一些使用方法和经验,温馨提示,本文有点长,约1.5w字,几十张图片,建议收藏查看。 一、MySql安装 下载地址:https://dev.mysql.com/downloads/ 在安装MySql之前&a…

我在VScode学Java(Java一维数组)

我的个人博客主页:如果\真能转义1️⃣说1️⃣的博客主页 关于Java基本语法学习---->可以参考我的这篇博客:(我在Vscode学Java) 我在VScode学Java(Java一维数组) Java 一维数组 声明数组:先声明,后使用 动态分配内…

最长连续子序列---双指针

一、最长连续不重复子序列 核心思路: 遍历数组a中的每一个元素a[i], 对于每一个i,找到j使得双指针[j, i]维护的是以a[i]结尾的最长连续不重复子序列,长度为i - j 1, 将这一长度与r的较大者更新给r。 对于每一个i,如何确定…

XR技术在手术中的应用调研

虚拟现实、增强现实、混合现实等概念和技术是最近几年发展起来的,相信你对去年大火的元宇宙深有感触,元宇宙属于虚拟现实的技术范畴,头号玩家电影也让虚拟现实走进大众的视野中。早在2015年,笔者参加一次展会时就有接触&#xff0…

【数据库复习】第四章数据库恢复技术

一、事务 定义 一个数据库操作序列 一个不可分割的工作单位(要么全做,要么不做) 恢复和并发控制的基本单位 事务和程序比较 在关系数据库中,一个事务可以是一条或多条SQL语句,也可以包含一个或多个程序。 一个程序通常包含…

java倒序输出数字的方法

1.在输入框中输入一个整数,比如要输入“5”,需要输出倒序,可以使用数字键盘进行输入,也可以使用文本编辑器进行输入。 2.在命令行中输入“6”,如图所示。 3.选择一个字符串作为例子。使用字符串编辑器中的 reverse命令…

这个 Chrome 插件,让你的 ChatGPT 不再报错

ChatGPT的官网最近几天报错越来越频繁了,相信大家都发现了。 一旦你离开页面时间比较久,再度返回跟它进行对话,就会出现如下报错: 虽然这个报错信息以前也出现过,但现在的频率确实过高,对于每天需要使用 C…

“火灾不分昼夜,安全在我心中”——五一前厂房消防检查纪实

检查人员: Scott, Jason, Willson, Hanson 检查时间: 2023年4月28日 检查地点: 1厂房、2厂房室内外 检查内容: 一、室内外消火栓: 室内栓外观正常; 室外栓: 栓体防冻防尘套破损、遗失,消防栓缺少防撞保护; 按规定距离厂房外墙不宜小于5…

gitlab部署及整合Jenkins持续构建(四)sonarqube9.9安装和使用(一步一坑)

文章目录 postgresql13.0安装1、配置postgresql数据库2、进入postgresql创建数据库 代码质量管理平台--sonarqube安装1、前置依赖下载2、安装unzip并解压sonarqube并移动到/usr/local:3、修改sonarqube相应的配置4、新增用户,并将目录所属权赋予该用户&a…

回村准备结婚了~

小伙伴们大家好,我是阿秀。 这几天是一年一度的五一假期,前几年因为疫情的存在,很多人的五一假期都只能憋在家里,不知道今年各位有没有出去游玩的计划和打算? 昨晚刷朋友圈看到很多人都在晒行程的,有打算去…

【MATLAB数据处理实用案例详解(19)】——利用神经模糊控制实现对洗衣机的控制

目录 一、问题描述二、洗衣机模糊控制三、运行结果四、完整代码 一、问题描述 20世纪90年代初期,日本松下公司推出了神经模糊控制全自动洗衣机这种洗衣机能够自动判断衣物质地的软硬程度、衣量多少、脏污程度和性质等,应用神经模糊控制技术,…

JavaScript实现输入成绩,输出成绩等级的代码

以下为实现输入成绩,输出成绩等级(switch语句)的代码和运行截图 目录 前言 一、实现输入成绩,输出成绩等级 1.1 运行流程及思想 1.2 代码段 1.3 JavaScript语句代码 1.4 运行截图 前言 1.若有选择,您可以在目录…

C#底层库--自定义进制转换器(可去除特殊字符,非Convert.ToString方式)

系列文章 C#底层库–程序日志记录类 本文链接:https://blog.csdn.net/youcheng_ge/article/details/124187709 C#底层库–MySQLBuilder脚本构建类(select、insert、update、in、带条件的SQL自动生成) 本文链接:https://blog.csd…

从南极到你家,易开得,一支“中国芯”的奇幻漂流

2023年的AWE,精彩程度比我想象中还要夸张! 一方面是热度空前,现场人头攒动,有一家老中幼三代一起来观展的,有经销商、客户来问价采购的,还有行业媒体举着单反、手机、摄像机激情拍照的,让我们正…

4月30日第壹简报,星期日,农历三月十一

4月30日第壹简报,星期日,农历三月十一坚持阅读,静待花开1. 五一小长假首日全国铁路迎客流高峰,创铁路单日客流历史新高,旅游订单量较春节假期首日增长668%。2. 六大国有银行一季报业绩披露:共赚近3600亿元&…

chatgpt 数据相关应用论文策略简介

hatGPT等预训练大模型,一个核心能力就是经过海量语料的训练加上强化学习的引导,其具有强大的接近人类的文本生成能力。这个能力的一大用途,就是可以为我们生产数据或者标注数据,再基于这些数据训练我们自己的模型。 On the Feasi…