将数据预处理嵌入AI模型的常见技巧

news2024/11/18 7:33:44

作者:战鹏州  英特尔物联网行业创新大使

目录

1.1 用模型优化器实现数据预处理

1.1.1 模型优化器预处理参数

1.1.2 将ResNet模型的预处理嵌入模型

1.2 用OpenVINO™ 预处理API实现数据预处理

1.3 使用模型缓存技术进一步缩短首次推理时延

1.4 总结


        本文将介绍基于OpenVINO™ 模型优化器或预处理API将数据预处理嵌入AI模型的常见技巧,帮助读者在硬件投入不变的情况下,进一步提升端到端的AI推理程序的性能。本文所有范例程序已开源:https://gitee.com/ppov-nuc/resnet_ov_ppp.git,并在基于第12 代英特尔® 酷睿™ 处理器的AI开发者套件上完成测试。

        以YOLOv5模型转换为例,使用模型优化器命令:

mo --input_model yolov5s.onnx --data_type FP16

        将yolov5s.onnx模型转为IR格式模型,并将模型精度从FP32转为FP16——这是最常见的模型优化器使用方式。基于上述IR模型,在编写AI推理程序时,由于图像数据的数值精度和形状,跟模型输入节点要求的数值精度和形状不一样,所以还需要将数据在输入模型前对其进行预处理。

        以YOLOv5模型为例,使用YOLOv5代码仓自带的zidane.jpg图像,打印出图像的数值精度和形状,以及模型输入节点的数值精度和形状,对比如下,如图1-1所示。

图1-1  OpenCV读入的图像 vs 模型输入节点

         从上图可以看出,通过OpenCV的imread()函数读取的图像数据,在数据形状、数值精度、数值范围等地方,与模型输入节点的要求不一样,如下表所示

OpenCV读取的图像数据

YOLOv5模型输入节点

数据形状(Shape)

[720, 1280, 3]

[1, 3, 640, 640]

数值精度(dtype)

UINT8

FP32

数值范围

0 - 255

0.0 - 1.0

颜色通道顺序

BGR

RGB

数据布局(Layout)

HWC

NCHW

        由于存在上述的差异,数据在传入模型前必须进行预处理,以满足模型输入节点的要求。数据预处理可以在推理代码中编程实现,也可以用模型优化器实现,或者用OpenVINO™ 预处理API实现,本文将依次详细介绍。

1.1 用模型优化器实现数据预处理

1.1.1 模型优化器预处理参数

        模型优化器可以将颜色通道顺序调整、图像数据归一化等预处理操作嵌入模型,参考《OpenVINO™ 模型转换技术要点解读》。通过指定参数:

  • --mean_values:所有输入数据将减去mean_values, 即 input - mean_values
  • --scale_values:所有输入数据将除以scales_values,当同时指定mean_values和scale_values时,模型优化器执行(input - mean_values)÷scales_values
  • --reverse_input_channels:将输入通道顺序从RGB转换为BGR(反之亦然)

当上述三个操作同时指定时,预处理顺序为:

输入数据→reverse_input_channels→mean_values→scale_values→原始模型

        在转换模型时,假设推理程序使用OpenCV库读取图像,则可以在模型优化器中增加mean_valuesscale_valuesreverse_input_channels三个参数,把颜色通道顺序调整和图像数据归一化操作嵌入模型。若推理程序使用非OpenCV库读取图像,例如PIL.Image,则无需添加--reverse_input_channels参数。

        下面本文将以ResNet模型为例,展示使用模型优化器将预处理嵌入模型的完整过程。

1.1.2 将ResNet模型的预处理嵌入模型

        ResNet不仅是2015ILSVRC大赛冠军,还是产业实践中常用的卷积神经网络模型。PyTorch已将ResNet集成到torchvision中,将PyTorch格式的ResNet模型转为ONNX格式,完整代码如下:

from torchvision.models import resnet50, ResNet50_Weights
import torch
# https://pytorch.org/vision/stable/models/generated/torchvision.models.resnet50.html
weights = ResNet50_Weights.IMAGENET1K_V2
model = resnet50(weights=weights, progress=False).cpu().eval()
# define input and output node
dummy_input = torch.randn(1, 3, 224, 224, device="cpu")
input_names,  output_names = ["images"], ['output']
torch.onnx.export(model, 
                 dummy_input, 
                 "resnet50.onnx", 
                 verbose=True, 
                 input_names=input_names, 
                 output_names=output_names,
                 opset_version=13 
                 )

        在导出PyTorch格式模型为ONNX格式时,需要注意的是算子版本(opset_version)最好≥11。另外,OpenVINO2022.2支持ONNX 1.8.1,即opset_version=13, 所以本文将opset_version设置为13

        基于ImageNet 1k数据集训练的ResNet模型的归一化参数为:

  • mean_values= [123.675,116.28,103.53]
  • scale_values=[58.395,57.12,57.375]

        将ONNX模型转换为OpenVINO IR模型的命令为:

mo -m resnet50.onnx --mean_values=[123.675,116.28,103.53] --scale_values=[58.395,57.12,57.375]  --data_type FP16 --reverse_input_channels

当获得ResNet50的IR模型后,可以使用下面的程序,完成推理计算

from openvino.runtime import Core

import cv2

import numpy as np

core = Core()

resnet50 = core.compile_model("resnet50.xml", "CPU")

output_node = resnet50.outputs[0]

# Resize

img = cv2.resize(cv2.imread("cat.jpg"), [224,224])

# Layout: HWC -> NCHW

blob = np.expand_dims(np.transpose(img, (2,0,1)), 0)

result = resnet50(blob)[output_node]

print(np.argmax(result))

        在上面的推理代码中,仍有调整图像尺寸,改变图像数据布局等操作在推理代码中实现,接下来,本文将介绍用OpenVINO™ 预处理API,将更多预处理操作嵌入模型中。

1.2 用OpenVINO™ 预处理API实现数据预处理

        从OpenVINO™ 2022.1开始,OpenVINO提供一套预处理API,将数据预处理嵌入模型,参考《使用OpenVINO™ 预处理API进一步提升YOLOv5推理性能》。将数据预处理嵌入模型的好处是:

  • 提高AI模型的移植性(推理代码无需考虑编写预处理程序)
  • 提高推理设备(例如,英特尔®集成显卡/独立显卡)的利用率
  • 提高AI程序端到端的性能

        使用OpenVINO™ 预处理API将预处理嵌入模型的完整范例程序export_resnet_ov_ppp.py,如下所示:

from openvino.preprocess import PrePostProcessor, ColorFormat, ResizeAlgorithm
from openvino.runtime import Core, Layout, Type, serialize
# ========  Step 0: read original model =========
core = Core()
model = core.read_model("resnet50.onnx")
# ======== Step 1: Preprocessing ================
ppp = PrePostProcessor(model)
# Declare section of desired application's input format
ppp.input("images").tensor() \
    .set_element_type(Type.u8) \
    .set_spatial_dynamic_shape() \
    .set_layout(Layout('NHWC')) \
    .set_color_format(ColorFormat.BGR)
# Specify actual model layout
ppp.input("images").model().set_layout(Layout('NCHW'))
# Explicit preprocessing steps. Layout conversion will be done automatically as last step
ppp.input("images").preprocess() \
    .convert_element_type()     \
    .convert_color(ColorFormat.RGB) \
    .resize(ResizeAlgorithm.RESIZE_LINEAR) \
    .mean([123.675, 116.28, 103.53]) \
    .scale([58.624, 57.12, 57.375])
# Dump preprocessor
print(f'Dump preprocessor: {ppp}')
model = ppp.build()
# ======== Step 2: Save the model with preprocessor================
serialize(model, 'resnet50_ppp.xml', 'resnet50_ppp.bin')

        export_resnet_ov_ppp.py运行结果,如下图所示:

        从上面的代码可见,使用OpenVINO™预处理API,可以将图像尺寸调整、彩色通道转换、数据归一化、数据布局转换全部集成到模型中,并且无需运行模型优化器,即可以将ONNX模型导出为IR模型。

        基于resnet50_ppp.xml的完整推理程序,如下所示:

from openvino.runtime import Core
import cv2 
import numpy as np
core = Core()
resnet50_ppp = core.compile_model("resnet50_ppp.xml", "CPU")
output_node = resnet50_ppp.outputs[0]
blob = np.expand_dims(cv2.imread("cat.jpg"),0)
result = resnet50_ppp(blob)[output_node]
print(np.argmax(result))

    如上所示,基于内嵌预处理的IR模型,OpenVINO推理程序变得更加简单清晰,易读易懂了。五行Python核心代码实现了内嵌预处理的ResNet模型推理!

1.3 使用模型缓存技术进一步缩短首次推理时延

        在《在蝰蛇峡谷上实现YOLOv5模型的OpenVINO异步推理程序》讨论了AI应用程序端到端的性能。对于首次推理时延来说,模型的载入和编译时间,会极大增加首次推理的端到端的运行时间。

        使用模型缓存技术,将极大的缩短首次推理时延,如下图所示。

        使用模型缓存技术,只需要添加一行代码:core.set_property({'CACHE_DIR': './cache/ppp'}),完整范例代码如下所示:

from openvino.runtime import Core
import cv2 
import numpy as np
core = Core()
core.set_property({'CACHE_DIR': './cache/ppp'}) # 使用模型缓存技术
resnet50_ppp = core.compile_model("resnet50_ppp.xml", "CPU")
output_node = resnet50_ppp.outputs[0]
blob = np.expand_dims(cv2.imread("cat.jpg"),0)
result = resnet50_ppp(blob)[output_node]
print(np.argmax(result))

        当第二次运行推理程序时,OpenVINO™ 运行时将从缓存文件夹直接加载已编译好的模型,极大的优化了首次推理时延。

1.4 总结

本文详细介绍了通过模型优化器和OpenVINO™ 预处理API,将数据预处理嵌入AI模型的技术。将数据预处理嵌入模型,简化了推理程序编写,提升推理计算设备利用率并提升了AI程序端到端的性能。最后,本文还介绍了通过模型缓存技术,进一步优化AI程序端到端的首次推理时延性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/63236.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习——评估和改进学习算法

0. 引言 当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么? 获得更多的训练样本——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。尝试减少特征的…

2022年最新Android面试题整理,全网都在看,史上最全面试攻略

Android面试现在什么东西是必须考察的?专业素养还是面试技巧?四大组件还是Framework层源码?哪有什么必考的,可以说所有技术栈都不是必考,但又是必考。话虽看似矛盾,但却反映了当前国内互联网环境的现状&…

基于随机油漆优化器 (MOSPO)求解多目标优化问题附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

HTML刷题

HTML5 之前的版本是 HTML4.01 onblur 和 onfocus 属于焦点事件: onblur:失去焦点 onfocus:获取焦点 链接:为同一个文件添加多种文件格式的原因是什么 ?&l__牛客网 来源:牛客网 1.为同一个文件添…

vue提取字符串中中文汉字的大写首字母

vue提取字符串中中文汉字的大写首字母 1.需求背景 最近开发vue项目,在关于药品的项目中有个需求是要提取药品中文名称的首字母组成拼音码。 解决方案 这里需要用到pinyin-pro插件,参数介绍如下: 使用如下: // 1、安装piny…

OpenAI ChatGPT注册试用全攻略

OpenAI ChatGPT注册试用全攻略 最近ChatGPT很火,但是有人注册会经常出现不服务当前地区问题,现在手把手教你解决。 如何在中国试用ChatGPT? 这是ChatGPT给的回答 您好,ChatGPT是一种计算机程序,可以自动生成自然语…

C#大型外卖订单调度系统源码PC版 手机版 商户版

开发环境: VS2012 SQL2008R2 菜单功能 1、手机端功能模块 1)自动定位或者搜索地址:使用百度地图,实现自动定位,打开微信自动定位,搜索附件外卖商家 2)附近外卖商家展示&…

《痞子衡嵌入式半月刊》 第 31 期

痞子衡嵌入式半月刊: 第 31 期 这里分享嵌入式领域有用有趣的项目/工具以及一些热点新闻,农历年分二十四节气,希望在每个交节之日准时发布一期。 本期刊是开源项目(GitHub: JayHeng/pzh-mcu-bi-weekly),欢…

后端存储实战课——高速增长篇

数据库超时 MySQL CPU 的利用率一直是 100% 的话,MySQL 基本属于不可用的状态,执行的 SQL 都会超时。 CPU 利用率高的情况,绝大多数是由于慢 SQL 引起的,可以通过分析慢 SQL 日志查找类似问题原因。由于数据库忙的时候&#xff…

深入学习Android

我通过阅读邓凡平前辈的《深入理解Android》,为了加深学习作此学习笔记。虽然是邓老师2011著的书,但其中的安卓框架还是可以学习的。另老师的csdn地址在:阿拉神农的博客_CSDN博客-Android开发系列,深入理解Android,移动万态领域博主tips:阅读…

如何进阶一名有竞争力的程序员?

前言 这段时间,又互联网寒冬了,你看消息满天飞。一瞬间,裁员的,辟谣的,很是热闹。这搞得我们程序员很难受,本来压力就大,还动不动有人在你耳边煽风点火制造恐慌。我想说:难道就不能…

[附源码]Python计算机毕业设计SSM教师信息采集系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

APISIX 在君润人力云原生平台的架构实践

讲师:袁鹏,一页科技架构师 摘要: 君润人力采用多套 Apache APISIX 集群来满足自研服务平台的功能需求。 君润人力成立于 2019 年,是一家以科技驱动的人力资源解决方案服务商,依托行业领先的科技水平和服务能力&#xf…

透视投影函数的图像

因为有个需求是判断线是否被视锥体裁切,因为NDC比较好判断是否裁切,所以研究了一下透视投影变换的函数图像。 从透视投影矩阵可以看出,在同一个z上,x,y都是线性的,所以这里主要研究z的变换函数图像。 我用的是Vulkan&a…

[附源码]Python计算机毕业设计SSM健身网站平台(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【SQL】锁机制

【SQL】锁机制锁的不同角度分类从数据操作的类型划分:读锁,写锁从数据操作的粒度划分:表级锁,页级锁,行锁表锁意向锁(intention lock)自增锁(AUTO-INC锁)元数据锁&#x…

Java --- Spring6对IoC的实现

目录 一、控制反转 二、依赖注入 三、set注入 四、构造注入 一、控制反转 1、控制反转是一种思想 2、控制反转是为了降低程序耦合度,提高程序扩展力,达到OCP原则,达到DIP原则。 3、控制反转主要有:①、将对象的创建权力交出去&#xff…

莱特飞行优化及其使用场景

莱特飞行优化及其使用场景 一,莱特飞行 但是产生一个莱特飞行分布的随机数是比较难的,莱特只给出了一个积分,所以后面就有人提出了如何制造这样分布的随机数。 Mantegna 在1994年提出的一种用正态分布求解随机数的方法,有时也叫…

nginx目录穿越漏洞(insecure-configuration)

该漏洞是由于配置错误导致的 漏洞原理:传送门 这个常见于Nginx做反向代理的情况,动态的部分被proxy_pass传递给后端端口,而静态文件需要Nginx来处理。 环境: vulhub靶场 进入nginx/insecure-configuration 运行docker-comp…

【编码】PHP中文路径问题详解

1. 问题 低版本的PHP可能会遇到不支持中文路径的情况: (1) require(‘http://localhost/中文路径/test.php’); (2) require(‘\中文路径\test.php’); (3) $file fopen(‘http://localhost/中文路径/test.php’); (4) $file fopen(‘\中文路径\test.php’);…