QNN：基于QNN+example重构之后的yolov8det部署

news2026/2/15 23:28:38

QNN是高通发布的神经网络推理引擎，是SNPE的升级版，其主要功能是：

完成从Pytorch/TensorFlow/Keras/Onnx等神经网络框架到高通计算平台的模型转换；
完成模型的低比特量化（int8），使其能够运行在高通神经网络芯片上；
提供测试工具（qnn-net-run），可以运行网络并保存输出；
提供测试工具（qnn-profile-viewer），可以进行FLOPS、参数量、每一层运行时间等分析；

Qualcomm® AI Engine Direct 架构采用模块化设计，可实现软件中的清晰分离对于不同的硬件核心/加速器，例如 CPU、GPU 和 DSP，指定为后端。了解有关 Qualcomm® 的更多信息AI Engine Direct后端此处。

针对不同硬件核心/加速器的 Qualcomm® AI Engine Direct 后端被编译为与 SDK 一起打包的各个特定于核心的库。

跨 IP 核的统一 API

Qualcomm® 的主要亮点之一AI Engine Direct 是它提供了统一的 API 来委托操作例如跨所有硬件加速器后端的图形创建和执行。这允许用户将 Qualcomm® AI Engine Direct 视为硬件抽象 API，并将应用程序轻松移植到不同的内核。

正确的抽象级别

Qualcomm® AI Engine Direct API 旨在支持高效的执行模型具有内部处理的图形优化等功能。但与此同时，它遗漏了更广泛的功能，例如模型解析和网络分区到更高级别的框架。

组合的灵活性

借助 Qualcomm® AI Engine Direct，用户可以在后端提供的功能之间进行适当的权衡以及库大小和内存利用率方面的占用空间。这提供了以下能力：构建 Qualcomm® AI Engine Direct 操作包，仅包含服务一组模型所需的操作以用例为目标1。有了这个，用户可以创建灵活的应用程序内存占用低，适合各种硬件产品。

可扩展的运营支持

Qualcomm® AI Engine Direct 还为客户集成自定义操作以无缝协作提供支持内置操作。

提高执行性能

凭借优化的网络加载和异步执行支持 Qualcomm®AI Engine Direct 可提供高度机器学习框架和应用程序加载和执行网络图的高效接口他们想要的硬件加速器。。

我们主要将QNN重新封装一下完成合适与自己的代码结构与逻辑。因为本身的QNN demo看着太复杂了。

重构之后如下图所示：