92、评估代码生成操作带来的性能提升

92、评估代码生成操作带来的性能提升

news2025/12/25 20:37:02

本节评估一下，通过代码生成操作之后，对于模型的性能提升。

评估下性能

在相同的环境下，分别运行 4th_no_malloc 和 5th_codegen 下的 compile.sh 脚本进行代码编译，然后运行编译后生成的可执行文件 ./resnet。

可以分别获取到权值预加载前后的性能指标。

注意：不同电脑机器不同环境下测出来的性能会有差异，大家只需要比对性能提升的相对值即可。

可以看到和之前的几个优化相比，性能有点提升但不是很明显。

这是因为以下几个原因。

1 之前的代码和 codegen 生成的代码，在利用 g++ 进行编译时都开启了 -Ofast 优化，优化等级很高。编译器已经把很多无用的中间临时变量，分支预测和跳转给优化的很好了，所以 codegen 对于这些地方带来的优化提升并不明显。

2 细心的同学可能发现了，生成的代码和原来的逻辑是一样的，区别最大的地方就在于把原来的一些函数，比如conv函数，拆成了很

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1478174.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

可视化图文报表

可视化图文报表

Apache Echarts介绍 Apache Echarts是一款基于Javascript的数据可视化图表库，提供直观，生动，可交互，可个性化定制的数据可视化图表。官网：Apache ECharts 入门案例： <!DOCTYPE html> <html>…

阅读更多...

Git教程-Git的基本使用

Git教程-Git的基本使用

Git是一个强大的分布式版本控制系统，它不仅用于跟踪代码的变化，还能够协调多个开发者之间的工作。在软件开发过程中，Git被广泛应用于协作开发、版本管理和代码追踪等方面。以下是一个详细的Git教程，我们将深入探讨Git的基本概念和…

阅读更多...

基于大模型思维链（Chain-of-Thought）技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用

基于大模型思维链（Chain-of-Thought）技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用

本篇为个人笔记记录基于大模型思维链（Chain-of-Thought）技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用人工智能为个人兴趣领域业余研究如有错漏欢迎指出！！！ 目录本篇为个人笔记记录基…

阅读更多...

【算法】最小生成树—Prim算法与Kruskal算法

【算法】最小生成树—Prim算法与Kruskal算法

Prim算法和Kruskal算法都是解决最小生成树问题的经典算法。最小生成树是原图的最小连通子图，它包含原图的全部结点，且保持图连通的所有边代价和最小。一个连通图可能有多个最小生成树。一、Prim算法含义 Prim算法，也被称为普里姆算法&…

阅读更多...

项目解决方案: 实时视频拼接方案介绍

项目解决方案: 实时视频拼接方案介绍

目录 1、实时视频拼接概述 2、适用场景 3、系统介绍 3.1拼接形式 3.1.1横向拼接 3.1.2纵向拼接 3.2前端选择 3.2.1前端类型 3.2.2推荐配置 3.3后端选择 3.3.1录像回放 3.3.2客户端展示 4、拼接方案介绍 4.1基于4K摄像机的拼接方案 4.1.1系统架构…

阅读更多...

ESP8266智能家居（3）——单片机数据发送到mqtt服务器

ESP8266智能家居（3）——单片机数据发送到mqtt服务器

1.主要思想前期已学习如何用ESP8266连接WIFI，并发送数据到服务器。现在只需要在单片机与nodeMCU之间建立起串口通信，这样单片机就可以将传感器测到的数据：光照，温度，湿度等等传递给8266了，然后8266再对数据…

阅读更多...

typescript 的常用方式

typescript 的常用方式

文章目录前言一、绑定props 默认值的方式：withDefaults1.vue2 的props设置默认值2.vue3 的props设置默认值(1) 不设置默认值的写法(2) 设置默认值的写法（分离模式）(3) 设置默认值的写法（组合模式） 二、定义一个二维数…

阅读更多...

Qt|QTreewidget类下函数qt助手详解说明示例（上）

Qt|QTreewidget类下函数qt助手详解说明示例（上）

该系列持续更新，喜欢请一键三连，感谢各位大佬。 QT5.14.2 参考官方QT助手文章目录 QTreeWidget ClasspropertiesPublic Functions默认构造函数默认析构函数添加根节点void addTopLevelItem(QTreeWidgetItem *item)添加多个根节点void addTopLevelItems…

阅读更多...

Linux Shell脚本练习（一）

Linux Shell脚本练习（一）

一、 Linux下执行Shell脚本的方式： 1、用shell程序执行脚本： a、根据你的shell脚本的类型，选择shell程序，常用的有sh，bash，tcsh等 b、程序的第一行#!/bin/bash里面指明了shell类型的，比如#!/…

阅读更多...

linux查看服务器内核CUP版本相关命令

linux查看服务器内核CUP版本相关命令

服务器参考计算架构：x86-64产品系列：华为云耀云服务器操作系列：CentOS 7 执行uname -a查看服务器内核版本 Linux hecs-82210 3.10.0-1160.92.1.el7.x86_64 #1 SMP Tue Jun 20 11:48:01 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux执行hostn…

阅读更多...

Aws Ec2服务器设置密码登录

Aws Ec2服务器设置密码登录

通过密钥，ssh登录到服务器切换到root sudo -i开始设置root的新密码 passwd root输入并确认新密码即可 5.修改ssh配置文件 vim /etc/ssh/sshd_config6.重启sshd配置 systemctl restart sshd

阅读更多...

关于电脑一天24小时多少度电电脑的一天用电量计算

关于电脑一天24小时多少度电电脑的一天用电量计算

随着这几年物价的上涨，一些地区的电价越来越高，而我们经常需要使用电脑，那么一台电脑一天24小时用多少度电呢？ 如何计算电脑一天的用电量？ 让我们跟随小编来了解更多吧。 1、功耗、主机箱功耗现在的计算机中&#xf…

阅读更多...

2000-2022年上市公司绿色专利申请占比/数据

2000-2022年上市公司绿色专利申请占比/数据

2000-2022年上市公司绿色专利申请占比数据 1、时间：2000-2022年 2、来源：国家知识产权局、WIPO绿色专利清单 3、指标：年份、股票代码、股票简称、行业代码、省份、城市、区县、行政区划代码、城市代码、区县代码、首次上市年份、上市状态、…

阅读更多...

广和通发布基于MediaTek T300平台的RedCap模组FM330系列及解决方案

广和通发布基于MediaTek T300平台的RedCap模组FM330系列及解决方案

世界移动通信大会MWC 2024期间，广和通发布基于MediaTek T300平台的RedCap模组FM330系列，加速5G-A繁荣发展。FM330系列及其解决方案采用全球先进RedCap方案，满足移动宽带和工业互联对高能效的需求。广和通FM330系列采用全球首款6nm制程且集成…

阅读更多...

什么是回表、索引覆盖、索引下推【重点】

什么是回表、索引覆盖、索引下推【重点】

参考链接【1】https://xiaolincoding.com/mysql/index/index_interview.html#%E6%8C%89%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E5%88%86%E7%B1%BB 【2】https://www.toutiao.com/article/7095749260137726476/?wid1709192807222 【3】https://zhuanlan.zhihu.com/p/401198674…

阅读更多...

压缩式交换式碎片整理：（使碎片减少或没有）

压缩式交换式碎片整理：（使碎片减少或没有）

交换式碎片整理首先流程是 p3这个程序在运行，p1p2p4 的话在等待 ，然后p3这时要多用3个内存块，这是 p4 通过拷贝，将内存拷贝到磁盘上，对应的数据也是从主存中cp到磁盘此时主存多出3个内存块给p3继续使用 2.压缩式碎片…

阅读更多...

请求响应与统一响应结果

请求响应与统一响应结果

1.请求响应 1.安装postman 2.简单的参数 //原始的请求参数的方法RequestMapping("/simoleParam")public String simpleParam(HttpServletRequest request){String name request.getParameter("name");String ageStr request.getParameter("age&quo…

阅读更多...

android开发书籍推荐，android面试复习

android开发书籍推荐，android面试复习

笼统来说，中年程序员容易被淘汰的原因其实不外乎三点。 1、输出能力已到顶点。这个人奋斗十来年了，依旧碌碌无为，很明显这人的天花板就这样了，说白了，天赋就这样。 2、适应能力越来越差。年纪大，有家庭&…

阅读更多...

【Java】基本数据类型、包装类与字符串间的转换例题

【Java】基本数据类型、包装类与字符串间的转换例题

写在前面： 关于这道题，初见感觉有点cpu烧坏了，准确来说是看了网上的一些讲解都感觉不尽人意。自己整理了一下，希望能帮助到大家。题目： 如下两个题目输出结果相同吗？各是什么。 Object o1 true ? new…

阅读更多...

【web APIs】5、（学习笔记）有案例！

【web APIs】5、（学习笔记）有案例！

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、js组成window对象定时器-延迟函数location对象navigator对象histroy对象二、本地存储（今日重点）localStorage（重点&am…

阅读更多...

推荐文章

最新文章