C++中前置操作性能一定优于后置操作?

news2024/12/28 4:13:03

后置操作和前置操作,一个会产生临时变量,一个不会产生临时变量,其原因是:前置操作遵循的规则是change-then-use而后置操作遵循的规则是use-then-change。正因为后置操作的use-then-change原则,使得编译器在实现该操作的时候,先把之前的值进行拷贝备份,然后对值进行更改操作,最后返回之前备份的值。

以整型为例:

// ++i
i = i+1;
return i;

// i++
temp = i;
i=i+1;
return temp;

同样,对于复杂类型:

// ++i
Object &operator++() {     
  ++value_;     
  return *this;   
}    
// i++    
Object operator++(int) {     
  Object old = *this;    
      ++*this;     
  return old;  
}  

也正是基于上述原因,我们通常会得出一个结论:前置操作比后置操作更快

那么,真的是这样么?下面将分别从内置类型和非内置类型两个方面进行分析。

内置类型

为了便于分析二者的性能,写了个测试代码,用来比较前置++和后置++的性能差异,代码如下:

pre_inc.cc

void PreInc() {
  for (int i = 0; i < 100000; ++i) {
     for (int j = 0; j < 100000; ++j) {
       for (int k = 0; k < 1000; ++k);
     }
   }
}
int main() {
  PreInc();
  return 0;
}  

post_inc.cc

void PostInc() {
  for (int i = 0; i < 100000; i++) {
     for (int j = 0; j < 100000; j++) {
       for (int k = 0; k < 1000; k++);
     }
   }
}
int main() {
  PostInc();
  return 0;
}  

编译运行之后,比较二者的运行时间,对比图如下:

耗时竟然一样😲,颠覆了之前对这块的认知。

使用下述命令生成汇编代码(使用-O0禁用优化以免结果产生偏差):

$ g++ -O0 -S pre.cc
$ g++ -O0 -S post.cc

查看上述两个汇编文件的不同点(使用vimdiff):

通过上述对比,发现前置++和后置++的汇编结果一致,这也就是说至少对于内置类型(上述代码使用的是int),前置++和后置++的性能一样。在进行搜索的时候,发现了下面这段话:

“The compiler will optimize it away” is an incredibly lazy justification for using i++ instead of ++i. Moreover, it is basically only true for built-in types, not for class types.

从上述可以看出,对于内置类型的后置++操作,编译器会进行优化,而对于非内置内存,则不会进行优化,那么到底是不是这样呢?

自定义类型

迭代器

对于C++开发人员,在遍历vector、list或者set等结构的时候,都习惯于使用迭代器即iterator进行遍历,而gcc实现中,对iterator(此处只罗列了vector相关)的定义如下:

typedef __gnu_cxx::__normal_iterator<pointer, vector> iterator;

从上述定义可以看出,iterator不是内置类型,同内置类型一样,**iterator也支持前置++和后置++**,所以,在本节中使用迭代器的前置++和后置++对容器进行遍历,以测试其性能,代码如下:

#include <chrono>
#include <iostream>
#include <numeric>
#include <vector>

int main(int, char**)
{
  std::vector<unsigned> v1( 1000000 );
  std::vector<unsigned> v2( 1000000 );

  std::iota( v1.begin(), v1.end(), 1 );
  std::iota( v2.begin(), v2.end(), 2 );

  std::chrono::time_point<std::chrono::high_resolution_clock> t1, t2, t3;

  t1 = std::chrono::high_resolution_clock::now();

  for( auto it = v1.begin(); it != v1.end(); ++it )
    *it *= 2;

  t2 = std::chrono::high_resolution_clock::now();

  for( auto it = v2.begin(); it != v2.end(); it++ )
    *it *= 2;

  t3 = std::chrono::high_resolution_clock::now();

  std::chrono::duration<double> d1 = t2 - t1;
  std::chrono::duration<double> d2 = t3 - t2;

  std::cout << "pre time cost: " << std::chrono::duration_cast<std::chrono::microseconds>(d1).count() << "us" << std::endl;
  std::cout << "post time cost:  " << std::chrono::duration_cast<std::chrono::microseconds>(d2).count() << "us" << std::endl;

  return 0;
}

编译并运行:

 g++ --std=c++11 test.cc -o test; ./test
 pre time cost: 44008us
 post time cost:  58283us

通过上述结果可以看出,对于非内置类型(或者更确切的说对于迭代器类型),前置操作的性能优于后置

上面从执行时间的角度分析了迭代器的前置操作和后置操作对性能的影响,下面是STL中对iterator的源码:

__normal_iterator&
       operator++() // 前置操作
       {
     ++_M_current;
     return *this;
       }

 __normal_iterator
       operator++(int) // 后置操作
       { return __normal_iterator(_M_current++); }

从上面代码可以看出,迭代器的前置和后置操作主要有以下两个区别:

  • • 返回值:前置操作返回对象的引用,后置操作返回类型为对象,

  • • 拷贝:前置操作无拷贝操作,后置操作存在一次对象拷贝

正式因为这两个原因,前置操作符就地修改对象,而后置操作符将导致创建临时对象,调用构造函数和析构函数(某些情况下编译器会做优化,此处不做讨论),导致了前置操作和后置操作的性能差异。

自定义对象

在上一节中,我们通过迭代器(前置递增和后置递增)遍历对vector进行遍历,证明了前置递增的性能优于后置递增,在本节中,将自定义一个对象,然后进行测试。

代码如下(在最开始的自定义对象中,只有整数value_而没有v_变量,这就导致测试结果很相近,所以为了更加明显的看出其差异,所以增加了vector😁):

class Object {
  public:
    Object(int value)
      : value_(value) {
        v_.emplace_back(value_);
      }

    int Get() { return value_; }

    Object &operator++() // 前置操作
    {
      ++value_;
      v_.emplace_back(value_);
      return *this;
    }

    Object operator++(int) // 后置操作
    {
      Integer tmp = *this; // 拷贝,注意此处这个拷贝行为以及临时变量
      ++value_;
      v_.emplace_back(value_);
      return tmp; //
    }

  private:
    std::vector<int> v_;
    int value_;
};

int main() {
  std::chrono::time_point<std::chrono::high_resolution_clock> t1, t2, t3;

  t1 = std::chrono::high_resolution_clock::now();
  Integer i(0);
  for (int j = 0; j < 10000; ++j) {
    ++i;
  }
  t2 = std::chrono::high_resolution_clock::now();
  Integer k(0);
  for (int j = 0; j < 10000; ++j) {
    k++;
  }
  t3 = std::chrono::high_resolution_clock::now();
  
  std::chrono::duration<double> d1 = t2 - t1;
  std::chrono::duration<double> d2 = t3 - t2;

  std::cout << "pre time cost: " << std::chrono::duration_cast<std::chrono::microseconds>(d1).count() << "us" << std::endl;
  std::cout << "post time cost:  " << std::chrono::duration_cast<std::chrono::microseconds>(d2).count() << "us" << std::endl;
  
  return 0;
}

编译并运行:

g++ --std=c++11 test.cc -o test; ./test
pre time cost: 188us
post time cost:  29625us

从上述测试结果可以进一步看出,前置++的性能优于后置++。

对于内置类型来说,前置++和后置++的性能一样,这是因为编译器会对其进行优化;而对于自定义类型的前置和后置操作,你可能会有疑问,为什么编译器不能像优化内置类型一样,优化自定义类型呢?这是因为依赖于场景。在某些场景下编译器可以进行优化(主要是拷贝部分),但是在某些情况下,编译器无法在不更改代码含义的情况下对其进行优化。所以,除非需要后置操作,否则建议使用前置操作

结语

在本文中,分别从内置类型的前后置操作和自定义类型的后置操作进行性能对比,结果发现对于内置类型,二者在性能上无差异,而对于自定义类型,前置操作的性能远优于后置操作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/75779.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python如何pip批量安装指定包 - 最简单方法

文章目录背景解决办法1. 制作requirements.txt文件2. 将requirements.txt传到需要部署的电脑上3. 批量安装包背景 有很多台服务器需要配置, 简单说也就是公司给我配备了3台Windows, 我需要配置Python环境并安装7个包, 如果按照常规的pip install我至少得安装3x721次, 并且得一…

data shift--学习笔记

一般假设训练集和测试集是独立同分布的&#xff0c;才能保证在训练集上表现良好的模型同样适用于测试集。当训练集和测试集不同分布时&#xff0c;就发生了dataset shiftdata shift类型&#xff1a; 协变量偏移&#xff08;covariate shift&#xff09;&#xff1a; 协变量&…

简约而不简单!分布式锁入门级实现主动续期-自省

一、背景 一个分布式锁应具备的功能特点中有避免死锁这一条&#xff1a; 如果某个客户端获得锁之后处理时间超过最大约定时间&#xff0c;或者持锁期间内发生了故障导致无法主动释放锁&#xff0c;其持有的锁也能够被其他机制正确释放&#xff0c;并保证后续其它客户端也能加锁…

Unity 3D 刚体(Rigidbody)|| Unity 3D 刚体实践案例

Unity 3D 中的 Rigidbody 可以为游戏对象赋予物理特性&#xff0c;使游戏对象在物理系统的控制下接受推力与扭力&#xff0c;从而实现现实世界中的物理学现象。 我们通常把在外力作用下&#xff0c;物体的形状和大小&#xff08;尺寸&#xff09;保持不变&#xff0c;而且内部…

Vue3 —— Pinia 的学习指南以及案例分享

文章目录 前言一、什么是pinia?二、为什么要使用Pinia?三、Pinia对比Vuex四、具体使用方法 1.安装2.创建一个store五、state 1.访问state2.重置状态3.修改state4.批量修改state5.替换state六、getters 1.访问getters2.getters传参3.写为普通函数可调用this4.访问其他的store中…

可见光热红外图像融合算法设计

本设计方式中对于多源图像融合算法采用以下三个步骤进行&#xff1a; 多源图像目标特征提取&#xff1b;多源图像配准&#xff1b;多源图像融合。 1&#xff0e;多源图像目标特征提取 多源图像的目标特征提取中&#xff0c;优先对目标图像进行预处理&#xff0c;对于可见光图像…

品牌势能铸就非凡经典,凯里亚德与郁锦香酒店亮相品牌沙龙会烟台站

近日&#xff0c;汇聚国内众多投资人的锦江酒店(中国区)品牌沙龙会烟台站顺利举行。本次沙龙活动以“齐风鲁韵 锦绘未来”为主题&#xff0c;锦江酒店(中国区)旗下众多优秀品牌共同亮相。凯里亚德酒店与郁锦香酒店在本次活动中向投资人展示了在如今复杂多变的酒店市场中如何以强…

Java面向对象:继承

面向对象三大特征之二&#xff1a;继承 目录 面向对象三大特征之二&#xff1a;继承 1.继承是什么&#xff1a; 2.继承的好处 继承概述的总结 1.什么是继承&#xff1f;继承有什么好处&#xff1f; 2.继承的格式是什么样的&#xff1f; 3.继承后子类的特点是什么&#x…

Docker介绍及项目部署

安装Docker 关闭SELINUX服务 SELINUX是CentOS系统捆绑的安全服务程序&#xff0c;因为安全策略过于严格&#xff0c;所以建议搭建关闭这项服务 修改/etc/selinux/config文件&#xff0c;设置SELINUXdisabled vim /etc/selinux/config # 设置SELINUXdisabled# 设置完成后重启…

[附源码]计算机毕业设计姜太公渔具销售系统Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

Crane如何做到利用率提升3倍稳定性还不受损?

作为云平台用户&#xff0c;我们都希望购买的服务器物尽其用&#xff0c;能够达到最大利用率。然而要达到理论上的节点负载目标是很的&#xff0c;计算节点总是存在一些装箱碎片和低负载导致的闲置资源。下图展示了某个生产系统的CPU资源现状&#xff0c;从图中可以看出&#x…

编译器设计(十二)——指令选择

文章目录一、简介二、代码生成三、扩展简单的树遍历方案四、通过树模式匹配进行指令选择4.1 重写规则4.2 找到平铺方案五、通过窥孔优化进行指令选择5.1 窥孔优化5.2 窥孔变换程序六、高级主题6.1 学习窥孔模式6.2 生成指令序列七、小结和展望一、简介 指令选择&#xff08;in…

java面试题-并发

1. 并行和并发有什么区别&#xff1f; 并行&#xff1a;多个处理器或多核处理器同时处理多个任务。并发&#xff1a;多个任务在同一个 CPU 核上&#xff0c;按细分的时间片轮流(交替)执行&#xff0c;从逻辑上来看那些任务是同时执行。 如下图&#xff1a; 并发 两个队列和一…

从功能测试到自动化测试,待遇翻倍,我整理的超有用工作经验分享~

我想应该有很多测试人员应该有这样的疑虑&#xff0c;自动化测试要怎么去做&#xff0c;现在我把自己的一些学习经验分享给大家&#xff0c;希望对你们有帮助&#xff0c;有说的不好的地方&#xff0c;还请多多指教&#xff01; 对于测试人员来说&#xff0c;不管进行功能测试还…

从股票市场选择配对的股票:理论联系实际

我们有了计算距离的方法&#xff0c;即共同因子相关系数的绝对值就是衡量协整性的一个好方法。现在看一些实际应用中会遇到的问题。 整合的特定回报的平稳性&#xff08;Stationarity of Integration Specific Returns) 两个时间序列协整的必要条件是整合的特定回报时序是平稳…

k8s安装3节点集群Fate v1.7.2

采用k8s&#xff0c;而非minikube, 在3个centos系统的节点上安装fate集群。 集群配置信息 3节点配置信息如下图&#xff1a; 当时kubefate最新版是1.9.0&#xff0c;依赖的k8s和ingress-ngnix版本如下&#xff1a; Recommended version of dependent software: Kubernetes:…

Java编码的坑你知多少?

货币计算坑&#xff1a; 这段代码你认为结果是多少&#xff1f; 我们期望的结果是0.4&#xff0c;也应该是这个数字&#xff0c;但是打印出来的却是0.40000000000000036&#xff0c;这是为什么呢&#xff1f; 这是因为在计算机中浮点数有可能&#xff08;注意是可能&#xff0…

Flask从入门到放弃(介绍、模版语法案例、配置文件、路由本质、CBV整体流程)

文章目录一、Flask介绍二、Flask快速使用三、Flask展示用户信息案例四、Flask配置文件五、路由系统1&#xff09;路由系统2&#xff09;路由本质3&#xff09;Add_url_rule的参数六、Flask的CBV1&#xff09;CBV的写法2&#xff09;CBV添加装饰器3&#xff09;as_view的执行流程…

排名前十的仓库管理系统大盘点(真实测评)!

通过本篇文章&#xff0c;您将了解以下问题&#xff1a;1、国内适合企业的仓库管理系统软件有哪些&#xff0c;排名怎么样&#xff1f;2、企业在选择仓库管理系统时应考虑哪些因素&#xff1f; 目前市场上有多种仓库管理系统&#xff0c;不同的仓库管理系统由于目标市场的不同…

dumi 如何使用?一文教你使用,高效写出你的博客、组件库文档

文章目录一、dumi介绍二、使用 dumi 的两种方式&#xff08;着重在已成型项目中使用dumi&#xff09;2.1、基于 dumi 官网带有的脚手架去进行开发2.2、在已成型的项目中引用 dumi 插件&#xff0c;运行项目2.3、dumi中使用scss2.4、如何在组件内写 tsx | md 文档2.4.1、button/…