记一个奇怪的gcc编译优化:-ftree-vrp

news2025/1/15 11:56:38

记一个奇怪的gcc编译优化:-ftree-vrp

最近有同事遇到一个gcc不同编译优化选项结果不一致的问题,从该问题反映出编程规范(我更倾向于华为内部使用的”编程军规“的叫法)的问题非常有参考意义,在此分享给大家。

程序可简化如下:

#include <stdio.h>
 
int main() {
  int num = 0;
  int arr[5] = {10, 10, 10, 10, 10};
  while ((arr[4 - num] == 10) && (4 - num >= 0)) {
    num++;
    printf("while loop!\n");
  }
  printf("num = %d\n", num);
  int index = 4 - num;
  printf("index = %d\n", index);
  bool flag = index >= 0 ? 1 : 0;
  printf("flag = %d\n", flag);
  if (index >= 0) {
    printf("error!\n");
  }
  return 0;
}

当然这段代码有不少不符合编程军规的地方,这里先按下不表,下文再分析,这里先只看其功能。从代码逻辑来看,应该可以得到下面的打印结果:

while loop!
while loop!
while loop!
while loop!
while loop!
num = 5
index = -1
flag = 0

O0和O1编译( ”g++ hello.cpp -O1“ )后运行结果也确实如此,这符合我们的期望。但是选择O2编译( ”g++ hello.cpp -O2“ )后,却得到如下结果:

while loop!
while loop!
while loop!
while loop!
while loop!
num = 5
index = -1
flag = 1
error!

计算的 num index 一样,但基于 index 的范围判断却得到完全不同的结果,看上去似乎是O2编译优化出错了。想找到哪个优化pass导致这个问题倒也不难,我们可以尝试将gcc的O2比O1多的优化pass拿出来分别进行编译测试。这里列举了gcc各个优化等级所采用的优化pass。通过阅读O2的pass和实际测试,找到了肇事元凶。

-ftree-vrp

Perform Value Range Propagation on trees. This is similar to the constant propagation pass, but instead of values, ranges of values are >propagated. This allows the optimizers to remove unnecessary range checks like array bound checks and null pointer checks. This is >enabled by default at -O2 and higher. Null pointer check elimination is only done if -fdelete-null-pointer-checks is enabled.

使用 ”g++ hello.cpp -O1 -ftree-vrp“ 编译即可得到上面的错误结果,也即在O1的基础上加 " -ftree-vrp“ 优化pass。 " -ftree-vrp“ 的功能有点类似常量传播,但它传播的不是值,而是值的范围,也就是说编译器可以删除不必要的值范围检查,例如数组下标。

具体到我们这个问题,编译器认为 4 - num 是数组下标,是一个非负数,因而在13和15行地方不会真实的去判断 index 值的的范围,而直接认为它是非负的,从而得到错误的结果。这一点也可以直接从两种编译选项下( ”g++ hello.cpp -O1“ ”g++ hello.cpp -O1 -ftree-vrp“ )的反汇编得到印证:

在这里插入图片描述
在加了 " -ftree-vrp“ 优化(右图)后,源码13行这里直接将数值 1 给了 flag,源码15行这里也省去了判断,直接调用打印函数。

此外,需要注意的是 " -ftree-vrp“ 的优化是传播的是值范围而不是值,因此源码11行 index 的计算没有问题。

讲道理,编译器优化要优先保证程序的正确性,其次才是提升性能。这个优化是否有点争议这里不好说,也没查到类似的资料。我们回到上面的代码,现在可以说一说这段代码的问题了。

  • 第一,在循环体内修改了循环变量,这个是编程军规明令禁止的。
  • 第二,访问数组时,没有先检查数组下标是否越界, while 循环的最后一次循环时,也即 index=5 的时候发生数组读越界,这里应该将两个条件调换一下顺序:
#include <stdio.h>
 
int main() {
  int num = 0;
  int arr[5] = {10, 10, 10, 10, 10};
  // while ((arr[4 - num] == 10) && (4 - num >= 0)) {
  while ((4 - num >= 0) && (arr[4 - num] == 10)) {
    num++;
    printf("while loop!\n");
  }
  printf("num = %d\n", num);
  int index = 4 - num;
  printf("index = %d\n", index);
  bool flag = index >= 0 ? 1 : 0;
  printf("flag = %d\n", flag);
  if (index >= 0) {
    printf("error!\n");
  }
  return 0;
}

根据短路原则,第一个条件不满足时,就不会再进行第二个条件判断了,也就不会发生数组读越界。并且这样修改后,使用 ”g++ hello.cpp -O1 -ftree-vrp“ 编译结果也是正确的:

while loop!
while loop!
while loop!
while loop!
while loop!
num = 5
index = -1
flag = 0

我的理解是这样的:因为第一个条件 (4 - num >= 0) 不满足,编译器就能发现 4 - num 已经小于 0 了。

从这个问题可以看出,编程军规的重要性,上面说的两个问题都是编程军规应该明令禁止的。对于一个团队,可能大家水平层次不齐,制定规范的编程军规供大家学习并要求执行,可以很好的杜绝这些问题。

最后,附上一个不错的cpp编程规范。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/162353.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通信原理与MATLAB(十四):HDB3的编解码

目录1.HDB3码的编码原理2.HDB3码的解码原理3.HDB3码的编解码的代码4.HDB3码的误码率曲线4.1原理4.2 HDB3码的误码率曲线的代码4.3 HDB3码的误码率曲线图1.HDB3码的编码原理 如下图所示&#xff0c;HDB3编码的步骤&#xff1a; (1)原码中连0的个数小于等于3&#xff0c;则和AMI…

力扣刷题记录——482. 密钥格式化、485.最大连续1的个数、492. 构造矩形

本专栏主要记录力扣的刷题记录&#xff0c;备战蓝桥杯&#xff0c;供复盘和优化算法使用&#xff0c;也希望给大家带来帮助&#xff0c;博主是算法小白&#xff0c;希望各位大佬不要见笑&#xff0c;今天要分享的是——《482. 密钥格式化、485.最大连续1的个数、492. 构造矩形》…

如何使用mybatis处理数据库关系中的多对一关系呢?

测试环境的搭建&#xff1a; 导入lombok&#xff1a; 不懂得小伙伴可移步这篇文章 新建实体类&#xff1a; 拿我们日常生活中最常见的举例&#xff1a;多个学生对应一个老师 对于学生这边而言&#xff0c;关联… 多个学生关联一个老师[多对一] 对于老师而言&#xff0c;集…

「智能农牧」智慧养殖系统实现数智化经营,提升管理效率

01 方案背景 当前我国农牧养殖业正在不断发展&#xff0c;农牧养殖业的发展到了粗放型管理向集约型管理的节点上&#xff0c;智慧养殖势在必行。 智慧养殖是“人流程管理”到“数字智能”、从精细化管理到数智化经营。过去养猪行业的核心优势是管理的精细化&#xff0c;其经营…

Linux 命令(244)—— reset 命令

文章目录1.命令简介2.命令格式3.选项说明4.常用示例参考文献1.命令简介 reset 用来重新初始化终端。 在有些情况&#xff0c;终端显示会混乱无比&#xff0c;比如不小心显示了一个二进制文件或使用 tput 进行了一些不符合预期的终端配置。在你不知道 reset 命令前&#xff0c…

Linux cat 命令

cat&#xff08;英文全拼&#xff1a;concatenate&#xff09;命令用于连接文件并打印到标准输出设备上。使用权限所有使用者语法格式cat [-AbeEnstTuv] [--help] [--version] fileName参数说明&#xff1a;-n 或 --number&#xff1a;由 1 开始对所有输出的行数编号。-b 或 --…

快速生成音视频,全新的内容创作体验 #Fliki

当前的社交媒体是视频、音频&#xff0c;图像&#xff0c;文字多元发展的时代&#xff0c;很多文字从业者都需要把自己的内容以更丰富的形式呈现出来。辛苦构思了半天剪辑思路&#xff0c;有的时候常常面临剪音频视频卡死的情况&#x1f641;&#xff0c;太崩溃了&#xff01;巴…

Voltage Drop-based Fault Attacks on FPGAs using Valid Bitstreams论文笔记

V oltage Drop-based Fault Attacks on FPGAs using Valid Bitstreams论文笔记摘要前言电路设计和实验装置III-A节中解释电压波动传感器在FPGA中的实现。第III-B节中解释如何通过RO产生电压降。第III-C节中详细介绍了基于电压紧急情况的攻击原理及其实验设置。结果和讨论A崩溃所…

常见锁策略_CAS(Compare And Swap)_synchronized优化

目录 1.常见锁策略 1.1乐观锁vs悲观锁 1.2轻量级锁vs重量级锁 1.3自旋锁vs挂起等待锁 自旋锁 挂起等待锁 1.4互斥锁vs读写锁 1.5公平锁vs非公平锁 公平锁 非公平锁 1.6可重入锁vs不可重入锁 1.7使用锁策略描述synchronized 2.CAS(Compare And Swap) 2.1CAS应用场…

Python(15):Numpy之array结构

目录 0. 相关文章链接 1. ndarray概述 2. ndarray基本属性操作 3. 索引和切片 4. 矩阵格式 5. 数组的赋值和拷贝 6. bool类型数组和大小判断 7. 不同类型的数组 8. 数组的相乘和转换 0. 相关文章链接 Python文章汇总 1. ndarray概述 对于ndarray结构来说&#xff0…

SpringCloud笔记 - Day2 Nacos Feign Gateway

1. Nacos配置管理 配置的热更新 DataID 命名格式&#xff1a; 实例名-环境名.后缀名(yaml) 尽量用 yaml&#xff0c;不用 yml 2. Nacos配置管理 - 微服务配置拉取 把所有nacos地址和配置信息都放在 bootstrap.yml 引入 Nacos配置管理依赖 <dependency><groupId&g…

java 探花交友项目实战篇1Dubbo 提供者消费者 dubbo高级特性 启动检查 多版本 超时与重试 负载均衡

Dubbo的前世今生 SOA架构 Dubbo介绍 Dubbo是阿里巴巴公司开源的一个高性能、轻量级的 Java RPC 框架。 致力于提供高性能和透明化的 RPC 远程服务调用方案&#xff0c;以及 SOA 服务治理方案。 官网&#xff1a;http://dubbo.apache.org 目前Dubbo在企业中有两种开发思路 fe…

2023年零基础想学大数据?别急!先搞清这一点

◆ 首先学会百度与Google 不论遇到什么问题&#xff0c;先试试搜索并自己解决。 Google首选&#xff0c;翻不过去的&#xff0c;就用百度吧。 大数据知识点&#xff1a; ​ 编辑切换为居中 从传统关系型数据库入手&#xff0c;掌握数据迁移工具、BI数据可视化工具、SQL&am…

浅谈归并排序与快速排序

目录一、归并排序&#xff08;Merge Sort&#xff09;1.1 二路归并1.2 归并排序算法1.3 应用&#xff1a;计算逆序对的数量二、快速排序&#xff08;Quick Sort&#xff09;2.1 快速排序算法2.2 应用&#xff1a;快速选择三、模板汇总References一、归并排序&#xff08;Merge …

无聊猿游戏Dookey Dash分析

Dookey Dash是无聊猿项目方Yuga Labs近期即将推出的一款区块链游戏产品&#xff0c;无聊猿作为NFT的头部项目&#xff0c;自然也获得不少玩家的关注&#xff0c;以此赋能NFT&#xff0c;同时也被无聊猿持有者寄予厚望。游戏背景与规则Yuga Labs在游戏网站上使用了一则视频来为玩…

[CVPR 2022] Rethinking the Augmentation Module in Contrastive Learning

ContentsIntroductionMethodLearn Hierarchical Augmentation InvarianceFeature expansion with augmentation embeddingsExperimentsReferencesIntroduction 在对比学习中&#xff0c;数据增强是非常重要的&#xff0c;对比学习的本质就是通过让模型对数据增强具有不变性来使…

给国行Sony9500H更换美区950H主板

折腾理由 家中小朋友因为疫情&#xff0c;经常需要投屏上网课&#xff0c;感觉在pad上面看&#xff0c;画面太小距离太近&#xff0c;并且已经近视&#xff0c;想着投屏到电视上&#xff0c;稍微改善一下用眼环境。软件投屏用着不爽&#xff0c;国产投屏软件有广告&#xff0c…

故障排查:Java Web程序未通过Acunetix的漏洞检查

博客主页&#xff1a;https://tomcat.blog.csdn.net 博主昵称&#xff1a;农民工老王 主要领域&#xff1a;Java、Linux、K8S 期待大家的关注&#x1f496;点赞&#x1f44d;收藏⭐留言&#x1f4ac; 目录故障详情问题原因注意事项两次失败的尝试relaxedPathChars & relax…

技术博客|第17期:广告程序化交易(一)- 生态系统

在《Hulu/Disney Streaming流媒体广告平台中的核心技术&#xff08;上&#xff09;》广告流程章节中&#xff0c;我们提到了Disney的主要流量是通过每年定期举行的Upfront大会来进行售卖。Upfront会占据我们大部分的流量。除了Upfront售卖的方式以外&#xff0c;剩余的流量在Di…

解析数字员工,为何其已成为企业优势选择

数字化转型浪潮来袭&#xff0c;“数字员工”市场加速升温&#xff0c;各行各业都开始探索数字员工的应用场景。到底什么是数字员工&#xff0c;他们又有哪些优势而备受企业青睐&#xff1f;“抛头露面”与“幕后英雄”数字员工是一种形象化的称呼&#xff0c;所谓“数字员工”…