Linux编程中的性能优化方法和工具

news2024/12/26 7:41:12

0、序

在面试过程中,经常会被提及的一个问题就是,性能优化的方法和工具。对于这个问题,笔者一开始的理解是比较狭隘的,以为只有perf之类的性能分析工具才是答案,然而这类工具使用的确不多,因此每每回答这种问题,都会老实巴交的说不太了解。

直到现在才醒悟过来,编码中的一些看似顺其自然的选择其实就是性能优化的一种方法,比如数据结构的合理选择,比如内联函数的使用...

现学习总结如下。

1、方法

1) 选择合适的算法和数据结构

  • 算法复杂度分析:在解决问题之前,对不同的算法进行时间复杂度和空间复杂度分析,选择复杂度最低的算法。如在排序时,对于大规模数据,快速排序通常比冒泡排序效率高得多。

  • 数据结构优化:根据实际应用场景选择合适的数据结构。例如,在频繁进行插入和删除操作的场景中,使用链表可能比数组更高效;而在需要快速随机访问元素的情况下,数组则更合适。

2) 优化代码实现

  • 减少不必要的计算:避免在循环中进行重复的计算,可将循环不变式的计算提到循环外面。

  • 优化循环结构:尽量减少循环的嵌套层数,因为多层嵌套循环会使时间复杂度呈指数增长。同时,在循环中要避免使用复杂的函数调用,可将函数调用的结果保存起来,避免多次调用。

  • 合理使用内联函数:对于短小且频繁调用的函数,可使用内联函数,以减少函数调用的开销。但内联函数不宜过长,否则会导致代码膨胀。

3) 内存管理优化

  • 减少内存分配和释放次数:频繁的内存分配和释放会导致内存碎片和性能下降。可以通过一次性分配较大的内存块,然后在需要时重复使用,或者使用内存池技术来管理内存。

  • 优化内存访问模式:在访问多维数组时,按照内存连续的方式进行访问,可以提高缓存命中率,从而提高性能。例如,对于二维数组 int a[100][100],按 a[i][j] 的顺序访问比按 a[j][i] 的顺序访问更高效,因为前者在内存中是连续存储的。

4) 多线程和并行编程

  • 合理划分任务:将任务划分为多个子任务,分配到不同的线程或进程中并行执行,以充分利用多核处理器的性能。但要注意避免线程之间的竞争和同步问题,可使用互斥锁、信号量等同步机制来保证数据的一致性。

  • 使用线程池:避免频繁地创建和销毁线程,可使用线程池来管理线程。线程池在初始化时创建一定数量的线程,当有任务到来时,从线程池中获取空闲线程来执行任务,任务执行完毕后线程并不销毁,而是回到线程池中等待下一次任务。

2、工具

1) 编译器优化选项

  • -O 系列选项:GCC 编译器提供了不同级别的优化选项,如 -O1-O2-O3 等。-O1 会进行一些基本的优化,如减少代码大小、优化循环等;-O2 会在 -O1 的基础上进行更多的优化,包括函数内联、指令重排等;-O3 则会进行更激进的优化,如循环展开、公共子表达式消除等,但可能会增加编译时间和代码大小。

  • -finline-functions:该选项会将所有简单的函数进行内联,而不仅仅是在函数声明前添加 inline 关键字的函数,可进一步减少函数调用的开销。

2) 性能分析工具(系统级)

  • perf: Linux 内核自带的性能分析工具,功能强大。它可以用于分析 CPU 性能、内存访问、进程调度等方面的问题。例如,perf stat <可执行程序>:可以统计程序运行过程中的各种性能指标,如 CPU 时钟周期、指令数、缓存命中率等。perf record <可执行程序>:记录程序运行时的性能事件,运行结束后会生成一个数据文件,再通过 perf report 命令对该文件进行分析,生成详细的分析报告,展示各个函数的性能开销占比等。

  • top:实时显示系统中各个进程的资源占用情况,包括 CPU 使用率、内存使用率、进程状态等,可快速定位系统中占用资源较多的进程。在命令行中输入 top 后,会列出当前系统中所有进程的相关信息,按 Shift+P 可按照 CPU 使用率进行排序,按 Shift+M 可按照内存使用率排序,方便查看资源消耗大户。

  • vmstat:报告关于进程、内存、I/O 和 CPU 活动的系统级统计信息,常用于监控系统的整体性能状态和资源使用趋势。在命令行输入 vmstat <时间间隔> <次数>,如 vmstat 5 10,表示每隔 5 秒输出一次系统性能统计信息,共输出 10 次,通过这些数据可以观察到系统在一段时间内的性能变化情况。

3) 性能分析工具(应用级)

  • gprof:是 GNU 提供的性能分析工具,通过在编译时添加 -pg 选项,在程序运行结束后,会生成一个性能分析报告,显示每个函数的调用次数、执行时间等信息,帮助开发者找到程序中的性能瓶颈。

  • Callgrind:是 Valgrind 工具集的一部分,用于收集程序的调用图和函数的执行时间等信息,能够更详细地分析函数之间的调用关系和性能开销。使用 valgrind --tool=callgrind <可执行程序> 命令运行程序,运行结束后会生成一个名为 callgrind.out.<pid> 的文件,其中 <pid> 是程序的进程 ID。然后可以使用 kcachegrind 或 qcachegrind 等图形化工具来查看分析结果,直观地展示函数调用图和性能数据。

  • Intel VTune Amplifier:一款功能强大的性能分析工具,支持对 C/C++ 程序进行全面的性能分析,包括热点分析、线程分析、内存分析等,并且提供了图形化的界面,方便用户查看和分析结果。安装并打开Intel VTune Amplifier 后,创建一个新的项目,选择要分析的可执行程序,然后设置分析类型和相关参数,点击运行即可开始分析。分析结束后,在图形化界面中可以查看详细的性能数据和分析报告,如函数的执行时间、调用次数、CPU 利用率等。

4) 内存检测工具

  • valgrind:是一款用于内存调试、内存泄漏检测和性能分析的工具。它可以检测出程序中存在的内存泄漏、越界访问、非法内存访问等问题。使用 valgrind --tool=memcheck 命令可以对程序进行内存检查,它会详细地报告出程序中存在的内存问题以及问题所在的位置。

  • AddressSanitizer:是一种快速的内存错误检测工具,集成在 GCC 和 Clang 编译器中。通过在编译时添加 -fsanitize=address 选项,它可以在程序运行时检测出内存越界、使用未初始化的内存等问题,并给出详细的错误信息和调用栈。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2265727.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Fiddler v5.0.2最新专业网络抓包工具简体中文版

前言 Fiddler抓包工具一个非常专业且已经翻译成中文的网络调试帮手。它就像一个超级监视器&#xff0c;能帮你看到电脑和互联网之间所有通过HTTP协议传输的信息。比如&#xff0c;当你在网上冲浪时&#xff0c;它可以记录下你和网站之间交换的所有“小纸条”&#xff0c;比如网…

我的 2024 年终总结

2024 年&#xff0c;我离开了待了两年的互联网公司&#xff0c;来到了一家聚焦教育机器人和激光切割机的公司&#xff0c;没错&#xff0c;是一家硬件公司&#xff0c;从未接触过的领域&#xff0c;但这还不是我今年最重要的里程碑事件 5 月份的时候&#xff0c;正式提出了离职…

汽车网络安全渗透测试

产品和企业IT的融合引发了新的网络安全风险&#xff0c;从功能安全到数据隐私都面临潜在威胁。汽车行业正在使用各种方法进行安全检测和验证&#xff0c;但传统的安全测试中漏洞检测低效且不完整。Vector带来一种使用更少测试案例的增强型灰盒渗透测试&#xff0c;能够在提高覆…

C#WPF基础介绍/第一个WPF程序

什么是WPF WPF&#xff08;Windows Presentation Foundation&#xff09;是微软公司推出的一种用于创建窗口应用程序的界面框架。它是.NET Framework的一部分&#xff0c;提供了一套先进的用户界面设计工具和功能&#xff0c;可以实现丰富的图形、动画和多媒体效果。 WPF 使用…

【EtherCATBasics】- KRTS C++示例精讲(2)

EtherCATBasics示例讲解 目录 EtherCATBasics示例讲解结构说明代码讲解 项目打开请查看【BaseFunction精讲】。 结构说明 EtherCATBasics&#xff1a;应用层程序&#xff0c;主要用于人机交互、数据显示、内核层数据交互等&#xff1b; EtherCATBasics.h &#xff1a; 数据定义…

秒验简介与下载说明

秒验简介与下载说明 产品概述 秒验是一款帮助开发者实现一键验证功能的产品&#xff0c;从根源上降低企业验证成本&#xff0c; 有效提高拉新转化率&#xff0c;降低因验证带来的流失率&#xff0c;3秒完成手机号验证 SDK信息 下载SDK 下载地址 SDK提供Maven和pod引入两种方…

算法学习(17)—— FloodFill算法

目录 关于FloodFill算法 部分OJ题详解 733. 图像渲染 200. 岛屿数量 695. 岛屿的最大面积 130. 被围绕的区域 417. 太平洋大西洋水流问题 529. 扫雷问题 LCR130. 衣橱整理 关于FloodFill算法 爆搜&#xff0c;深搜&#xff0c;回溯的算法原理并不难&#xff0c;这类题…

美国辅料查询之FDA批准药用辅料数据库(IID数据库)

药用辅料的性质很大程度上决定了制剂的性质&#xff0c;每一种新的药用辅料的问世&#xff0c;都会为制剂技术的发展带来新的机遇&#xff0c;每一种药用辅料都可能让制剂研发员开发出新剂型药物&#xff0c;所以在药物制剂研发过程中&#xff0c;药用辅料的信息调研是不可或缺…

SpringAI人工智能开发框架006---SpringAI多模态接口_编程测试springai多模态接口支持

可以看到springai对多模态的支持. 同样去创建一个项目 也是跟之前的项目一样,修改版本1.0.0 这里 然后修改仓库地址,为springai的地址 然后开始写代码

【ELK】filebeat采集数据输出到kafka指定topic

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 背景filebeat主体配置filebeat.inputs部分filebeat.output部分 filebeat完整配置 背景 今天收到需求&#xff0c;生产环境中通需要优化filebeat的输出&#xff0c;…

知识图谱+大模型:打造全新智慧城市底层架构

在数字化时代&#xff0c;智慧城市的建设正迎来新一轮的变革。本文将探讨如何结合知识图谱和大模型技术&#xff0c;构建智慧城市的全新底层架构&#xff0c;以应对日益增长的数据量和复杂性&#xff0c;提升城市管理的智能化水平。 知识图谱&#xff1a;智慧城市的知识库 知识…

网络安全 | 云计算中的数据加密与访问控制

网络安全 | 云计算中的数据加密与访问控制 一、前言二、云计算概述2.1 云计算的定义与特点2.2 云计算的服务模式2.3 云计算的数据安全挑战 三、数据加密技术在云计算中的应用3.1 对称加密算法3.2 非对称加密算法3.3 混合加密算法 四、云计算中的访问控制模型4.1 基于角色的访问…

计算机毕业设计Python+卷积神经网络租房推荐系统 租房大屏可视化 租房爬虫 hadoop spark 58同城租房爬虫 房源推荐系统

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…

攻防世界 - Web - Level 1 unseping

关注这个靶场的其它相关笔记&#xff1a;攻防世界&#xff08;XCTF&#xff09; —— 靶场笔记合集-CSDN博客 0x01&#xff1a;Write UP 本关是一个 PHP 代码审计关卡&#xff0c;考察的是 PHP 反序列化漏洞以及命令执行的一些绕过手段&#xff0c;下面笔者将带你一步步过关。…

黑马程序员JavaWeb开发教程(前端部分) ---笔记分享

总结 此篇文章记录的内容是不全的&#xff0c;我觉得基础的部分没有记录&#xff0c;我想主要学的是此课程的后端部分&#xff0c;前端部分学校有学习过&#xff0c;我就开倍速一带而过啦&#xff0c;还有就是学校学的是Vue3和此视频讲的Vue2还是有一定区别的。希望能对大家有…

【统计的思想】统计抽样测试(二)

在统计抽样测试里&#xff0c;一旦我们选定了某个测试方案(n|Ac)&#xff0c;我们就可以算出任意不合格品率p对应的接收概率L(p)。把各种可能的p值对应的L(p)连成一条曲线&#xff0c;这就是测试方案(n|Ac)的操作特性曲线。比如&#xff0c;方案(80|1)的操作特性曲线长这个样子…

Pytorch | 利用I-FGSSM针对CIFAR10上的ResNet分类器进行对抗攻击

Pytorch | 利用I-FGSSM针对CIFAR10上的ResNet分类器进行对抗攻击 CIFAR数据集I-FGSSM介绍I-FGSSM代码实现I-FGSSM算法实现攻击效果 代码汇总ifgssm.pytrain.pyadvtest.py 之前已经针对CIFAR10训练了多种分类器&#xff1a; Pytorch | 从零构建AlexNet对CIFAR10进行分类 Pytorch…

【多维DP】力扣576. 出界的路径数

给你一个大小为 m x n 的网格和一个球。球的起始坐标为 [startRow, startColumn] 。你可以将球移到在四个方向上相邻的单元格内&#xff08;可以穿过网格边界到达网格之外&#xff09;。你 最多 可以移动 maxMove 次球。 给你五个整数 m、n、maxMove、startRow 以及 startColu…

react防止页面崩溃

在 React 中&#xff0c;ErrorBoundary 组件是一种用于捕获并处理其子组件树中发生的 JavaScript 错误的机制。它可以帮助你在应用程序中实现优雅的错误处理&#xff0c;防止整个应用崩溃&#xff0c;并为用户提供友好的错误提示。ErrorBoundary 通过使用 React 的生命周期方法…

Python使用requests_html库爬取掌阅书籍(附完整源码及使用说明)

教程概述 本教程先是幽络源初步教学分析掌阅书籍的网络结构&#xff0c;最后提供完整的爬取源码与使用说明&#xff0c;并展示结果&#xff0c;切记勿将本教程内容肆意非法使用。 原文链接&#xff1a;Python使用requests_html库爬取掌阅书籍&#xff08;附完整源码及使用说明…