1. 使用perf工具(推荐)
perf是Linux内核自带的轻量级性能分析工具,支持CPU热点分析、函数调用栈追踪、硬件性能计数器(如缓存命中率、分支预测)等功能,适合快速定位C++程序的性能瓶颈。
sudo apt-get update
sudo apt-get install linux-tools-common linux-tools-$(uname -r) linux-perf-$(uname -r)
-g选项以包含调试信息(便于perf关联源代码),例如:g++ -std=c++11 -g -o my_program my_program.cpp
perf record命令捕获程序运行时的性能事件,-g选项开启调用栈追踪:sudo perf record -g -- ./my_program
perf report命令生成交互式报告,显示热点函数(按耗时排序)及调用关系,可通过方向键导航查看详情:sudo perf report
git clone https://github.com/brendangregg/FlameGraph.gitperf record -F 99 -g -- sleep 10 ./my_program && perf script > perf.outcd FlameGraph && perl stackcollapse-perf.pl ../perf.out | grep -v '#' | perl flamegraph.pl > perf-flamegraph.svg.svg文件即可查看。2. 使用gprof工具(传统方法)
gprof是GNU Compiler Collection(GCC)自带的性能分析工具,适合分析函数级别的调用次数、耗时及调用关系,但对多线程程序支持有限。
-pg选项,生成的可执行文件会嵌入性能分析代码:g++ -pg -o my_program my_program.cpp
gmon.out文件(包含性能数据):./my_program
gprof命令解析gmon.out,生成文本报告(包含函数耗时占比、调用次数):gprof my_program gmon.out > analysis.txt
3. 使用Valgrind Callgrind工具(详细调用分析)
Valgrind的Callgrind工具通过模拟程序执行,提供详尽的函数调用成本分析(包括CPU时间、调用次数),还能检测内存访问问题(如非法读写)。
sudo apt-get install valgrind
--tool=callgrind选项运行程序,生成callgrind.out.<PID>文件(包含调用图数据):valgrind --tool=callgrind ./my_program
sudo apt install kcachegrind安装)打开callgrind.out文件,生成函数调用树、耗时占比等可视化报告,支持交互式导航。4. 使用OProfile工具(基于事件的采样)
OProfile是Linux下的低开销性能分析工具,支持基于硬件性能计数器的采样(如指令缓存未命中、分支预测失败),适合长时间运行的程序。
sudo apt-get install oprofile
opcontrol命令开始采集性能数据(默认采集所有CPU事件):sudo opcontrol --start
opreport命令生成报告(显示热点函数):sudo opcontrol --stop
sudo opreport -f
5. 实时监控工具(top/htop)
top和htop是Ubuntu自带的实时系统监控工具,可快速查看C++程序的CPU、内存占用情况,适合初步定位高负载进程。
top,按P键按CPU使用率排序,按M键按内存使用率排序;若需查看特定进程的线程信息,可使用top -p <PID> -H(<PID>为进程ID)。sudo apt install htop安装,界面更友好,支持鼠标操作和颜色高亮,功能与top类似。