Linux CPUInfo在故障排查中的作用
一、快速判定硬件与配置是否匹配预期
二、定位性能瓶颈与异常负载的“第一现场”
三、辅助硬件故障与稳定性问题的排查
四、高频场景与命令清单(可直接套用)
| 场景 | 关键命令 | 判读要点 |
|---|---|---|
| 规格核对(物理/核心/线程) | lscpu;cat /proc/cpuinfo | 核对Socket(s)、Core(s) per socket、Thread(s) per core、CPU(s);用“processor/physical id/core id/cpu cores/siblings”核算是否开启超线程与拓扑是否符合预期 |
| 性能瓶颈定位 | top/htop;pidstat -u 1 | 关注**%us/%sy/%wa**;高**%wa→I/O瓶颈,高%sy**→内核/驱动/系统调用;pidstat定位具体进程 |
| 硬件错误与温度 | dmesg/journalctl -k | grep MCE/hardware/error;sensors 看Core温度(>85℃预警,>90℃紧急) |
| 虚拟机/容器规格验证 | lscpu;nproc | 确认vCPU数量、拓扑与宿主机分配一致;nproc快速看可用处理器数 |
| 特性与微码相关 | cat /proc/cpuinfo(flags) | 检查lm(64位)、vmx/svm(虚拟化)、sse/avx等特性;微码/BIOS升级后重启再核对 |