工具澄清与定位
“FetchLinux”并非常见的 Linux 发行版或性能监控工具的通用名称,更可能是对某个具体软件/脚本/发行版的误写或昵称。若你指的是某个名为“FetchLinux”的组件,请提供官网链接、包名或版本,以便给出精确用法与优化建议。就通用场景而言,下文汇总了在 Linux 上进行性能监控与问题排查的高频、实用工具与命令清单,可直接用于日常运维与定位瓶颈。
快速排障命令清单
- 资源总览与进程定位
- 实时资源与进程:top/htop(交互式查看 CPU、内存、负载与进程,支持按键筛选与排序)
- 多维度资源汇总:vmstat 1(关注 procs.r/b、memory.swpd/free、swap.si/so、io.bi/bo、system.in/cs、cpu.id/wa)
- 按进程细分资源:pidstat -u/-r/-d 1(分别查看 CPU、内存、I/O)
- 磁盘 I/O 排行:iotop -bod 1(按进程观察读写与 I/O 等待)
- 综合资源视图:dstat -cdlmnpsy(CPU、磁盘、网络、分页、系统等多合一)
- 历史与系统视角
- 历史性能数据:sar -u/-r/-P ALL 1(来自 sysstat,便于回溯 CPU、内存、每核使用)
- 内核与驱动消息:dmesg | tail -n 50
- 服务与单元日志:journalctl -u -e
- 网络与连接
- 端口与连接:ss -tulnp | grep (或 netstat)
- 连通与路由:ping 、traceroute
- 抓包分析:tcpdump -i -nn port 80
- 文件与进程关联
- 打开文件/套接字:lsof | grep <path|port>(定位“设备或文件被占用”“谁在用端口”)
- 深入诊断
- CPU 热点与火焰图:perf top、perf record -a -g sleep 10、perf report
- 系统调用跟踪:strace -T -tt -p (定位慢系统调用与异常返回)
- 网络能力/队列:ethtool -S (查看丢包、重传、队列等)
以上命令覆盖了CPU、内存、磁盘 I/O、网络、进程、内核与驱动等常见瓶颈定位路径,适合“先总览—再细化—后取证”的排障思路。
典型场景与命令组合
- CPU 飙高
- 观察整体与每核:top/htop → 按 1 展开每核;若单核异常,进一步:pidstat -u 1 -p ;定位热点函数:perf top 或 perf record -p -g -a sleep 10 && perf report。
- 内存吃紧或 OOM
- 快速判断:top/htop 看 RES/可用内存;vmstat 1 看 si/so(换入/换出)与 free;pidstat -r 1 查进程 RSS;必要时结合 dmesg | tail 检索 OOM-killer 记录。
- 磁盘 I/O 瓶颈
- 看设备与队列:iostat -x 1(关注 await、svctm、%util);按进程定位:iotop -bod 1;若需历史:sar -d 1;内核层异常可查 dmesg。
- 网络延迟/丢包/连接异常
- 端口与连接:ss -tulnp | grep ;连通与路径:ping/traceroute;抓包取证:tcpdump -i -nn ‘tcp port 80’;网卡与队列:ethtool -S 。
- 服务启动失败或异常退出
- 日志优先:journalctl -u -e;配置与依赖:cat /etc//config、ldd ;必要时前台运行或开启调试模式观察输出。
安装与可视化建议
- 常用工具安装(按需)
- Debian/Ubuntu:sudo apt-get install sysstat htop iotop dstat nmon ethtool tcpdump lsof strace perf
- RHEL/CentOS:sudo yum install sysstat htop iotop dstat nmon ethtool tcpdump lsof strace perf
- 可视化与长期观测
- 终端综合视图:nmon(在线模式/捕捉模式)、atop(带历史日志与资源高亮)
- 系统级统一观测:sysdig(进程/文件/网络统一视角,支持强大的过滤与回放)
- 轻量仪表盘:saidar(快速总览负载、CPU、内存、磁盘、网络)
上述工具便于搭建“实时终端 + 历史回放 + 可视化”的多层监控体系,兼顾快速定位与长期趋势分析。