Debian Minimal如何进行性能监控

Debian Minimal 性能监控实操指南

一快速上手最小化安装后的内置命令

资源总览与负载
- 查看负载与登录用户：uptime
- 进程与资源：top（按 P 按 CPU、按 M 按内存）
内存与交换
- 查看内存使用：free -h
虚拟内存、进程、I/O、CPU 汇总
- 综合统计：vmstat 1 5（每隔 1 秒刷新，共 5 次）
磁盘空间
- 文件系统使用：df -h
网络连接与监听
- 套接字与端口：ss -tulnp（推荐替代 netstat）
系统日志
- 查看全部日志：journalctl
- 按服务查看：journalctl -u <服务名>
- 按时间范围：journalctl --since “2025-01-01” --until “2025-01-31”
- 实时跟踪：journalctl -f
内核与硬件事件
- 内核环形缓冲：dmesg
  以上命令均为 Debian 最小化安装常见自带或轻量依赖工具，适合快速排障与基线观测。

二增强工具按需安装的低开销方案

进程与系统概览
- htop（交互更友好）：sudo apt install htop
- Glances（终端/Web，跨平台）：sudo apt install glances
实时可视化与告警
- Netdata（即装即用，低开销）：wget -O /tmp/netdata-kickstart.sh https://my-netdata.io/kickstart.sh && sh /tmp/netdata-kickstart.sh
企业级与可视化平台
- Prometheus + Grafana：sudo apt install prometheus grafana
- Zabbix：sudo apt install zabbix-server-mysql zabbix-frontend-php zabbix-agent
轻量自愈与告警
- Monit：sudo apt install monit
  以上工具覆盖从轻量终端到平台化监控的不同需求，安装简单、资源占用可控，适合在 Minimal 环境中逐步扩展。

三专项监控深入定位瓶颈

CPU 与调度
- 多核使用率：mpstat 1 3
- 调用图与热点：perf record -g -p $(pgrep <进程名>) && perf report
内存细节
- 按进程实际物理内存：ps_mem
磁盘 I/O
- 设备级 I/O：iostat -x 2（需 sysstat：sudo apt install sysstat）
- 进程级 I/O：pidstat -d 1
- 占用文件/设备排查：lsof /dev/sda
网络
- 接口带宽：iftop（sudo apt install iftop）
- 按进程带宽：nethogs（sudo apt install nethogs）
- 套接字与连接：ss -tulnp
系统调用与故障复现
- 跟踪系统调用：strace -p
  以上命令用于定位 CPU、内存、磁盘、网络 等具体瓶颈，建议与基线指标对照分析。

四日志与硬件健康追踪异常根因

日志分析
- 实时查看：tail -f /var/log/syslog
- 关键字过滤：grep “error” /var/log/syslog
- 结构化查询：journalctl -u <服务名> --since today
硬件与存储健康
- 传感器温度/风扇：sudo apt install lm-sensors && sensors
- 磁盘 S.M.A.R.T. 信息：sudo apt install smartmontools && smartctl -a /dev/sda
- 设备与固件信息：lspci、lsusb、dmidecode
  通过日志与硬件健康信息，可以快速定位异常来源（驱动、温度、磁盘退化等）。

五告警与可视化搭建可持续观测

轻量自愈
- Monit：配置进程存活与资源阈值，异常时自动重启并邮件告警（sudo apt install monit）
平台化监控
- Prometheus + Grafana：以 Node Exporter 采集主机指标，Grafana 面板展示与阈值告警
- Zabbix：通过 Zabbix Agent 主动上报，模板化监控与告警
快速可用性监控
- Uptime Kuma：自建状态页与心跳监测，适合小规模服务可达性观测
  建议从“轻量自愈”起步，按规模升级到“平台化监控”，形成指标、日志、告警的闭环。

最新问答