Debian环境下如何进行性能监控
小樊
45
2025-12-06 21:56:51
Debian性能监控实用指南
一 基础命令快速排障
- 资源总览与进程
- 使用 top/htop 查看整体负载与进程占用;在 top 中可按 Shift + M 按内存排序、按 Shift + P 按 CPU 排序。
- 安装 htop:sudo apt install htop;运行:htop。
- 内存与磁盘空间
- 内存:free -h(人类可读);磁盘:df -h。
- 综合与 I/O
- 系统概况:vmstat 1 5(每隔 1 秒采样,共 5 次)。
- 磁盘 I/O:iostat -xz 1(需安装 sysstat:sudo apt install sysstat)。
- 网络
- 连接与监听:ss -tulnp(推荐替代 netstat)。
- 运行时间与负载:uptime。
二 持续采集与历史分析
- 启用 sysstat 的历史采集
- 安装并启用:sudo apt install sysstat;编辑 /etc/default/sysstat,将 ENABLED=“false” 改为 ENABLED=“true”;重启服务:sudo systemctl restart sysstat;默认数据位于 /var/log/sysstat/。
- 常用历史与进程级分析
- CPU/内存/IO 历史:sar -u/-r/-b 1 10(每隔 1 秒,取 10 次)。
- 进程统计:pidstat -u -p (需 sysstat)。
- 一体化监控视图
- dstat:多资源汇总实时监控;安装:sudo apt install dstat;运行:dstat -c -m -d -n。
- 长期趋势与对比
- sar 可跨日对比负载、IO、内存等趋势,用于容量规划与异常回溯。
三 日志与内核消息联动定位
- 服务与内核日志
- 服务日志:journalctl -u <服务名>;时间范围:journalctl --since “2025-12-01” --until “2025-12-06”;实时跟踪:journalctl -f -u <服务名>。
- 快速检索错误:grep -i “error” /var/log/syslog。
- 硬件与底层事件
- 内核环缓冲:dmesg -T | tail -n 50(按时间显示最近 50 行)。
- 关联分析思路
- 当出现 CPU/IO 尖峰或负载升高时,联动查看对应时间窗的 journalctl 与 dmesg,定位触发进程与内核报错。
四 图形化与平台化监控
- 本机可视化
- Glances(Web/终端一体):sudo apt install glances;运行:glances -w(默认端口 61208)。
- nmon:sudo apt install nmon(交互式查看 CPU、内存、磁盘、网络)。
- 企业级与可视化平台
- Prometheus + Grafana:sudo apt install prometheus grafana;Prometheus 负责抓取与存储时间序列,Grafana 负责面板展示与告警。
- Zabbix / Nagios / Icinga:集中监控主机、服务与网络,适合多节点与告警策略管理。
五 硬件健康与存储状态
- 传感器与温度
- lm-sensors:sudo apt install lm-sensors;检测:sensors。
- 磁盘健康
- smartctl:sudo apt install smartmontools;查看健康:sudo smartctl -a /dev/sda。
- 硬件与设备信息
- lspci / lsusb / dmidecode 辅助确认设备型号、固件版本与总线信息,便于与监控指标交叉验证。