Debian 性能监控工具推荐
说明
“Debian Context”应为“Debian 系统”。以下按命令行即时监控、历史与可视化、日志关联分析三类给出常用工具与关键用法,覆盖从快速排障到长期可观测的多数场景。
命令行即时监控
- 进程与系统概览:htop(交互式进程查看器,支持按键筛选与树形视图)、top(经典实时任务管理器)。安装:sudo apt install htop。
- 资源与 I/O:vmstat 1(虚拟内存、进程、CPU、I/O 汇总)、iostat -xz 1(磁盘 I/O 扩展统计)、free -h(内存使用,易读单位)、df -h(磁盘空间)、uptime(运行时间与平均负载)。
- 网络与连接:netstat -tulnp(查看监听端口与对应进程)。
- 进程级细粒度:pidstat -u -p (来自 sysstat,查看指定进程的 CPU/内存/IO 等)。
- 全能采样与回看:sar(来自 sysstat,配合系统定时采集可做历史回放与趋势分析)。
- 其他实用工具:dstat(多资源合并视图)、nmon(交互式多指标监控)、Glances(终端/Web 多平台监控)。
历史与可视化及告警
- 轻量实时可视化:Netdata(开箱即用的 Web 界面,低开销,适合单机与小规模环境)。
- 企业级与可扩展:Zabbix(模板丰富、告警完善)、Nagios(插件生态成熟)、Prometheus + Grafana(时序数据 + 灵活可视化,适合云原生与多主机)。
- 轻量进程/服务守护:Monit(进程存活、资源阈值与自动重启)。
- 采集与存储:sysstat(提供 sar/iostat/mpstat/pidstat 等,用于历史与趋势分析)。
日志关联分析
- 系统日志:journalctl(按服务、时间范围与优先级过滤,如:journalctl -u nginx.service --since “2025-12-26 00:00:00”)。
- 文本日志检索:grep “error” /var/log/syslog、tail -f /var/log/syslog、less /var/log/syslog。
- 集中式日志平台:ELK Stack(Elasticsearch + Logstash + Kibana)、Graylog(便于海量日志的检索、可视化与告警)。
快速上手与选型建议
- 快速排障组合:htop → vmstat 1 → iostat -xz 1 → netstat -tulnp → journalctl -u <服务>(覆盖 CPU/内存/磁盘/网络/服务日志)。
- 持续采集与回看:启用 sysstat(编辑 /etc/default/sysstat 将 ENABLED=“false” 改为 “true”,执行 sudo systemctl enable --now sysstat),随后用 sar 查看历史趋势。
- 定时采集到日志:使用 cron 或 systemd Timer 定期执行命令并落盘,例如:
- cron:
* * * * * top -b -n 1 >> /var/log/top.log
- systemd:创建 .service + .timer 单元,以定时器驱动采集任务。
- 选型建议:
- 个人/单机:htop / Glances / Netdata
- 小团队:Prometheus + Grafana 或 Zabbix
- 轻量守护:Monit
- 大规模与合规审计:Zabbix / Nagios / ELK / Graylog。