温馨提示×

Debian环境下如何进行性能监控

小樊
45
2025-12-06 21:56:51
栏目: 智能运维

Debian性能监控实用指南

一 基础命令快速排障

  • 资源总览与进程
    • 使用 top/htop 查看整体负载与进程占用;在 top 中可按 Shift + M 按内存排序、按 Shift + P 按 CPU 排序。
    • 安装 htop:sudo apt install htop;运行:htop
  • 内存与磁盘空间
    • 内存:free -h(人类可读);磁盘:df -h
  • 综合与 I/O
    • 系统概况:vmstat 1 5(每隔 1 秒采样,共 5 次)。
    • 磁盘 I/O:iostat -xz 1(需安装 sysstatsudo apt install sysstat)。
  • 网络
    • 连接与监听:ss -tulnp(推荐替代 netstat)。
  • 运行时间与负载:uptime

二 持续采集与历史分析

  • 启用 sysstat 的历史采集
    • 安装并启用:sudo apt install sysstat;编辑 /etc/default/sysstat,将 ENABLED=“false” 改为 ENABLED=“true”;重启服务:sudo systemctl restart sysstat;默认数据位于 /var/log/sysstat/
  • 常用历史与进程级分析
    • CPU/内存/IO 历史:sar -u/-r/-b 1 10(每隔 1 秒,取 10 次)。
    • 进程统计:pidstat -u -p (需 sysstat)。
  • 一体化监控视图
    • dstat:多资源汇总实时监控;安装:sudo apt install dstat;运行:dstat -c -m -d -n
  • 长期趋势与对比
    • sar 可跨日对比负载、IO、内存等趋势,用于容量规划与异常回溯。

三 日志与内核消息联动定位

  • 服务与内核日志
    • 服务日志:journalctl -u <服务名>;时间范围:journalctl --since “2025-12-01” --until “2025-12-06”;实时跟踪:journalctl -f -u <服务名>
    • 快速检索错误:grep -i “error” /var/log/syslog
  • 硬件与底层事件
    • 内核环缓冲:dmesg -T | tail -n 50(按时间显示最近 50 行)。
  • 关联分析思路
    • 当出现 CPU/IO 尖峰或负载升高时,联动查看对应时间窗的 journalctldmesg,定位触发进程与内核报错。

四 图形化与平台化监控

  • 本机可视化
    • Glances(Web/终端一体):sudo apt install glances;运行:glances -w(默认端口 61208)。
    • nmonsudo apt install nmon(交互式查看 CPU、内存、磁盘、网络)。
  • 企业级与可视化平台
    • Prometheus + Grafanasudo apt install prometheus grafana;Prometheus 负责抓取与存储时间序列,Grafana 负责面板展示与告警。
    • Zabbix / Nagios / Icinga:集中监控主机、服务与网络,适合多节点与告警策略管理。

五 硬件健康与存储状态

  • 传感器与温度
    • lm-sensorssudo apt install lm-sensors;检测:sensors
  • 磁盘健康
    • smartctlsudo apt install smartmontools;查看健康:sudo smartctl -a /dev/sda
  • 硬件与设备信息
    • lspci / lsusb / dmidecode 辅助确认设备型号、固件版本与总线信息,便于与监控指标交叉验证。

0