温馨提示×

Debian Minimal如何进行性能监控

小樊
41
2026-01-05 11:44:08
栏目: 智能运维

Debian Minimal 性能监控实操指南

一 快速上手 最小化安装后的内置命令

  • 资源总览与负载
    • 查看负载与登录用户:uptime
    • 进程与资源:top(按 P 按 CPU、按 M 按内存)
  • 内存与交换
    • 查看内存使用:free -h
  • 虚拟内存、进程、I/O、CPU 汇总
    • 综合统计:vmstat 1 5(每隔 1 秒刷新,共 5 次)
  • 磁盘空间
    • 文件系统使用:df -h
  • 网络连接与监听
    • 套接字与端口:ss -tulnp(推荐替代 netstat
  • 系统日志
    • 查看全部日志:journalctl
    • 按服务查看:journalctl -u <服务名>
    • 按时间范围:journalctl --since “2025-01-01” --until “2025-01-31”
    • 实时跟踪:journalctl -f
  • 内核与硬件事件
    • 内核环形缓冲:dmesg
      以上命令均为 Debian 最小化安装常见自带或轻量依赖工具,适合快速排障与基线观测。

二 增强工具 按需安装的低开销方案

  • 进程与系统概览
    • htop(交互更友好):sudo apt install htop
    • Glances(终端/Web,跨平台):sudo apt install glances
  • 实时可视化与告警
    • Netdata(即装即用,低开销):wget -O /tmp/netdata-kickstart.sh https://my-netdata.io/kickstart.sh && sh /tmp/netdata-kickstart.sh
  • 企业级与可视化平台
    • Prometheus + Grafana:sudo apt install prometheus grafana
    • Zabbix:sudo apt install zabbix-server-mysql zabbix-frontend-php zabbix-agent
  • 轻量自愈与告警
    • Monit:sudo apt install monit
      以上工具覆盖从轻量终端到平台化监控的不同需求,安装简单、资源占用可控,适合在 Minimal 环境中逐步扩展。

三 专项监控 深入定位瓶颈

  • CPU 与调度
    • 多核使用率:mpstat 1 3
    • 调用图与热点:perf record -g -p $(pgrep <进程名>) && perf report
  • 内存细节
    • 按进程实际物理内存:ps_mem
  • 磁盘 I/O
    • 设备级 I/O:iostat -x 2(需 sysstat:sudo apt install sysstat)
    • 进程级 I/O:pidstat -d 1
    • 占用文件/设备排查:lsof /dev/sda
  • 网络
    • 接口带宽:iftop(sudo apt install iftop)
    • 按进程带宽:nethogs(sudo apt install nethogs)
    • 套接字与连接:ss -tulnp
  • 系统调用与故障复现
    • 跟踪系统调用:strace -p
      以上命令用于定位 CPU、内存、磁盘、网络 等具体瓶颈,建议与基线指标对照分析。

四 日志与硬件健康 追踪异常根因

  • 日志分析
    • 实时查看:tail -f /var/log/syslog
    • 关键字过滤:grep “error” /var/log/syslog
    • 结构化查询:journalctl -u <服务名> --since today
  • 硬件与存储健康
    • 传感器温度/风扇:sudo apt install lm-sensors && sensors
    • 磁盘 S.M.A.R.T. 信息:sudo apt install smartmontools && smartctl -a /dev/sda
    • 设备与固件信息:lspci、lsusb、dmidecode
      通过日志与硬件健康信息,可以快速定位异常来源(驱动、温度、磁盘退化等)。

五 告警与可视化 搭建可持续观测

  • 轻量自愈
    • Monit:配置进程存活与资源阈值,异常时自动重启并邮件告警(sudo apt install monit)
  • 平台化监控
    • Prometheus + Grafana:以 Node Exporter 采集主机指标,Grafana 面板展示与阈值告警
    • Zabbix:通过 Zabbix Agent 主动上报,模板化监控与告警
  • 快速可用性监控
    • Uptime Kuma:自建状态页与心跳监测,适合小规模服务可达性观测
      建议从“轻量自愈”起步,按规模升级到“平台化监控”,形成指标、日志、告警的闭环。

0