Debian 分卷性能监控实操指南
一 监控目标与总体思路
二 快速点检命令
df -hTdf -isudo apt install sysstatiostat -xz 1(关注 %util、await、r/s、w/s、rkB/s、wkB/s、avgqu-sz)sudo apt install iotopsudo iotop -ohtop、vmstat 1 5、free -hdmesg -T | tail -n 50、journalctl -k -b三 面向分卷的关键指标与阈值参考
| 指标 | 含义 | 常用命令/来源 | 关注点与经验阈值 |
|---|---|---|---|
| 空间使用率 | 分卷剩余空间 | df -h |
超过 80% 需关注,90% 为高优先级处理 |
| Inode 使用率 | 索引节点是否耗尽 | df -i |
接近 100% 会导致无法创建新文件 |
| 吞吐与 IOPS | 读写带宽与次数 | iostat -xz 1 |
结合业务基线;持续高吞吐且 %util≈100% 多为瓶颈 |
| 响应时延 | 平均 I/O 等待 | iostat -xz 1 |
await 明显升高常见于队列拥堵或后端慢盘 |
| 队列长度 | 平均请求排队数 | iostat -xz 1 |
avgqu-sz 持续偏高说明后端处理不及 |
| 服务时延 | 应用访问是否受影响 | 业务日志、curl/ab | I/O 高时应用 RT 上升、超时增多 |
| 错误与重映射 | 硬件/文件系统异常 | dmesg、/var/log/syslog |
出现 I/O error、recover、remount-ro 等需立即处理 |
四 长期监控与告警方案
wget -O /tmp/netdata-kickstart.sh https://my-netdata.io/kickstart.sh && sh /tmp/netdata-kickstart.sh(开箱即用的 Web 界面,适合临时与中小规模环境)。五 分卷专项排查与压测
sudo du -xh --max-depth=1 /mountpoint | sort -hr | headsudo iotop -o 找出高 I/O 进程;结合 lsof | grep <mountpoint> 查看打开文件。dmesg -T | grep -i "error\|I/O\|reset\|recover" 检查设备/驱动报错。journalctl -k -b | grep -i "remount-ro\|filesystem"。dd if=/dev/zero of=/mountpoint/testfile bs=1G count=1 oflag=directdd if=/mountpoint/testfile of=/dev/null bs=1G count=1 iflag=directsudo apt install fio 后执行
fio --name=randrw --filename=/mountpoint/testfile --size=1G --time_based --runtime=60 --rw=randrw --bs=4k --ioengine=libaio --direct=1iostat -xz 1,验证是否达到预期吞吐/时延,并观察应用指标是否同步变化。