Linux下LNMP性能监控实操指南
一 监控体系与分层
二 快速上手命令清单
三 关键指标与阈值建议
| 层级 | 关键指标 | 常用命令/来源 | 告警阈值建议 |
|---|---|---|---|
| 系统 | CPU使用率、负载(1/5/15)、iowait | top/vmstat 1、iostat -x 1 | 负载持续>CPU核数;iowait>20% |
| 系统 | 内存使用率、Swap使用 | free -m | 可用内存低且Swap增长 |
| 系统 | 磁盘空间、Inode | df -h、df -i | 可用空间<**20%**或Inode<10% |
| 系统 | TCP连接数/状态 | ss -s、ss -tulpen | TIME_WAIT>1万或连接数接近ulimit -n |
| Nginx | Active/Waiting、每秒请求、5xx比例 | stub_status、access.log | 5xx>**1%**或Waiting持续很高 |
| MySQL | Threads_connected、Threads_running、Slow_queries | SHOW STATUS、慢查询日志 | Threads_running>CPU核数;慢查询突增 |
| PHP-FPM | active/idle、queue、slow requests | pm.status_path | queue>0持续;慢请求增多 |
四 可视化与告警落地
五 实战排障流程