定位与总体思路
快速定位步骤
常见瓶颈与优化要点
| 瓶颈维度 | 典型症状 | 快速检查 | 优化要点 |
|---|---|---|---|
| CPU | 响应变慢、top 中某进程长期高 CPU | top/htop 的 %us/%sy | 查热点函数/慢查询;减少频繁采集与计算;合理设置进程/线程数与调度策略 |
| 内存 | OOM、swap 频繁、RES 持续增长 | free -m、vmstat 的 si/so | 降低 vm.swappiness、优化缓存与对象生命周期;避免内存泄漏;必要时扩容内存 |
| 磁盘 I/O | iostat %util≈100%、await 高、系统卡顿 | iostat -x 1、vmstat 1 | 使用 SSD;I/O 调度器:SSD 选 noop,机械盘选 deadline/cfq;挂载选项加 noatime;优化日志与批量写入 |
| 网络 | 吞吐上不去、时延抖动、丢包/重传高 | sar -n DEV、ss -s、netstat -s | 调整 TCP 缓冲区与 TIME_WAIT 处理;优化防火墙/规则集;启用 网卡多队列;必要时升级网卡/链路 |
| 配置与平台 | 连接失败、认证失败、性能下降 | 服务日志、连通性测试 | 核对 IP/端口/协议 与 防火墙;检查 用户名/密码/密钥 与权限;优化采集/查询频率与超时重试 |
| 数据库/后端 | 查询慢、连接池满、锁等待 | DB 慢查询日志、连接数 | 建索引/改写 SQL;调大连接池与超时;读写分离/缓存热点数据;分批处理 |
| 并发与文件句柄 | 新连接失败、Too many open files | ulimit -n、ss -L | 提升进程可打开文件数与内核 fs.file-max;复用连接与长连接;优化线程模型 |
| 安全策略 | 间歇性卡顿或访问异常 | audit/系统日志 | 审慎评估 SELinux/防火墙 策略影响;最小化原则与白名单优先,变更前在测试环境验证 |
| 以上要点为通用优化方向,需结合你的实际负载与依赖逐项验证与迭代。 |
面向 DOPRA 的落地排查清单