怎样利用nginx日志提升网站加载速度

用 Nginx 日志定位瓶颈并落地优化，可以显著缩短首包与总耗时，提升网站加载速度。下面给出一套从采集、分析到优化的闭环方案。

一采集关键指标与日志格式

在 http 块定义包含耗时与缓存命中的日志格式，并在 server/location 中按需启用。示例：
```
http {
  log_format main_ext '$remote_addr - $remote_user [$time_local] "$request" '
                    '$status $body_bytes_sent "$http_referer" "$http_user_agent" '
                    '"$http_x_forwarded_for" '
                    'rt=$request_time uct=$upstream_connect_time '
                    'urt=$upstream_response_time cache=$upstream_cache_status';

  access_log /var/log/nginx/access.log main_ext buffer=32k flush=5s;
  error_log  /var/log/nginx/error.log warn;
}
```
关键字段含义与用途：
- $request_time：从接收请求到发送完响应的总耗时，用于发现整体慢请求。
- $upstream_response_time：与上游（后端）交互的耗时，用于判断是否是后端慢。
- $upstream_connect_time：与上游建立连接的耗时，定位网络/连接瓶颈。
- $upstream_cache_status：命中状态（如 HIT/MISS），衡量缓存效果。
- 建议开启 buffer=32k flush=5s 减少同步写日志对性能的影响。以上字段与用法可据此进行定位与优化。

二快速定位慢请求与异常

按总耗时找出 Top N 慢请求（需日志中包含 $request_time）
```
awk '{print $NF" "$7}' /var/log/nginx/access.log | sort -nr | head
```
区分瓶颈在 Nginx 还是上游
- request_time 高、upstream_response_time 低：瓶颈多在 Nginx 处理、网络往返或客户端链路。
- upstream_response_time 高：瓶颈多在后端处理、数据库/外部依赖或上游网络。
发现错误与异常
- 统计状态码分布：awk '{print $9}' access.log | sort | uniq -c | sort -nr
- 实时查看错误：tail -f /var/log/nginx/error.log
可视化与实时监控
- GoAccess：goaccess /var/log/nginx/access.log -o /var/www/html/report.html --log-format=COMBINED
- ngxtop：类似 top 的实时分析。以上方法可快速找出“哪些 URL 慢、慢在哪儿”。

三基于日志洞察的优化动作

当慢在 Nginx 侧（request_time 高、upstream 不高）
- 开启与优化静态资源缓存：
```
location ~* \.(jpg|jpeg|png|gif|ico|css|js)$ {
  expires 1y;
  add_header Cache-Control "public, immutable";
}
```
- 启用压缩与长连接：
```
gzip on;
gzip_types text/plain text/css application/json application/javascript text/xml application/xml+rss text/javascript;
keepalive_timeout 65;
```
- 启用 HTTP/2 或 HTTP/3（QUIC），减少握手与队头阻塞。
- 提升并发处理能力：worker_processes auto; worker_connections 4096;（结合实例规格调优）。
- 减少日志同步写开销：access_log ... buffer=32k flush=5s;。
当慢在上游侧（upstream_response_time 高）
- 开启反向代理缓存：
```
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=STATIC:10m inactive=60m;
proxy_cache_key "$scheme$request_method$host$request_uri";
server {
  location / {
    proxy_cache STATIC;
    proxy_pass http://backend;
    proxy_cache_valid 200 304 10m;
  }
}
```
- 负载均衡与熔断：增加上游实例、设置重试/超时、隔离异常节点。
- 优化上游 SQL/缓存/外部 API 调用，减少阻塞与串行依赖。以上动作与日志指标一一对应，能直接降低 request_time/upstream_response_time。

四监控告警与持续优化闭环

日志轮转，防止过大影响 I/O 与定位效率：

/var/log/nginx/*.log {
  daily
  rotate 7
  compress
  delaycompress
  missingok
  notifempty
  create 0640 nginx adm
  sharedscripts
  postrotate
    [ -f /var/run/nginx.pid ] && kill -USR1 `cat /var/run/nginx.pid`
  endscript
}

指标可视化与告警
- 使用 Prometheus + Grafana 采集并展示响应时间、缓存命中率、5xx 比例等，设置阈值告警。
- 使用 GoAccess/ELK 做访问与性能分析报表。以上保证问题“可观测、可回溯、可预警”。

最新问答

相关标签