怎样保障Linux Tomcat的高可用性

Linux Tomcat高可用落地方案

一架构总览

前端入口使用Nginx/HAProxy做7层负载均衡，对外暴露VIP或域名，将请求分发到后端多个Tomcat实例。
多实例部署时，给每个实例设置唯一jvmRoute，并在应用开启****，保证故障切换时会话不丢失。
会话共享优先采用Tomcat内置集群复制（DeltaManager/ReplicationValve）；对跨机房、大规模或复杂状态场景，建议改为Redis/Memcached集中会话。
入口层再叠加Keepalived VIP或云厂商NLB，实现负载均衡器自身的高可用。
数据与配置侧使用数据库主从/流复制或共享存储，避免单点。
全链路监控与日志（如Prometheus/Grafana与ELK）用于告警、容量与故障定位。

二关键配置步骤

负载均衡器 Nginx 示例
- 安装：sudo yum install nginx
- 配置片段：
  - upstream tomcat_cluster { server 192.168.1.11:8080; server 192.168.1.12:8080; server 192.168.1.13:8080; }
  - server { listen 80; location / { proxy_pass http://tomcat_cluster; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; } }
- 健康检查与重试：在 upstream 中为节点增加 max_fails/fail_timeout，并配置 proxy_next_upstream/retry，减少失败请求暴露。
Tomcat 内置集群与会话复制
- server.xml：在 Engine 上添加 jvmRoute（如 node1/node2），并在 Engine/Host 内加入
  - - - … - -
- 应用 web.xml 中加入。
会话外部化（可选，推荐跨机房/大规模）
- 使用 Redis Session Manager 或 Memcached Session Manager，将 session 存储到集中缓存，天然支持横向扩展与跨节点共享。
入口高可用 Keepalived
- 两台负载均衡器部署 Keepalived，配置VRRP与VIP（如 192.168.1.100）；主机故障自动切换，对外保持统一入口。
数据库与应用配置
- 数据库采用主从复制/流复制；应用配置（如数据源、文件存储）尽量外部化（配置中心/集中存储），避免单点。

三故障切换与健康检查

负载均衡器主动探测：Nginx/HAProxy 对后端 HTTP 200/302 或 TCP 8080 做健康探测，失败即摘除；配合 max_fails/fail_timeout 与重试策略，降低误判与雪崩。
Tomcat 层会话容错：内置集群通过 ReplicationValve 与 DeltaManager 在节点间复制会话；会话粘滞（sticky）可减轻复制压力，但需接受节点宕机时的少量会话丢失风险。
入口层容错：Keepalived 提供 VIP 漂移，在负载均衡器故障时无缝切换；云上可直接使用 NLB/CLB 的健康检查与多可用区部署。

四监控日志与容量规划

指标与日志
- 采集 Tomcat/JVM/系统指标（线程池、连接数、GC、响应时延）到 Prometheus，在 Grafana 做可视化与阈值告警；日志统一到 ELK 便于检索与根因分析。
容量与调优
- 依据峰值 QPS 与 RT 调整 Tomcat 线程池（maxThreads）、连接器（acceptCount、maxConnections）、JVM 堆与 GC 策略；数据库与应用层配合做读写分离与缓存。

五快速验证清单

最新问答