Ubuntu RabbitMQ故障恢复实操指南
一 单节点快速恢复
二 集群节点恢复
三 数据一致性与高可用配置
四 预防性检查清单
五 常见恢复场景速查表
| 场景 | 关键症状 | 快速操作 |
|---|---|---|
| 服务无法启动 | systemctl 失败、日志报错 | 查看日志;必要时清理**/var/lib/rabbitmq/mnesia**后重启;释放磁盘空间 |
| 集群节点无法加入 | “thinks it’s clustered but disagrees” | 清理故障节点本地 Mnesia 元数据;以单节点启动后重新join_cluster |
| 最后存活节点宕机 | 其他节点长时间等待或启动失败 | 正常节点执行force_boot;对故障节点执行forget_cluster_node;随后清理并重新加入 |
| 磁盘/恢复文件异常 | not_a_dets_file、空间不足 | 释放磁盘;备份并清理异常recovery.dets等文件;重启服务 |
| 客户端连不通 | AmqpConnectException、超时 | 核对5672/15672端口、防火墙、用户权限与vhost配置,必要时开放端口并回归连通性测试 |