Linux 下 Zookeeper 故障恢复步骤
一、快速判断与恢复
二、常见故障定位清单
三、典型故障与修复对照表
| 症状 | 快速检查 | 修复建议 |
|---|---|---|
| 进程不在 | jps 无 QuorumPeerMain | 启动服务:bin/zkServer.sh start;前台排查:start-foreground |
| 进程在但不提供服务 | echo stat 返回 “not currently serving requests” | 查看日志与配置,核对 server 列表与 myid,必要时重启 |
| Error contacting service | zkServer.sh status 报错 | 查日志定位根因(配置/端口/权限),修正后重启 |
| 启动报 ClassNotFound | 启动日志提示找不到主类 | 使用带 -bin 的发行包:apache-zookeeper-x.x.x-bin.tar.gz |
| 8080 端口被占用 | 日志出现 AdminServer 8080 绑定失败 | 修改 admin.serverPort 或停用 AdminServer,释放 8080 |
| 端口冲突 2181/2888/3888 | netstat/lsof 显示被占用 | 结束占用进程或改端口,重启服务 |
| 无法远程连接 | telnet/nc 失败 | 放通防火墙与安全组,核对 clientPort 与网络连通性 |
四、数据损坏或多数节点宕机的恢复
五、预防与运维建议