-
无法连接到 ZooKeeper
- 检查 ZK 是否运行:jps | grep QuorumPeerMain;若未运行,启动 ZK。
- 核对 hbase-site.xml 的 hbase.zookeeper.quorum 与 hbase.zookeeper.property.clientPort=2181;在 ZK 节点确认 clientPort=2181 未被占用或拦截。
- 网络连通性:ping 与 telnet <zk_host> 2181 验证;排查防火墙/安全组策略。
- 版本兼容:确认 HBase 与 ZooKeeper 版本匹配。必要时重启服务验证恢复。
-
启动报错 ServerNotRunningYetException
- 依赖服务:确认 ZooKeeper 已就绪、HDFS 的 NameNode/DataNode 正常;HDFS 处于安全模式时先执行 hadoop dfsadmin -safemode leave。
- 配置与端口:核对 hbase-site.xml 关键参数;排查 16000/16010 等端口冲突(netstat/lsof)。
- 资源与存储:检查 JVM 堆 与 磁盘空间;HDFS 空间不足会导致写入阻塞。
- 目录权限:HDFS 上 /hbase 目录属主/权限正确(如 hbase:hadoop)。
-
RegionServer 无法启动或 Web UI 打不开
- 进程与端口:确认 HRegionServer 进程存在并监听 16020/16030;端口冲突需释放或调整配置。
- 旧版 UI 端口:HBase 1.x 的 60010 在新版本已不再默认启用;如需访问旧端口,需在 hbase-site.xml 显式配置 hbase.master.info.port=60010。
-
HDFS 块损坏或读取异常(WAL/IO 突增)
- 健康检查:执行 hdfs fsck /hbase -files -blocks -locations,关注 CORRUPT/MISSING/UNDER_REPLICATED。
- 修复措施:对损坏文件或目录执行清理/修复(如 -delete),并复核副本数;必要时滚动重启 RegionServer 观察 IO 是否恢复。
-
Java API 报错 error in opening zip file
- 依赖与包完整性:排查 classpath 中是否存在损坏或不可读的 JAR;用 jar tf <file.jar> 校验;Maven/Gradle 依赖版本与范围保持一致。