HBase在CentOS上的故障诊断流程
一 快速定位与最小信息收集
二 常见故障与处置要点
| 症状 | 关键检查 | 快速处置 | ||||||
|---|---|---|---|---|---|---|---|---|
| HMaster/HRegionServer起不来 | 配置文件hbase-site.xml是否正确;端口冲突(如60000/2181);Java版本与依赖兼容;HDFS可用;日志报错 | 修正配置(如hbase.cluster.distributed、hbase.rootdir、hbase.zookeeper.quorum);释放或更换端口;统一Java版本;恢复HDFS;按日志报错逐项修复 | ||||||
| 连接ZooKeeper异常(Session expired/ConnectionLoss) | ZooKeeper状态与负载;会话超时设置;网络连通;版本兼容 | 增大会话超时;排查ZooKeeper连接数与负载;核对hbase.zookeeper.quorum与端口;必要时调整超时参数 | ||||||
| Region无法上线/元数据异常 | hbase:meta一致性;主机名变更;分配状态 | 在HBase Shell执行**scan 'hbase:meta’定位异常行;必要时用hbck -fixAssignments
三 关键命令与操作清单
|