HBase Master自带Web界面,可直观查看集群状态、RegionServer分布、表信息等。
访问步骤:
jps命令确认HMaster进程存在);http://<master-host>:16010/master-status(替换<master-host>为Master节点IP或主机名);HBase Shell是命令行工具,适合脚本化监控或快速排查问题。
常用命令:
status 'simple'(显示Master/RegionServer数量、运行时间);list_regionservers;describe 'your_table_name'(显示表结构、列族配置);scan 'hbase:meta', {FILTER => "PrefixFilter('your_table_name')"}(需替换表名)。功能:Prometheus收集HBase指标,Grafana可视化展示并设置告警,支持实时监控和历史数据分析。
配置步骤:
prometheus-2.40.0.linux-amd64.tar.gz),编辑prometheus.yml添加HBase Exporter任务:scrape_configs:
- job_name: 'hbase'
static_configs:
- targets: ['<master-host>:16020', '<regionserver-host>:16020'] # HBase JMX Exporter端口
hbase-jmx-exporter.jar(如GitHub开源版本),创建配置文件hbase-metrics.yml(定义需暴露的指标),启动Exporter:java -jar hbase-jmx-exporter.jar 16020 hbase-metrics.yml
grafana-server),添加Prometheus为数据源(URL为http://<prometheus-host>:9090);功能:分布式监控系统,适合大规模HBase集群,监控CPU、内存、磁盘IO、网络流量等指标。
配置步骤:
yum install -y ganglia ganglia-gmond ganglia-gmetad ganglia-web);/etc/ganglia/gmond.conf,设置cluster名称、udp_send_channel(发送目标);/etc/ganglia/gmetad.conf,添加数据源(data_source "HBase Cluster" <master-host>);systemctl start gmond(所有节点)、systemctl start gmetad(Master节点);http://<master-host>/ganglia查看集群监控大盘。功能:企业级监控工具,支持HBase服务器资源(CPU、内存、磁盘)、JMX指标(RegionServer负载、GC情况)的监控与告警。
配置步骤:
/etc/zabbix/zabbix_agentd.conf,设置Server(Zabbix Server IP)、Hostname(节点主机名);hbase.regionserver.requests、hbase.regionserver.region_count),关联告警规则(如“RegionServer宕机”触发邮件通知)。HBase日志包含RegionServer运行、请求处理、错误信息等,可通过tail、grep命令实时查看,或使用ELK Stack(Elasticsearch+Logstash+Kibana)集中收集分析。
常用命令:
# 查看HMaster日志(默认路径/var/log/hbase/hbase-master-<hostname>.log)
tail -f /var/log/hbase/hbase-master-$(hostname).log | grep -i "error\|warn"
# 查看RegionServer日志(默认路径/var/log/hbase/hbase-regionserver-<hostname>.log)
tail -f /var/log/hbase/hbase-regionserver-$(hostname).log | grep -i "slow\|exception"
通过Linux系统工具监控HBase节点资源使用情况,辅助判断集群瓶颈:
%util、await指标);16020的连接数)。