HBase监控工具在CentOS上如何使用

一、HBase自带监控工具（基础监控）

1. HBase Web界面

HBase Master自带Web界面，可直观查看集群状态、RegionServer分布、表信息等。
访问步骤：

确保HBase Master已启动（通过jps命令确认HMaster进程存在）；
在浏览器输入http://<master-host>:16010/master-status（替换<master-host>为Master节点IP或主机名）；
进入界面后可查看集群健康状况、RegionServer列表、各表Region分布及读写请求量等指标。

2. HBase Shell命令

HBase Shell是命令行工具，适合脚本化监控或快速排查问题。
常用命令：

查看集群状态：status 'simple'（显示Master/RegionServer数量、运行时间）；
查看RegionServer列表：list_regionservers；
查看表信息：describe 'your_table_name'（显示表结构、列族配置）；
查看Region分布：scan 'hbase:meta', {FILTER => "PrefixFilter('your_table_name')"}（需替换表名）。

二、第三方监控工具（高级监控与告警）

1. Prometheus + Grafana（推荐组合）

功能：Prometheus收集HBase指标，Grafana可视化展示并设置告警，支持实时监控和历史数据分析。
配置步骤：

安装Prometheus：下载并解压Prometheus（如prometheus-2.40.0.linux-amd64.tar.gz），编辑prometheus.yml添加HBase Exporter任务：

scrape_configs:
  - job_name: 'hbase'
    static_configs:
      - targets: ['<master-host>:16020', '<regionserver-host>:16020']  # HBase JMX Exporter端口

部署HBase JMX Exporter：下载hbase-jmx-exporter.jar（如GitHub开源版本），创建配置文件hbase-metrics.yml（定义需暴露的指标），启动Exporter：
```
java -jar hbase-jmx-exporter.jar 16020 hbase-metrics.yml
```
安装Grafana：下载并启动Grafana（grafana-server），添加Prometheus为数据源（URL为http://<prometheus-host>:9090）；
导入仪表盘：在Grafana中搜索“HBase”模板（如ID 1860），导入后即可查看集群状态、RegionServer负载、BlockCache命中率等指标；
设置告警：在Grafana中创建告警规则（如“RegionServer请求延迟>1s”），关联Alertmanager配置邮件/Slack通知。

2. Ganglia

功能：分布式监控系统，适合大规模HBase集群，监控CPU、内存、磁盘IO、网络流量等指标。
配置步骤：

安装Ganglia：在CentOS上通过yum安装（yum install -y ganglia ganglia-gmond ganglia-gmetad ganglia-web）；
配置Gmond（节点监控）：编辑/etc/ganglia/gmond.conf，设置cluster名称、udp_send_channel（发送目标）；
配置Gmetad（数据聚合）：编辑/etc/ganglia/gmetad.conf，添加数据源（data_source "HBase Cluster" <master-host>）；
启动服务：systemctl start gmond（所有节点）、systemctl start gmetad（Master节点）；
访问Web界面：通过http://<master-host>/ganglia查看集群监控大盘。

3. Zabbix

功能：企业级监控工具，支持HBase服务器资源（CPU、内存、磁盘）、JMX指标（RegionServer负载、GC情况）的监控与告警。
配置步骤：

安装Zabbix Server：在CentOS上通过yum或官方脚本安装Zabbix Server和Agent；
配置Zabbix Agent：编辑/etc/zabbix/zabbix_agentd.conf，设置Server（Zabbix Server IP）、Hostname（节点主机名）；
添加HBase监控项：通过Zabbix Web界面创建“HBase Cluster”模板，添加监控项（如hbase.regionserver.requests、hbase.regionserver.region_count），关联告警规则（如“RegionServer宕机”触发邮件通知）。

三、日志与系统工具（辅助排查）

1. 日志分析

HBase日志包含RegionServer运行、请求处理、错误信息等，可通过tail、grep命令实时查看，或使用ELK Stack（Elasticsearch+Logstash+Kibana）集中收集分析。
常用命令：

# 查看HMaster日志（默认路径/var/log/hbase/hbase-master-<hostname>.log）
tail -f /var/log/hbase/hbase-master-$(hostname).log | grep -i "error\|warn"

# 查看RegionServer日志（默认路径/var/log/hbase/hbase-regionserver-<hostname>.log）
tail -f /var/log/hbase/hbase-regionserver-$(hostname).log | grep -i "slow\|exception"

2. 系统工具

通过Linux系统工具监控HBase节点资源使用情况，辅助判断集群瓶颈：

top/htop：查看CPU、内存占用（重点关注RegionServer进程）；
vmstat 1：查看系统整体资源使用（CPU、内存、IO、进程数）；
iostat -x 1：查看磁盘IO负载（重点关注%util、await指标）；
netstat -antp：查看网络连接（重点关注RegionServer端口16020的连接数）。