CentOS HBase如何监控

一、HBase自带监控工具

1. HBase Web界面

HBase自带Web界面，可直观查看集群状态、RegionServer分布、表信息等。默认访问地址为http://<HBase_Master主机名或IP>:16010/master-status（需确保防火墙开放16010端口）。通过该界面可快速了解集群整体健康状况。

2. HBase Shell命令

HBase Shell是命令行交互工具，可用于执行监控操作：

查看集群状态：执行status 'simple'，显示Master运行状态、RegionServer数量及运行时间；
查看Region分布：执行list_regions 'your_table_name'，查看指定表的Region分布情况；
查看表详情：执行describe 'your_table_name'，查看表的列族、压缩方式等配置信息。

二、JMX监控 HBase通过JMX（Java Management Extensions）暴露丰富指标（如RegionServer负载、RPC调用次数、缓存命中率等）。需先在hbase-site.xml中启用JMX：

<property>
  <name>hbase.regionserver.jmx.port</name>
  <value>16020</value> <!-- RegionServer JMX端口 -->
</property>
<property>
  <name>hbase.master.jmx.port</name>
  <value>16030</value> <!-- Master JMX端口 -->
</property>

启用后，可使用jconsole（JDK自带）或VisualVM连接service:jmx:rmi:///jndi/rmi://<master-host>:16030/jmxrmi（Master）或RegionServer对应端口，实时查看指标。

三、第三方监控工具

1. Prometheus + Grafana

Prometheus：开源时间序列数据库，用于收集HBase指标；
Grafana：可视化工具，将Prometheus中的指标转换为直观仪表盘。 配置步骤：

下载并配置HBase JMX Exporter（将JMX指标转换为Prometheus可采集的格式）；

在Prometheus的prometheus.yml中添加HBase监控目标：

scrape_configs:
  - job_name: 'hbase'
    static_configs:
      - targets: ['<master-host>:16020', '<regionserver-host>:16020']

启动Prometheus，然后在Grafana中添加Prometheus为数据源，导入HBase监控仪表盘（如官方提供的“HBase Cluster Monitoring”模板）。

2. Ganglia

Ganglia是分布式监控系统，适合大规模HBase集群。配置步骤：

在CentOS上安装Ganglia（yum install ganglia-gmetad ganglia-gmond ganglia-web）；
修改gmetad.conf，添加HBase集群数据源；
修改gmond.conf，配置HBase节点监控参数；
重启Ganglia服务，通过Web界面查看HBase集群的CPU、内存、磁盘、网络等指标。

3. Zabbix

Zabbix是功能强大的企业级监控工具，支持HBase监控：

安装Zabbix Agent并配置zabbix_agentd.conf，添加HBase监控项（如RegionServer端口、JMX指标）；
在Zabbix前端创建HBase主机，关联对应的监控模板（如“HBase by Zabbix agent”）；
设置告警规则（如RegionServer宕机、读延迟超过阈值），通过邮件、短信通知管理员。

四、日志与告警

1. 日志监控

HBase的日志文件位于$HBASE_HOME/logs/目录，主要包括：

HMaster日志（hmaster.log）：记录Master运行状态；
RegionServer日志（regionserver.log）：记录RegionServer运行状态。可通过tail -f命令实时查看日志，或使用ELK Stack（Elasticsearch+Logstash+Kibana）收集、分析日志，设置关键字告警（如“ERROR”“Exception”）。

2. 告警配置

结合第三方工具（如Prometheus Alertmanager、Nagios、Zabbix）设置告警规则：

Prometheus Alertmanager：通过PromQL查询指标（如hbase_regionserver_rpc_queue_length > 100），设置告警阈值和通知方式；
Nagios：安装Nagios插件（如check_hbase.pl），监控HBase服务可用性，触发告警。

五、系统自带命令辅助监控 通过CentOS系统命令可监控HBase相关资源使用情况：

top/htop：查看HBase进程（如HMaster、RegionServer）的CPU、内存占用；
vmstat：查看系统内存、磁盘IO、CPU使用情况；
iostat：查看磁盘读写速率（重点关注HBase数据目录所在磁盘）；
netstat：查看HBase端口（如16010、16020、16030）的网络连接状态。