Zookeeper自带多组命令行工具,适合快速检查集群状态,无需额外安装:
./zkCli.sh -server <host:port>连接集群,执行stat(查看服务器状态)、ls(列出节点)、get(获取节点数据)等命令,获取节点状态、数据及会话信息。echo <command> | nc <host> 2181执行,常用命令包括:
mntr:输出关键性能指标(平均延迟、最大延迟、活跃连接数、待处理请求数、Z节点数量等);ruok:检查服务器是否运行(返回“imok”表示正常);stat:显示服务器状态(客户端连接数、会话数、节点数等)。/path/to/zookeeper/bin/zkServer.sh status可快速查看服务器运行状态(Leader/Follower/Standby)。metricsProvider配置(metricsProvider.classname=org.apache.zookeeper.metrics.prometheus.PrometheusMetricsProvider),开启Prometheus指标接口,Prometheus定时抓取指标并在Grafana中创建仪表盘,展示CPU使用率、内存占用、请求延迟、连接数等指标,支持告警。check_zookeeper插件监控Zookeeper状态(节点存活、连接数、队列长度等),支持分布式监控,适合传统运维场景。zookeeper.ini文件(command=/path/to/zookeeper/bin/zkServer.sh start-foreground),实现Zookeeper进程的自动启动、重启及状态监控,适合需要简单进程管理的场景。systemctl status zookeeper命令查看Zookeeper服务状态(运行/停止/失败),journalctl -u zookeeper -f实时查看服务日志,适合通过systemd管理Zookeeper服务的场景。以上工具覆盖了从命令行到图形化、从基础到高级的监控需求,可根据团队技术栈(如是否已有Prometheus/Grafana)、监控粒度(如是否需要实时可视化)选择合适的工具组合。