温馨提示×

RabbitMQ在Debian上的监控怎么做

小樊
37
2025-12-23 05:00:46
栏目: 智能运维

在 Debian 上监控 RabbitMQ 的实用方案

一 快速检查与日志

  • 使用命令行快速查看节点状态与诊断信息:
    • 查看运行状态:sudo rabbitmqctl status
    • 网络与磁盘自检:sudo rabbitmq-diagnostics check_networksudo rabbitmq-diagnostics check_disk_free
  • 启用管理插件并访问 Web 控制台:
    • 启用:sudo rabbitmq-plugins enable rabbitmq_management
    • 访问:http://<服务器IP或主机名>:15672,默认账号 guest/guest(仅建议本地或受控网络使用)
  • 查看日志定位问题:日志默认位于 /var/log/rabbitmq/ 目录

二 推荐方案 Prometheus Grafana

  • 启用内置 Prometheus 指标端点:
    • 启用插件:sudo rabbitmq-plugins enable rabbitmq_prometheus
    • 指标地址:http://:15692/metrics
  • Prometheus 抓取配置示例(prometheus.yml):
    • scrape_configs:
      • job_name: ‘rabbitmq’ static_configs:
        • targets: [‘rabbitmq-node1:15692’, ‘rabbitmq-node2:15692’] metrics_path: /metrics relabel_configs:
        • source_labels: [address] target_label: instance
  • Grafana 可视化:
    • 导入官方仪表板模板 ID:10991,通过变量 clusterqueue 实现多集群与多队列下钻
  • 关键指标与表达式示例:
    • 队列积压趋势:sum(rate(rabbitmq_queue_messages_ready[5m])) by (queue)
    • 消息吞吐热力图:sum(rate(rabbitmq_channel_get_rates[1m])) by (node)
    • 内存压力:erlang_vm_memory_system_bytes / erlang_vm_memory_bytes_total * 100 > 80

三 告警规则示例

  • 队列积压告警(持续 5 分钟超过 1000):
    • groups:
      • name: rabbitmq.rules rules:
        • alert: HighQueueBacklog expr: sum(rabbitmq_queue_messages_ready) by (queue) > 1000 for: 5m labels: severity: critical annotations: summary: “队列 {{ $labels.queue }} 积压超过阈值”
  • 节点内存压力告警(超过 80%):
      • alert: MemoryPressure expr: erlang_vm_memory_system_bytes / erlang_vm_memory_bytes_total * 100 > 80 for: 2m labels: severity: warning annotations: summary: “节点 {{ $labels.instance }} 内存使用超过 80%”

四 安全与权限配置

  • 创建专用监控账号与权限:
    • 新建用户:sudo rabbitmqctl add_user monitor
    • 设置标签:sudo rabbitmqctl set_user_tags monitor monitoring
    • 授权:sudo rabbitmqctl set_permissions -p / monitor “." ".” “.*”
  • 限制管理界面访问来源(仅允许内网或跳板机网段),并优先使用 HTTPS/TLS 访问 15672 管理端口
  • 持续更新 RabbitMQErlang 至安全版本,定期审计日志与异常行为

五 生产实践与优化建议

  • 采用三级监控:节点级 Node Exporter、集群级 Prometheus 联邦、全局 Alertmanager 分级告警
  • 合理设置内存阈值以触发流控并避免 OOM,例如在 /etc/rabbitmq/rabbitmq.conf 中:
    • vm_memory_high_watermark.relative = 0.6
  • 关注关键指标:队列积压消息速率节点存活状态Erlang VM 内存使用,并结合 Grafana 面板进行容量与性能趋势分析

0