温馨提示×

怎样监控linux minio

小樊
37
2026-07-01 11:34:08
栏目: 智能运维

要监控 Linux 上的 MinIO,可以从 服务状态、资源使用、端口访问、MinIO 自带指标(Prometheus)、日志、以及可视化/告警 这几个层面来做。下面按 由简到深 的方式说明。


一、基础监控(一定要做)

1️⃣ 检查 MinIO 进程

ps -ef | grep minio

或:

pgrep -a minio

2️⃣ 检查端口监听

默认端口:

  • API:9000
  • Console:9001
ss -lntp | grep minio
# 或
netstat -lntp | grep minio

3️⃣ 检查服务状态(systemd)

如果 MinIO 是 systemd 管理的:

systemctl status minio

开机自启检查:

systemctl is-enabled minio

4️⃣ 查看 MinIO 日志

systemd 日志

journalctl -u minio -f

手动启动的日志

tail -f /var/log/minio.log

(路径依你的启动脚本而定)


二、资源使用监控(Linux 层面)

1️⃣ CPU / 内存

top -p $(pgrep minio)

或:

htop

2️⃣ 磁盘 IO

MinIO 对磁盘 IO 非常敏感:

iostat -x 1

重点看:

  • %util
  • await
  • svctm

3️⃣ 磁盘空间

df -h

⚠️ MinIO 磁盘满会直接变成只读甚至异常


三、MinIO 自带监控(推荐 ✅)

MinIO 原生支持 Prometheus 指标


1️⃣ 启用 Prometheus 指标

MinIO 默认暴露:

http://<minio-ip>:9000/minio/v2/metrics/cluster
http://<minio-ip>:9000/minio/v2/metrics/node

验证:

curl http://127.0.0.1:9000/minio/v2/metrics/cluster

2️⃣ Prometheus 配置示例

scrape_configs:
  - job_name: "minio"
    static_configs:
      - targets:
        - "127.0.0.1:9000"

3️⃣ 关键指标(重点关注)

指标 说明
minio_disk_usage 磁盘使用
minio_node_disk_free 磁盘剩余
minio_http_requests_total 请求数
minio_http_request_duration_seconds 请求延迟
minio_drive_offline 磁盘是否离线
minio_heal_objects 数据修复

四、可视化(强烈推荐)

✅ Grafana + Prometheus

MinIO 官方提供 Grafana Dashboard:

  • 官方 Dashboard ID:
    13502
    
  • 导入方式:
    Grafana → Import → 13502
    

可以看到:

  • 对象数量
  • 请求 QPS
  • 磁盘健康
  • 延迟分布
  • 节点状态

五、MinIO 客户端(mc)监控

1️⃣ 查看集群信息

mc admin info myminio

输出包括:

  • 节点状态
  • 磁盘状态
  • 使用量
  • 版本

2️⃣ 查看健康状态

mc admin heal myminio

六、告警(生产必做 ⚠️)

1️⃣ Prometheus Alertmanager 示例

- alert: MinioDiskAlmostFull
  expr: minio_disk_usage > 85
  for: 5m
  labels:
    severity: warning
  annotations:
    summary: "MinIO 磁盘使用超过 85%"

2️⃣ 监控项建议

✅ 必须监控:

  • 磁盘使用率
  • 磁盘是否 offline
  • MinIO 进程是否存在
  • API 是否可访问
  • 请求错误率

七、简单健康检查脚本(可用 cron)

#!/bin/bash
curl -sf http://127.0.0.1:9000/minio/health/live || echo "MinIO is down" | mail -s "MinIO Alert" admin@company.com

八、总结:推荐组合

场景 推荐
单机 / 测试 systemctl + curl health
生产 Prometheus + Grafana + Alertmanager
云原生 Prometheus Operator + ServiceMonitor
快速查看 mc admin info

如果你愿意,我可以:

  • ✅ 给你 完整 Prometheus + Grafana 部署示例
  • ✅ 写 systemd + 监控一体化方案
  • ✅ 针对 单节点 / 分布式 MinIO 给你不同监控方案

0