怎样监控linux minio

要监控 Linux 上的 MinIO，可以从 服务状态、资源使用、端口访问、MinIO 自带指标（Prometheus）、日志、以及可视化/告警 这几个层面来做。下面按 由简到深 的方式说明。

一、基础监控（一定要做）

1️⃣ 检查 MinIO 进程

ps -ef | grep minio

或：

pgrep -a minio

2️⃣ 检查端口监听

默认端口：

API：9000
Console：9001

ss -lntp | grep minio
# 或
netstat -lntp | grep minio

3️⃣ 检查服务状态（systemd）

如果 MinIO 是 systemd 管理的：

systemctl status minio

开机自启检查：

systemctl is-enabled minio

4️⃣ 查看 MinIO 日志

systemd 日志

journalctl -u minio -f

手动启动的日志

tail -f /var/log/minio.log

（路径依你的启动脚本而定）

二、资源使用监控（Linux 层面）

1️⃣ CPU / 内存

top -p $(pgrep minio)

或：

htop

2️⃣ 磁盘 IO

MinIO 对磁盘 IO 非常敏感：

iostat -x 1

重点看：

%util
await
svctm

3️⃣ 磁盘空间

df -h

⚠️ MinIO 磁盘满会直接变成只读甚至异常

三、MinIO 自带监控（推荐 ✅）

MinIO 原生支持 Prometheus 指标

1️⃣ 启用 Prometheus 指标

MinIO 默认暴露：

http://<minio-ip>:9000/minio/v2/metrics/cluster
http://<minio-ip>:9000/minio/v2/metrics/node

验证：

curl http://127.0.0.1:9000/minio/v2/metrics/cluster

2️⃣ Prometheus 配置示例

scrape_configs:
  - job_name: "minio"
    static_configs:
      - targets:
        - "127.0.0.1:9000"

3️⃣ 关键指标（重点关注）

指标	说明
`minio_disk_usage`	磁盘使用
`minio_node_disk_free`	磁盘剩余
`minio_http_requests_total`	请求数
`minio_http_request_duration_seconds`	请求延迟
`minio_drive_offline`	磁盘是否离线
`minio_heal_objects`	数据修复

四、可视化（强烈推荐）

✅ Grafana + Prometheus

MinIO 官方提供 Grafana Dashboard：

官方 Dashboard ID：
```
13502
```
导入方式：
```
Grafana → Import → 13502
```

可以看到：

对象数量
请求 QPS
磁盘健康
延迟分布
节点状态

五、MinIO 客户端（mc）监控

1️⃣ 查看集群信息

mc admin info myminio

输出包括：

节点状态
磁盘状态
使用量
版本

2️⃣ 查看健康状态

mc admin heal myminio

六、告警（生产必做 ⚠️）

1️⃣ Prometheus Alertmanager 示例

- alert: MinioDiskAlmostFull
  expr: minio_disk_usage > 85
  for: 5m
  labels:
    severity: warning
  annotations:
    summary: "MinIO 磁盘使用超过 85%"

2️⃣ 监控项建议

✅ 必须监控：

磁盘使用率
磁盘是否 offline
MinIO 进程是否存在
API 是否可访问
请求错误率

七、简单健康检查脚本（可用 cron）

#!/bin/bash
curl -sf http://127.0.0.1:9000/minio/health/live || echo "MinIO is down" | mail -s "MinIO Alert" admin@company.com

八、总结：推荐组合

场景	推荐
单机 / 测试	systemctl + curl health
生产	Prometheus + Grafana + Alertmanager
云原生	Prometheus Operator + ServiceMonitor
快速查看	`mc admin info`

如果你愿意，我可以：

✅ 给你 完整 Prometheus + Grafana 部署示例
✅ 写 systemd + 监控一体化方案
✅ 针对 单节点 / 分布式 MinIO 给你不同监控方案