怎样监控Linux MariaDB的性能

Linux MariaDB性能监控实操指南

一快速检查与内置工具

服务状态与日志
- 使用 systemctl status mariadb 查看是否 active (running) 及最近的日志片段，快速判断实例是否存活与异常重启。
连接与线程
- 使用 mysqladmin -u root -p status 获取 Uptime、Threads、Questions 等关键指标；在客户端执行 SHOW STATUS LIKE ‘Threads_connected’; 与 SHOW PROCESSLIST; 查看当前连接与正在执行的 SQL。
配置与状态快照
- 在客户端执行 SHOW VARIABLES; 与 SHOW STATUS;，用于对比当前配置与运行时状态，定位参数与负载的匹配度。
性能模式 Performance Schema
- 查询 performance_schema.threads; 与 performance_schema.events_statements_current; 获取线程与当前语句级统计，便于定位慢 SQL 与阻塞来源。
日志定位
- 查看 /var/log/mysql/error.log，关注启动失败、崩溃恢复、InnoDB 报错与告警信息。

二系统资源与连接监控

CPU 与内存
- 使用 top/htop 观察 mysqld 进程的 CPU%、RES、%MEM，判断是否受限于计算或内存。
磁盘 I/O
- 使用 iostat -x 1 关注 await、r/s、w/s、util%，判断是否存在 I/O 瓶颈或磁盘饱和。
网络与连接
- 使用 ss -tulnp | grep mariadb 或 netstat -tulnp | grep mariadb 查看监听端口与当前连接概况，配合 SHOW STATUS LIKE ‘Threads_connected’; 交叉验证。

三持续监控与可视化方案

企业级与开源平台
- Zabbix：在被监控端安装 zabbix-agent，在 Server 端添加主机并配置 MariaDB 监控项，实现 指标采集 + 告警。
- Netdata：一键安装后启用 MySQL 模块（配置 /etc/netdata/python.d/mysql.conf），获得 实时可视化仪表盘。
- Percona Monitoring and Management (PMM)：专业的 MySQL/MariaDB 监控与诊断平台，适合深入分析与容量规划。
- Prometheus + Grafana：以 mysqld_exporter 采集指标，Grafana 展示与告警，适合云原生与自建监控栈。

四关键指标与告警阈值示例

指标	含义	建议阈值或关注点
Threads_connected	当前连接数	接近 max_connections 需告警，检查连接泄漏或连接池配置
Threads_running	正在执行的线程数	持续高于 CPU 核心数可能并发过高或有锁等待
Questions / Uptime	QPS	结合历史基线观察突增/骤降，定位异常流量或慢查询
Slow_queries / Uptime	慢查询率	持续上升需开启并分析 slow_query_log
Innodb_buffer_pool_reads / Innodb_buffer_pool_read_requests	缓冲池命中率	命中率低于 95% 考虑增大 innodb_buffer_pool_size
Innodb_log_waits	日志等待	大于 0 表示日志写入拥塞，考虑增大 innodb_log_file_size 或优化提交策略
iostat util%	磁盘利用率	持续 > 80% 可能成为瓶颈，需优化 I/O 或扩容
iostat await	I/O 响应时间	明显升高说明磁盘慢，检查阵列、磁盘健康与 SQL 访问模式

五落地步骤与优化建议

基线采集
- 在业务平稳期采集 SHOW GLOBAL STATUS; 与 SHOW GLOBAL VARIABLES;，保存为基线，用于后续对比。
慢查询与索引
- 启用 slow_query_log，设置合理的 long_query_time，用 EXPLAIN 分析执行计划，补充或优化索引，避免 **SELECT ***。
缓冲池与日志
- 将 innodb_buffer_pool_size 设为可用内存的约 70%（视负载与实例共存情况调整）；适度增大 innodb_log_file_size 减少检查点抖动；在允许一定持久性风险时可将 innodb_flush_log_at_trx_commit=2 提升吞吐。
连接与超时
- 合理设置 max_connections 与 wait_timeout/interactive_timeout，避免连接风暴与空闲占用。
监控闭环
- 在 Zabbix/PMM/Netdata 中配置上述指标的 阈值告警 与 可视化面板，定期复盘慢查询与 I/O 报表，形成持续优化循环。

最新问答