Linux 上监控 Informix 的实用方案
一 监控体系总览
二 关键监控项与常用命令
| 维度 | 关键指标 | 常用命令或视图 | 典型告警阈值 |
|---|---|---|---|
| 实例与连接 | 实例是否 Up、会话数、长事务 | onstat -g glo、onstat -u、onstat -x | 连接数接近 SESSIONS 上限;长事务持续不提交 |
| 锁与等待 | 锁等待数、锁超时/死锁 | onstat -k、onstat -x | 锁等待显著上升、出现死锁 |
| 缓存与内存 | 缓冲池命中率、LRU 刷新 | onstat -p、onstat -R | 命中率长期低于 95% |
| 磁盘与 I/O | 读写吞吐、IOPS、响应时间 | onstat -d、iostat -x 1 | 平均等待时间持续偏高 |
| 日志与检查点 | 日志使用率、日志切换频率、检查点时长 | onstat -l、onstat -F | 日志使用率 > 80%;检查点过长 |
| 备份与恢复 | 备份成功率、最近备份时间 | onbar -l、onstat -g arc | 最近一次备份时间超出策略窗口 |
| SQL 性能 | 执行计划、逻辑/物理读 | set explain on、onstat -g sql | 高成本 SQL、异常读写比 |
| 系统资源 | CPU、内存、网络、历史趋势 | top、vmstat 1、sar -u 1、netstat -an | CPU 持续 > 80%;可用内存过低;网络异常连接增多 |
| 上述命令与指标覆盖了实例健康、会话与锁、缓存命中、磁盘 I/O、日志与检查点、备份状态、SQL 性能与系统资源等关键面,适合日常巡检与阈值告警的落地。 |
三 可视化与告警平台搭建
四 快速上手步骤