MongoDB在Linux上的数据存储优化方法

Linux 上 MongoDB 数据存储优化方法

一存储硬件与文件系统

使用 SSD/NVMe，优先构建 RAID10；避免使用 RAID5（写放大与重建慢）。复制集各节点尽量连接不同 SAN 以分散故障域。
文件系统优先 XFS/ext4，挂载时启用 noatime（关闭访问时间更新，降低元数据写放大）。
磁盘 I/O 调度：SSD 用 noop/deadline；虚拟机环境更推荐 noop。
时间同步：部署 NTP，确保复制集/分片集群时钟一致，避免选举与回放异常。

二 Linux 内核与资源限制

三 MongoDB 存储引擎与关键参数

存储引擎：使用 WiredTiger（MongoDB 3.2+ 默认），具备文档级并发、压缩与高效缓存等优势。
缓存大小：通过 storage.wiredTiger.engineConfig.cacheSizeGB 控制，默认约为 min(50%×内存 - 1GB, 256MB)；一般按业务“工作集”调优，常见区间为内存的 40%–60%（容器/共享主机需显式限制，避免内存争用）。
索引与数据分离：开启 storage.wiredTiger.engineConfig.directoryForIndexes，将索引与集合数据分目录/分卷存放，缓解 I/O 争用；多盘环境收益更明显。
压缩算法：通过 storage.wiredTiger.collectionConfig.blockCompressor 选择 none/snappy/zlib/zstd；写密集优先 snappy，读密集且存储紧张优先 zstd（压缩率与解压性能更优）。
多库隔离：开启 storage.directoryPerDB，按数据库拆分目录，便于 I/O 与容量治理。
压缩与校验：WiredTiger 默认对 journal 使用 snappy 压缩；检查点默认约每 60 秒或待写数据达 2GB 触发，journal 同步默认 100ms，可在性能与持久性间权衡（不建议关闭 journal，除非可容忍数据丢失）。

四监控与容量规划

观察缓存命中与压力：使用 db.serverStatus().wiredTiger.cache 关注 maximum bytes configured、bytes currently in the cache、pages read into cache 等指标；若缓存长期接近上限且读负载高，考虑扩容内存或优化工作集。
运行期观测：利用 mongostat、mongotop 快速定位异常集合/操作；对高延迟或高扫描操作建立合适索引并优化查询。
容量与扩展：当单实例容量或 I/O 成为瓶颈，结合分片水平扩展；历史冷数据可转存至低成本存储，热数据保留在高性能盘。

五快速检查清单

最新问答