Linux下MongoDB性能优化策略

1. 硬件配置优化

硬件是性能的基础，需根据业务需求选择合适的配置：

内存：MongoDB依赖内存映射文件，建议分配**系统内存的40%-60%**给WiredTiger缓存（如8GB内存实例可设为4-5GB），预留部分给操作系统和后台进程。
磁盘：优先使用SSD（尤其是NVMe SSD），其高IOPS和低延迟可显著提升读写性能；避免使用机械硬盘（HDD）。
CPU：选择多核CPU（如Intel至强系列），MongoDB能充分利用多核处理并发请求；确保CPU频率满足业务需求（如高写入场景需高主频）。
网络：使用千兆及以上以太网，跨机房部署可选择万兆网络，减少网络延迟；云环境可选用CDN或就近部署节点。

调整操作系统参数以减少资源竞争：

关闭不必要的服务：停止防火墙（如ufw disable）、禁用SELinux（setenforce 0），减少系统负载。
关闭透明大页（THP）：THP会导致内存分配延迟，执行echo never | sudo tee /sys/kernel/mm/transparent_hugepage/enabled永久禁用。
调整Swappiness：将vm.swappiness设为10或更低（sysctl -w vm.swappiness=10），减少内存交换（Swap）对性能的影响。
时间同步：使用NTP服务（如ntpdate ntp.aliyun.com）同步服务器时间，避免因时间差异导致的复制延迟。

通过调整配置文件（/etc/mongod.conf）适配业务场景：

WiredTiger缓存大小：设置storage.wiredTiger.engineConfig.cacheSizeGB为系统内存的40%-60%（如cacheSizeGB: 4），避免缓存过大抢占内存或过小导致频繁磁盘I/O。
网络压缩：开启net.compression.compressors（如zstd或snappy），减少网络传输量（云环境/跨机房推荐zstd，压缩率高；内网推荐snappy，CPU开销低）。
索引与数据分离：设置storage.wiredTiger.engineConfig.directoryForIndexes: true，将索引文件与集合数据文件分离到不同目录，分散磁盘I/O压力（需在初始化实例时设置）。
数据压缩：选择storage.wiredTiger.collectionConfig.blockCompressor（如zstd，压缩率最高；snappy，CPU开销最低），平衡存储空间与写性能。
操作分析：开启operationProfiling.mode: slowOp（慢查询阈值设为100ms），监控并优化慢查询。

索引是提升查询性能的关键，需合理设计和管理：

创建合适索引：为find、sort、aggregate等操作的高频字段创建索引（如db.users.createIndex({username: 1})）；复合索引需遵循最左前缀原则（如{field1: 1, field2: 1}可支持field1查询、field1+field2查询）。
覆盖索引：设计索引时包含查询所需的所有字段（如db.users.createIndex({username: 1, email: 1})，查询{username: 1, email: 1}可直接从索引获取数据，无需访问文档）。
定期维护索引：使用db.collection.reIndex()重建碎片化索引；通过db.collection.aggregate([{ $indexStats: {} }])分析索引使用情况，删除未使用的索引（减少写入开销）。
避免过度索引：每增加一个索引都会增加写入时的索引更新开销，仅创建必要的索引。

优化查询语句以减少资源消耗：

使用投影：通过projection参数只返回需要的字段（如db.users.find({}, {username: 1, email: 1, _id: 0})），减少数据传输量。
限制结果集：使用limit()方法限制返回的文档数量（如db.users.find().limit(100)），避免一次性返回大量数据。
避免全表扫描：确保查询条件能利用索引（可通过explain()方法查看查询计划，确认是否使用了索引）。
批量操作：使用insertMany()、updateMany()等批量操作，减少网络往返次数（如db.users.insertMany([{name: 'Alice'}, {name: 'Bob'}])）。
优化分页：避免使用skip()分页（大数据量时性能差），改用_id范围分页（如db.users.find({_id: {$gt: lastId}}).limit(10)）。

合理设计数据模型以适应业务需求：

嵌入式文档：将相关数据嵌入到单个文档中（如{user: 'Alice', orders: [{id: 1, amount: 100}, {id: 2, amount: 200}]}），减少lookup`操作（关联查询）的开销。
避免文档扩展：文档大小不应超过16MB（MongoDB最大文档限制），频繁更新的文档需预留足够的空间（如使用padding），避免文档迁移（重新分配空间）导致的性能下降。
选择合适的数据类型：使用ObjectId作为主键（默认），避免使用长字符串；数值类型选择int32/int64而非double（减少存储空间）。

通过分片和副本集实现水平扩展和高可用：

副本集：配置副本集（如3个节点），提高读取性能（查询可分发到从节点）和数据冗余（自动故障转移）；设置readPreference: secondary将读取请求分发到从节点。
分片：对于大规模数据集（如TB级），使用分片将数据分散到多个服务器（如按user_id分片），提高写入和查询性能；选择合适的分片键（如高基数的字段，避免热点问题）。
分片平衡：MongoDB会自动平衡分片数据，但需监控平衡状态（通过sh.status()），避免数据倾斜。

持续监控性能以及时发现问题：

内置工具：使用mongostat（监控QPS、延迟）、mongotop（监控集合级别的读写时间）实时查看性能指标。
第三方工具：使用Percona Monitoring and Management（PMM）进行更详细的监控（如慢查询分析、资源使用趋势），生成可视化报告。
慢查询分析：开启操作分析（operationProfiling.mode: slowOp），定期分析慢查询日志（db.adminCommand({getLog: 'slow'}）），优化慢查询语句。