CentOS上HDFS性能调优技巧
一 操作系统与内核优化
二 HDFS关键参数与JVM调优
三 工作负载与数据布局优化
四 压测与监控闭环
hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 128MBhadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 128MB五 快速检查清单
| 优化项 | 建议值或做法 | 适用场景 |
|---|---|---|
| 文件句柄与进程限制 | nofile 655360;pam_limits.so 启用 | 高并发访问、海量文件 |
| TCP与连接队列 | somaxconn 65535;tcp_tw_reuse 1;ip_local_port_range 1024–65535 | 大量短连接、高吞吐 |
| 透明大页 | 禁用THP | 降低延迟波动 |
| 块大小 | 128M/256M | 大文件顺序读写 |
| 副本数 | 3 | 可靠性与读取并发 |
| 并发线程 | NN handler 20–30;DN handler 30 起步 | 提升RPC与I/O并发 |
| 压缩 | Snappy 开启 | 减少网络与磁盘占用 |
| 存储与网络 | DataNode多目录;热点/元数据上SSD;万兆网络 | I/O与带宽瓶颈场景 |