Debian 上 HDFS 性能优化实用技巧
一 硬件与操作系统层优化
二 HDFS 关键配置调优
三 数据写入与读取策略
四 运维与监控实践
五 快速检查清单
| 优化项 | 关键参数/动作 | 建议值或做法 |
|---|---|---|
| 块大小 | dfs.blocksize | 顺序大文件:256MB+;小文件密集:合并/归档 |
| 副本数 | dfs.replication | 常用 3(在成本与可靠性间权衡) |
| NameNode 并发 | dfs.namenode.handler.count | 视并发请求逐步调高 |
| DataNode 传输并发 | dfs.datanode.max.transfer.threads | 按磁盘与网络能力调高 |
| 短路读 | dfs.client.read.shortcircuit | 启用(需确保安全配置) |
| 压缩 | io.compression.codecs | 启用 Snappy/LZO |
| 数据均衡 | Balancer / dfs.datanode.balance.bandwidthPerSec | 低峰期均衡,限制带宽避免影响业务 |
| 系统资源 | limits.conf / fs.file-max / net.core.somaxconn | 提升 nofile 与网络参数;必要时关闭 swap |
| 网络 | 网卡与内核 | 10Gbps+;优化 TCP 缓冲区与队列 |
| 监控与压测 | TestDFSIO / Web UI / JMX | 建立基线、变更回归、持续观测本地化率与延迟 |