Debian 上 Hadoop 存储设置优化指南
一 硬件与操作系统基础
二 HDFS 存储策略优化
三 关键配置参数示例
| 配置项 | 文件 | 建议与说明 |
|---|---|---|
| dfs.replication | hdfs-site.xml | 默认3;温冷数据可降至2;对大容量冷数据采用 EC 进一步降本。 |
| dfs.blocksize | hdfs-site.xml | 默认128MB/256MB;大文件可增至512MB/1GB;小文件场景适当减小或合并。 |
| dfs.datanode.data.dir | hdfs-site.xml | 多盘并行:如“/data1/dfs,/data2/dfs”;分层时分别为 SSD 与 HDD 配置路径。 |
| dfs.storage.policy.enabled | hdfs-site.xml | 设为 true,启用存储策略与 Mover 调度。 |
| io.compression.codecs | core-site.xml | 启用 Snappy/LZO/Gzip,提升吞吐与节省空间。 |
| dfs.datanode.failed.volumes.tolerated | hdfs-site.xml | 允许故障盘数(如1),避免单盘故障导致节点下线。 |
| dfs.namenode.handler.count | hdfs-site.xml | 提高 NameNode 并发处理线程,缓解心跳/请求积压。 |
| dfs.datanode.balance.bandwidthPerSec | hdfs-site.xml | 调大 Balancer 带宽(如100MB/s),加速均衡(勿影响业务)。 |
四 运维与监控实践
五 快速实施清单