Debian上部署与调优Hadoop的实用技巧
一 基础环境与安全加固
二 关键配置文件与最小可用示例
| 文件 | 关键项 | 示例与说明 |
|---|---|---|
| core-site.xml | fs.defaultFS、hadoop.tmp.dir | fs.defaultFS=hdfs://namenode:9000;hadoop.tmp.dir=/usr/local/hadoop/tmp |
| hdfs-site.xml | dfs.replication、dfs.namenode.name.dir、dfs.datanode.data.dir | 副本数:生产3、测试1;目录使用本地绝对路径,便于隔离与扩容 |
| mapred-site.xml | mapreduce.framework.name | 设为 yarn,使用 YARN 调度 |
| yarn-site.xml | yarn.nodemanager.aux-services、yarn.resourcemanager.hostname | aux-services=mapreduce_shuffle;指定 RM 主机名 |
hdfs namenode -format;随后在相应节点执行 start-dfs.sh 与 start-yarn.sh。三 性能与资源管理优化
四 验证与运维监控
jps 检查 NameNode/DataNode/ResourceManager/NodeManager 是否就绪;hdfs dfs -ls / 验证 HDFS;访问 NameNode Web UI(9000) 与 ResourceManager(8088) 查看集群状态。五 常见坑位与快速排查