Linux Hadoop集群如何进行扩容与缩容

linux

小樊

2025-09-02 20:31:19

栏目: 智能运维

准备新节点
- 确保新节点安装JDK、Hadoop环境，配置主机名、SSH免密登录及/etc/hosts文件。
- 将主节点Hadoop配置文件（core-site.xml、hdfs-site.xml等）同步至新节点。
添加节点到集群
- 在主节点的slaves（或workers）文件中添加新节点主机名。
- 若启用白名单，在hdfs-site.xml中配置dfs.hosts属性并添加新节点。

启动新节点服务

在新节点执行：

hadoop-daemon.sh start datanode  
yarn-daemon.sh start nodemanager

负载均衡（可选）

在主节点执行：

hdfs balancer -threshold 10  # 设置数据迁移阈值

验证扩容
- 通过Web界面（NameNode：http://主节点IP:9870，ResourceManager：http://主节点IP:8088）查看节点状态。
- 使用命令hdfs dfsadmin -report确认新节点已加入。

标记退役节点
- 在主节点的hdfs-site.xml中配置dfs.hosts.exclude文件，添加需移除节点主机名。
- 重启NameNode使配置生效：
```
sbin/stop-dfs.sh && sbin/start-dfs.sh  
```

停止节点服务

在待移除节点执行：

hadoop-daemon.sh stop datanode  
yarn-daemon.sh stop nodemanager

参考来源：

最新问答