Ubuntu Hadoop 故障排查方法
一 快速定位流程
二 常见故障与处理要点
| 症状 | 快速检查 | 处理建议 |
|---|---|---|
| 启动报“JAVA_HOME is not set” | 查看hadoop-env.sh与系统变量 | 在hadoop-env.sh显式设置JAVA_HOME,并确认与系统一致 |
| jps无NameNode/DataNode | 查看**$HADOOP_HOME/logs** | 多为配置错误或目录权限问题;核对core-site.xml/hdfs-site.xml;必要时清理tmp并重新namenode -format |
| 从机只出现JPS而无DataNode | 对比主从core/hdfs配置、网络连通 | 修正从机配置与主机一致;排查SSH与防火墙;查看从机DataNode日志定位根因 |
| 访问50070失败 | 核对Hadoop 3.x端口变更 | Hadoop 3.x 的NameNode Web UI默认端口为9870(50070为2.x) |
| “hadoop: 未找到命令” | 检查PATH | 将**$HADOOP_HOME/bin加入PATH并持久化到~/.bashrc** |
| 执行HDFS命令报“No such file or directory: hdfs://…/user/<当前用户>” | 检查HDFS上用户目录 | 先执行hadoop fs -mkdir -p /user/$USER创建家目录 |
| 端口访问被拒或节点不通 | 检查ufw/iptables与监听 | 放行9000、9870、8088等端口;确认服务实际监听在0.0.0.0而非仅127.0.0.1 |
| “WARN util.NativeCodeLoader” | 查看native库加载 | 仅为告警,可在log4j.properties中将其设为ERROR以屏蔽 |
三 配置与权限核查清单
四 日志与端口排障要点
五 数据一致性恢复与重置