Hadoop在Ubuntu上的故障排查方法
一 快速定位与通用检查
二 日志与启动输出定位
三 分布式场景专项排查
四 高频症状与处理对照表
| 症状 | 快速检查 | 处理建议 |
|---|---|---|
| hadoop: command not found | echo $PATH 是否含 $HADOOP_HOME/bin | 在**~/.bashrc中设置HADOOP_HOME与PATH并source** |
| jps 无进程 | 查看**$HADOOP_HOME/logs/*.log** | 依据日志修复配置/权限/端口,再重启相应组件 |
| 无法访问 50070 | 浏览器访问 http:// |
Hadoop 3.x 改用 9870;确认防火墙放行 |
| DataNode 未启动(从机仅 JPS) | 比对core/hdfs/yarn配置与**/etc/hosts** | 修正配置与解析,查看从机 DataNode 日志 |
| Permission denied(HDFS) | 本地/远程创建目录测试 | 临时设dfs.permissions=false(测试环境),或规范HDFS权限与用户 |
| 启动报 InconsistentFSStateException | 检查dfs.namenode.name.dir | 确认目录存在且权限正确,必要时hdfs namenode -format |
| SSH 免密失败 | ssh localhost 是否需口令 | 配置authorized_keys并测试无口令登录 |
五 预防与最佳实践