Linux下Hadoop故障排查实战流程
一 快速定位与基础检查
二 常见故障与修复要点
三 高频命令清单
| 目标 | 命令示例 |
|---|---|
| 进程存活 | jps |
| HDFS健康与容量 | hdfs dfsadmin -report;hdfs fsck / |
| 查看HDFS根目录 | hdfs dfs -ls /(Hadoop 3.x 推荐使用 hdfs dfs 替代 hadoop dfs) |
| YARN节点与应用 | yarn node -list;yarn application -list -appStates ALL;yarn logs -applicationId <app_id> |
| 实时查看日志 | tail -f $HADOOP_HOME/logs/hadoop--namenode-.log;grep “ERROR” $HADOOP_HOME/logs/*.log |
| 资源与系统 | top/htop、free -h、df -h、iostat、vmstat、dmesg、/var/log/messages、/var/log/syslog |
| Web界面 | http:// |
四 系统化排查路径
五 求助与升级建议