在Linux上进行Hadoop故障排查,可以遵循以下步骤:
查看Hadoop日志:
$HADOOP_HOME/logs目录下。hadoop-<username>-namenode-<hostname>.log、hadoop-<username>-datanode-<hostname>.log等日志文件。查看系统日志:
dmesg命令查看内核日志。/var/log/messages或/var/log/syslog中的相关条目。jps命令查看Java进程是否正常运行。hdfs dfsadmin -report检查HDFS的状态。yarn node -list和yarn application -list检查YARN的状态。ping命令测试节点间的连通性。netstat或ss命令查看端口监听情况。df -h命令查看磁盘空间使用情况。top或htop命令监控系统资源使用情况。core-site.xml、hdfs-site.xml、yarn-site.xml等配置文件中的设置是否正确。hdfs fsck命令检查HDFS文件系统的一致性。yarn rmadmin -refreshNodes刷新节点信息。systemctl或service命令管理服务。通过以上步骤,你应该能够定位并解决大多数Hadoop故障。