温馨提示×

CentOS Hadoop 日志如何查看

小樊
36
2025-11-22 05:05:19
栏目: 智能运维

CentOS 上 Hadoop 日志查看与定位

一 日志存放路径

  • 系统服务日志(HDFS、YARN 等)通常位于 $HADOOP_HOME/logs,常见命名格式为:--.log,例如:
    • NameNode:hadoop--namenode-.log
    • DataNode:hadoop--datanode-.log
    • ResourceManager:yarn--resourcemanager-.log
    • NodeManager:yarn--nodemanager-.log
    • 若设置了环境变量(如 HADOOP_LOG_DIR、YARN_LOG_DIR),日志会写入对应目录。部分发行或平台可能使用 /var/log/hadoop(-hdfs)/… 等集中路径,需以实际环境为准。
  • MapReduce/作业日志(YARN 体系)分为两类:
    • 历史作业日志:由 JobHistory Server 管理,路径由 mapreduce.jobhistory.done-dirmapreduce.jobhistory.intermediate-done-dir 指定(常见在 …/history/done…/history/done_intermediate)。
    • 容器日志:每个应用的 ApplicationMasterTask 日志位于 $HADOOP_HOME/logs/userlogs/application_/container_/,通常包含 stdout、stderr、syslog 三个文件。

二 常用查看命令

  • 实时查看服务日志(以 NameNode 为例):
    • tail -f $HADOOP_HOME/logs/hadoop--namenode-.log
  • 关键字检索(错误与告警):
    • grep -E “ERROR|WARN” $HADOOP_HOME/logs/hadoop--namenode-.log | less
  • 统计错误出现频次(按时间排序):
    • awk ‘/ERROR/{print $1}’ $HADOOP_HOME/logs/hadoop--namenode-.log | sort | uniq -c | sort -nr
  • 查看历史作业列表与详情:
    • 列出已完成作业:hdfs dfs -ls /tmp/hadoop-yarn/staging/history/done
    • 查看作业明细:hdfs dfs -cat /tmp/hadoop-yarn/staging/history/done/<job_id>.jhist
  • 查看某应用的容器日志(ApplicationMaster 或 Task):
    • 进入目录:cd $HADOOP_HOME/logs/userlogs/application_/
    • 查看 AM 日志:less container_<am_id>/syslog
    • 查看某 Task 日志:less container_<task_id>/syslog
  • 若服务以 systemd 管理,可用 journalctl(服务名依实际配置而定):
    • journalctl -u hadoop-namenode -f
    • journalctl -u hadoop-resourcemanager -f

三 日志轮转与保留

  • Log4j 按大小滚动:在 $HADOOP_HOME/etc/hadoop/log4j.properties 中为 RollingFileAppender 设置 MaxFileSizeMaxBackupIndex,达到阈值自动切割归档(如:MaxFileSize=256MB、MaxBackupIndex=20)。
  • 系统级轮转:使用 logrotate 管理 Hadoop 日志(示例配置路径 /etc/logrotate.d/hadoop),可按天轮转并压缩,保留指定份数,示例:
    • /var/log/hadoop/*.log { daily; rotate 7; compress; missingok; notifempty; create 0640 hadoop hadoop }
  • 注意:同时配置 log4jlogrotate 时,避免重复切割或压缩导致索引混乱,建议统一策略。

四 快速定位与排查建议

  • 先确定问题归属:是 HDFS(如 NameNode/DataNode)、YARN(ResourceManager/NodeManager)还是 作业(Application/Container)。
  • 在服务节点上用 tail -f 实时跟踪对应日志,优先检索 ERROR/WARN
  • 若是作业问题,先查 JobHistory 获取作业与任务概况,再进入 userlogs 查看具体 Containerstdout/stderr/syslog
  • 需要跨节点集中查看时,可结合 grep/awk/sed 做筛选,或使用 ELK/Grafana 等做统一检索与可视化。

0