CentOS 系统日志 message 故障排查流程
一 明确现象与范围
ls -l /var/log/messagestail -f /var/log/messages二 日志采集与定位
journalctl -n 100journalctl -b -p 3journalctl --since "2025-11-23 10:00" --until "2025-11-23 11:00"journalctl -u <service_name> -bjournalctl -b | grep -iE "error|fail|timeout|segfault"/var/log/messages、/var/log/syslog(如存在)/var/log/securedmesg、/var/log/dmesg三 常见根因与对应处置
systemctl status rsyslog systemd-journald;journalctl -xe 查启动失败原因;df -h 查磁盘;必要时清理旧日志并重启服务。systemctl status <svc>、journalctl -u <svc> -xe;核对 /etc/<svc>.conf 等配置;必要时回滚最近变更。getenforce(查看状态);ausearch -m avc -ts recent 或 journalctl | grep -i denied 定位;临时 setenforce 0 验证,再改为永久策略修复。top/free/df -h 查 CPU/内存/磁盘;sar -r(历史内存);grep -i "killed process" /var/log/messages 查 OOM;清理或扩容。ipcs -q 查看队列与当前使用;ipcrm -q <msqid> 清理残留队列;检查应用对 权限位、消息大小、队列存在性 的处理,必要时调整系统限制或应用重试/退避逻辑。四 验证与恢复
systemctl restart rsyslog <your_service>;journalctl -u <svc> -b -e 看最新错误是否消除。五 最小化排查命令清单
journalctl -n 100、journalctl -b -p 3、tail -f /var/log/messages、systemctl status rsyslog <svc>、last -x | headtop、free -m、df -h、sar -r -f /var/log/sa/sa$(date +%d)dmesg -T | tail -50ipcs -q、ipcrm -q <id>ping、traceroute、ss -tulpen。