温馨提示×

WebLogic Linux版如何进行故障排查

小樊
37
2025-12-06 13:46:49
栏目: 智能运维

Linux 上 WebLogic 故障排查实战手册

一 快速定位流程

  • 明确症状:是起不来启动卡住访问异常还是运行缓慢/报错
  • 先看日志:优先查看域日志与服务器日志中的ERROR/SEVERE与异常堆栈,定位发生时间与模块。
  • 查端口与连通:确认监听端口(常见为7001/7002)是否被占用、是否被防火墙拦截。
  • 看资源:用top/vmstat/iostat排查CPU/内存/磁盘IO瓶颈。
  • 检查配置与权限:核对config.xml、启动脚本、环境变量与文件权限。
  • 若涉及认证:核对boot.properties或外部LDAP连接与凭据。
  • 必要时做线程/内存快照:用jstack/jmap分析线程阻塞与内存泄漏。
    以上步骤覆盖了 Linux 下 WebLogic 故障排查的高频入口与顺序,可快速缩小问题范围。

二 日志查看与关键路径

  • 常用日志与路径(WLS 9+):
    • 域日志:$MW_HOME/user_projects/domains/<domain_name>/servers/<ADMIN_SERVER>/logs/<DOMAIN_NAME>.log
    • 服务器日志:$MW_HOME/user_projects/domains/<domain_name>/servers/<SERVER_NAME>/logs/<SERVER_NAME>.log
    • 访问日志:$MW_HOME/user_projects/domains/<domain_name>/servers/<SERVER_NAME>/logs/access.log
    • 控制台输出:<SERVER_NAME>.out(标准输出/错误)
  • 高效查看命令:
    • 实时跟踪:tail -f server.log
    • 关键字定位:grep -n "ERROR" server.loggrep -C 5 "Exception" server.log
  • 日志要点:
    • 域日志汇聚域内各 Server 的重要消息;服务器日志记录启动/关闭/运行详情;访问日志便于分析HTTP 状态码与访问行为。
      这些路径与方法是 Linux 下 WebLogic 日志分析的基础,建议优先从 server.log 与 DOMAIN.log 入手。

三 常见故障与处理对照表

症状 优先检查 快速命令示例 处理要点
启动失败 配置、端口、权限、网络 tail -n 200 server.log;`netstat -tulpen grep 7001systemctl status firewalld`
启动卡住不动 资源、配置、网络、JVM top/free -hping/telnet 到依赖服务 释放内存/CPU;核对boot.propertiesLDAP连通;必要时调整 JVM 参数
管理控制台/应用访问不了 监听端口、连通性 `netstat -tulpen grep 7001telnet 7001nc -zv 7001`
启动身份无效 凭据文件、Realm/LDAP 查看 boot.properties;测试 LDAP 连通 用明文更新boot.properties后重启以重新加密;修复LDAP地址/端口/凭据
被管服务器起不来(改密后) 被管 Server 安全目录 检查被管目录下的 ldap 子目录 删除被管 Server 的 ldap 目录后重启,使其与 Admin 同步凭据
数据库连接异常 连接池、数据库可用性 查看 JDBC 驱动与连接池配置;ping/连接测试 调整连接池大小/超时;排查数据库负载与网络
CPU/内存/磁盘异常 系统资源 top/vmstat 1 10/iostat -x 1 识别占用进程;优化应用或扩容;处理慢盘/满盘

以上对照表覆盖了 Linux 上 WebLogic 的高频故障场景与处置方向,可据此快速执行排查与修复。

四 深入分析与工具

  • Java 诊断:
    • 线程分析:jstack <pid> > thread_dump.txt(多次采样对比“RUNNABLE/BLOCKED/WAITING”);
    • 内存快照:jmap -dump:format=b,file=heap.hprof <pid>(配合 MAT/VisualVM 分析泄漏);
    • 实时看占用:top -H -p <pid> 定位热点线程。
  • 系统监控:
    • 资源全景:top/htopfree -hvmstat 1 10iostat -x 1df -hsar -n DEV 1
  • 日志分析增强:
    • 命令行组合:grep -A/B/C 上下文、awk 统计错误时段;
    • 集中化与可视化:使用 ELK/Splunk 收集与告警;GoAccess 分析 access.logLogstash/Graylog 做日志管道与归档。
      这些工具与方法能在日志定位后,进一步从线程、内存与系统层面确认根因。

五 排查清单与最小复现建议

  • 排查清单:
    • 查看server.log/DOMAIN.log最近 200 行是否有SEVERE/ERROR
    • 确认进程与端口:ps -ef | grep weblogicnetstat -tulpen | grep 7001
    • 资源健康:top/free -h/iostat -x 1/df -h
    • 连通性:ping/telnet/nc 到管理端口与依赖服务;
    • 配置与凭据:config.xmlsetDomainEnv.sh/启动脚本、boot.properties、外部 LDAP 配置;
    • JDBC/数据源:驱动版本、连接池参数、数据库状态与网络。
  • 最小复现与回退:
    • 备份当前域目录与数据库;
    • 使用最近一次正常备份的域配置与代码版本回退验证;
    • 在测试环境以最小应用集逐步加载,观察问题是否复现。
      该清单可作为值守/应急的标准化操作卡,确保不遗漏关键检查点。

0