WebLogic Linux版如何进行故障排查

Linux 上 WebLogic 故障排查实战手册

一快速定位流程

明确症状：是起不来、启动卡住、访问异常还是运行缓慢/报错。
先看日志：优先查看域日志与服务器日志中的ERROR/SEVERE与异常堆栈，定位发生时间与模块。
查端口与连通：确认监听端口（常见为7001/7002）是否被占用、是否被防火墙拦截。
看资源：用top/vmstat/iostat排查CPU/内存/磁盘IO瓶颈。
检查配置与权限：核对config.xml、启动脚本、环境变量与文件权限。
若涉及认证：核对boot.properties或外部LDAP连接与凭据。
必要时做线程/内存快照：用jstack/jmap分析线程阻塞与内存泄漏。
以上步骤覆盖了 Linux 下 WebLogic 故障排查的高频入口与顺序，可快速缩小问题范围。

二日志查看与关键路径

常用日志与路径（WLS 9+）：
- 域日志：$MW_HOME/user_projects/domains/<domain_name>/servers/<ADMIN_SERVER>/logs/<DOMAIN_NAME>.log
- 服务器日志：$MW_HOME/user_projects/domains/<domain_name>/servers/<SERVER_NAME>/logs/<SERVER_NAME>.log
- 访问日志：$MW_HOME/user_projects/domains/<domain_name>/servers/<SERVER_NAME>/logs/access.log
- 控制台输出：<SERVER_NAME>.out（标准输出/错误）
高效查看命令：
- 实时跟踪：tail -f server.log
- 关键字定位：grep -n "ERROR" server.log、grep -C 5 "Exception" server.log
日志要点：
- 域日志汇聚域内各 Server 的重要消息；服务器日志记录启动/关闭/运行详情；访问日志便于分析HTTP 状态码与访问行为。
  这些路径与方法是 Linux 下 WebLogic 日志分析的基础，建议优先从 server.log 与 DOMAIN.log 入手。

三常见故障与处理对照表

症状	优先检查	快速命令示例	处理要点
启动失败	配置、端口、权限、网络	`tail -n 200 server.log`；`netstat -tulpen	grep 7001`；`systemctl status firewalld`
启动卡住不动	资源、配置、网络、JVM	`top`/`free -h`；`ping`/`telnet` 到依赖服务	释放内存/CPU；核对boot.properties与LDAP连通；必要时调整 JVM 参数
管理控制台/应用访问不了	监听端口、连通性	`netstat -tulpen	grep 7001`；`telnet 7001`或`nc -zv 7001`
启动身份无效	凭据文件、Realm/LDAP	查看 `boot.properties`；测试 LDAP 连通	用明文更新boot.properties后重启以重新加密；修复LDAP地址/端口/凭据
被管服务器起不来（改密后）	被管 Server 安全目录	检查被管目录下的 ldap 子目录	删除被管 Server 的 ldap 目录后重启，使其与 Admin 同步凭据
数据库连接异常	连接池、数据库可用性	查看 JDBC 驱动与连接池配置；`ping`/连接测试	调整连接池大小/超时；排查数据库负载与网络
CPU/内存/磁盘异常	系统资源	`top`/`vmstat 1 10`/`iostat -x 1`	识别占用进程；优化应用或扩容；处理慢盘/满盘

以上对照表覆盖了 Linux 上 WebLogic 的高频故障场景与处置方向，可据此快速执行排查与修复。

四深入分析与工具

Java 诊断：
- 线程分析：jstack <pid> > thread_dump.txt（多次采样对比“RUNNABLE/BLOCKED/WAITING”）；
- 内存快照：jmap -dump:format=b,file=heap.hprof <pid>（配合 MAT/VisualVM 分析泄漏）；
- 实时看占用：top -H -p <pid> 定位热点线程。
系统监控：
- 资源全景：top/htop、free -h、vmstat 1 10、iostat -x 1、df -h、sar -n DEV 1。
日志分析增强：
- 命令行组合：grep -A/B/C 上下文、awk 统计错误时段；
- 集中化与可视化：使用 ELK/Splunk 收集与告警；GoAccess 分析 access.log；Logstash/Graylog 做日志管道与归档。
  这些工具与方法能在日志定位后，进一步从线程、内存与系统层面确认根因。

五排查清单与最小复现建议

排查清单：
- 查看server.log/DOMAIN.log最近 200 行是否有SEVERE/ERROR；
- 确认进程与端口：ps -ef | grep weblogic；netstat -tulpen | grep 7001；
- 资源健康：top/free -h/iostat -x 1/df -h；
- 连通性：ping/telnet/nc 到管理端口与依赖服务；
- 配置与凭据：config.xml、setDomainEnv.sh/启动脚本、boot.properties、外部 LDAP 配置；
- JDBC/数据源：驱动版本、连接池参数、数据库状态与网络。
最小复现与回退：
- 备份当前域目录与数据库；
- 使用最近一次正常备份的域配置与代码版本回退验证；
- 在测试环境以最小应用集逐步加载，观察问题是否复现。
  该清单可作为值守/应急的标准化操作卡，确保不遗漏关键检查点。

最新问答