CentOS 上 WebLogic 故障排查步骤
一 快速定位与最小闭环
二 常见故障与处理清单
| 症状 | 关键线索 | 快速处置 |
|---|---|---|
| 启动即报 BEA-000386,伴随 “Could not obtain the localhost address” | server.log 出现 UnknownHostException/AssertionError | 修正 /etc/hosts,确保主机名能解析到本机 IP,例如: |
| 127.0.0.1 localhost | ||
| 192.168.1.98 Weblogic;必要时检查 /etc/hostname 与网卡配置 | ||
| 控制台端口 7001 访问不了 | 端口未监听或被占用 | 用 netstat/ss 查占用并释放;或调整 config.xml 的 ListenPort;确认 firewall-cmd 已放行 7001 |
| 管理节点启动报 BEA-090402 “Boot identity not valid” | boot.properties 中用户名/密码与域不一致 | 更新 boot.properties(首次启动会加密保存),或交互式输入正确凭据 |
| 受管服务器无法注册到 AdminServer(如 BEA-141196) | 域间安全/序列化文件不一致 | 将 SerializedSystemIni.dat 从 AdminServer 域的 security/ 目录同步到受管服务器对应目录后重启 |
| JDBC 连接池耗尽或报 “No resources currently available” | server.log 出现 ResourceLimitException | 提高 Maximum Capacity,并观察 Waiting For Connection High Count;排查慢 SQL/连接泄漏 |
| 连接被强制回收或应用报空指针 | 出现 “Forcibly releasing inactive resource … back into the pool” | 适当提高 Inactive Connection Timeout;同时确认 JTA Timeout Seconds 小于连接超时 |
| 数据库连接超时/间歇性失败 | 数据库 alert 出现 ORA-3136,或客户端日志出现 “Connection reset by peer” | 在数据库侧 sqlnet.ora 增加/调整: |
| SQLNET.EXPIRE_TIME=20 | ||
| SQLNET.INBOUND_CONNECT_TIMEOUT=300 | ||
| SQLNET.OUTBOUND_CONNECT_TIMEOUT=300 | ||
| 并排查底层 IO/负载 瓶颈 | ||
| Node Manager 启动失败 “Invalid state file format” | nodemanager.log 报状态文件格式错误 | 删除 Domain_HOME/servers/servername/data/nodemanager/servername.state 后重启 Node Manager |
| 以上条目覆盖了启动、网络、控制台、JDBC 与 Node Manager 的高频故障与处置要点。 |
三 网络与数据库连通性专项
四 日志与诊断数据收集