- 首页 >
- 问答 >
-
智能运维 >
- weblogic在centos上的故障排查步骤有哪些
weblogic在centos上的故障排查步骤有哪些
小樊
41
2025-12-23 17:10:34
WebLogic在CentOS上的故障排查步骤
一 快速定位与日志检查
- 明确症状:是起不来、启动后很快挂、端口访问不通、还是应用报错/性能异常。
- 查看关键日志与输出:
- 服务器日志:$DOMAIN_HOME/servers//logs/.log
- 域日志:$DOMAIN_HOME/servers//logs/.log
- HTTP访问日志:$DOMAIN_HOME/servers//logs/access.log
- 启动控制台输出:AdminServer.out / .out
- 常用检索:
- 实时跟踪:
tail -f AdminServer.log
- 关键字定位:
grep -n "ERROR\|Exception" AdminServer.log 或 grep -C 10 "关键字" <file>
- 日志要点:WebLogic 日志以
####<时间戳> <严重级别> <子系统> ... <消息ID> <消息文本> 格式记录,便于快速识别错误码与堆栈。
二 启动失败与身份问题
- 端口占用:检查监听端口(常见为 7001/7002)是否被占用,必要时调整端口或释放占用进程。
- 启动身份文件:若报 weblogic.security.SecurityInitializationException: Authentication denied: Boot identity not valid,说明 boot.properties 中用户名/密码无效。将文件改为明文(如
username=weblogic、password=weblogic812),首次启动会自动加密;若忘记管理员密码,可按官方流程重建管理员用户(早期版本涉及 weblogic.security.utils.AdminAccount 工具与清理域下 ldap 目录,操作前务必备份)。
- 主机名解析:出现 java.net.UnknownHostException: : Name or service not known,需在 /etc/hosts 为服务器主机名添加解析,例如:
127.0.0.1 <hostname> localhost ...
::1 <hostname> localhost ...
- 配置与权限:核对启动脚本、域配置路径与文件权限,避免因路径错误或权限不足导致启动失败。
三 网络连通性与防火墙
- 端口监听与连通:确认 WebLogic 监听端口处于 LISTEN 状态,并能从客户端
telnet <IP> <端口> 或通过 nc -zv <IP> <端口> 连通。
- 防火墙放行:在 firewalld 中放行业务与控制台端口(示例):
sudo firewall-cmd --zone=public --add-port=7001/tcp --permanent
sudo firewall-cmd --zone=public --add-port=7002/tcp --permanent
sudo firewall-cmd --reload
- 外部依赖连通:若应用访问数据库/外部服务,需确保数据库端口(如 5432/3306)同样放行,并能
ping 通或通过 telnet 测试连通性。
四 数据库连接与数据源
- 基础检查:确认数据库服务已启动、网络可达、连接 URL/驱动/用户名/密码正确,数据库用户具备所需权限。
- 防火墙与网络:对数据库端口(如 5432/3306)在服务器与数据库两端按需放行,避免因策略阻断导致连接超时或拒绝。
- 连接池与可用性:在 WebLogic 数据源中合理配置 最大/最小连接数、超时、验证测试(如测试频率、保留/创建/释放时测试),并开启连接泄漏检测/回收,防止因连接耗尽导致应用不可用。
- 日志与排错:同时查看 WebLogic 服务器/域日志 与 数据库日志,从两端错误信息交叉定位(如认证失败、网络超时、表/权限不存在等)。
五 性能与资源瓶颈
- 系统资源:使用
top / vmstat / iostat 观察 CPU、内存、磁盘 I/O 是否成为瓶颈;必要时扩容或优化应用/数据库。
- JVM 与线程:通过
jstack <pid> 分析线程阻塞/死锁,通过 jmap 观察堆内存与对象分布,配合 GC 日志判断是否存在频繁 Full GC。
- 连接与 SQL:核查数据源连接池使用率、慢 SQL、锁等待与事务超时;结合应用日志与数据库 AWR/慢查询日志定位根因。