Java日志中线程死锁如何识别

识别思路总览

先确认症状：应用出现无响应/接口超时，同时CPU占用低但线程长时间不前进，这是典型的线程阻塞征兆。
立即采集证据：导出线程转储 Thread Dump，优先使用jstack -l ；也可在jconsole/VisualVM中连接进程并点击检测死锁。
快速定位：在 dump 中搜索关键字**“Found one Java-level deadlock:”；若未自动标记，则查找大量线程处于BLOCKED且伴随waiting to lock <0x…>与locked <0x…>的成对信息，构成环形等待链**。

日志中的关键特征

死锁自动标记：dump 文件开头出现**“Found one Java-level deadlock:”，随后列出互相等待的线程、各自持有的锁与等待的锁**，可直接定位到参与死锁的线程与代码位置。
线程状态与锁线索：
- BLOCKED (on object monitor) 且出现waiting to lock <0x…>，表示在等待某对象监视器；
- 同一线程栈中可见**locked <0x…>**表示已持有的锁；
- 若看到waiting for monitor entry，说明在竞争进入 synchronized 块/方法；
- 注意区分Waiting on condition（常见于网络/IO/条件变量）与真正的锁竞争。
锁地址串联成环：用locked与waiting to lock的对象地址（如 0x000000076e9a7d78）在 dump 中交叉搜索，若形成A 持有 → B 等待；B 持有 → A 等待的闭环，即可确认死锁。
辅助线索：dump 中还会打印线程的tid/nid、栈顶方法、是否Runnable/Waiting/Timed_Waiting等，有助于判断业务位置与阻塞来源。

快速排查步骤

获取进程号：使用jps -l或系统命令查找目标 Java PID。
导出线程转储：执行jstack -l > thread_dump.txt；必要时用**jstack -F **强制 dump。
一键识别：在 dump 中搜索**“deadlock”；或使用jconsole/VisualVM → 线程 → 检测死锁**。
手工验证环形等待：对每个BLOCKED线程，记录其waiting to lock <地址>；再搜索该地址的locked <地址>，追溯到持有者线程，直到形成闭环。
连续取证：为排除偶发竞争，建议每隔 5 秒取一次 dump，连续3–5 次，观察锁持有/等待关系是否稳定复现。
运行时自检：在程序中通过ThreadMXBean.findDeadlockedThreads()定期探测死锁线程并打印ThreadInfo，用于线上预警。

常见误判与排查技巧

区分阻塞与正常等待：
- BLOCKED / waiting to lock 多与锁竞争相关；
- WAITING / TIMED_WAITING / Waiting on condition 常见于sleep、join、Object.wait、网络/数据库 IO等，并不必然意味着死锁。
避免一次 dump 定论：复杂竞争/调度下，建议多次 dump 对比，或使用**JFR（Java Flight Recorder）**记录锁事件后再分析。
工具辅助定位：使用Arthas的thread -b等命令快速查看阻塞点与锁关系，缩短定位时间。

从日志到修复的闭环

根因特征：多把锁的获取顺序不一致导致循环等待，是死锁最常见模式。
立即修复：
- 统一加锁顺序（如按对象哈希/显式序号排序），破坏循环等待；
- 使用ReentrantLock.tryLock(timeout, unit)，超时回退与重试；
- 减少嵌套锁、缩小同步范围，必要时用并发容器替代粗粒度 synchronized。
预防建议：在 CI/代码扫描中启用静态分析规则（如 FindBugs/SonarQube 的并发规则），并在测试环境压测复现后再上线。

最新问答