CentOS 上 Dolphin 故障排查指南
一 适用范围与快速判断
二 DolphinDB 故障排查
三 DolphinScheduler 故障排查
四 Dolphin 文件管理器故障排查
五 高频场景与处置清单
| 场景 | 快速检查 | 处置建议 |
|---|---|---|
| 节点进程消失 | 日志 grep “MainServer shutdown”/“Received signal”/“license expired”;dmesg 查 OOM | 主动关闭则忽略;被 kill/OOM 则扩容资源、限流与清理磁盘;license 过期则更新(≥1.30.11/1.20.20 可在线) |
| 连接被拒绝/端口不通 | ss -lntp | grep <端口>;排查防火墙/端口占用/服务未启动 |
| ODBC 连接失败或崩溃 | isql 直连;ldd 检查驱动;核对 LD_LIBRARY_PATH/TNS_ADMIN;必要时 LD_DEBUG=libs | 修正 DSN/驱动路径与依赖;避免错误端口;升级 ODBC 插件至 1.30.20.7/2.00.8.11+ |
| Web 页面打不开(DS) | 检查 8080/19888;jps 看 Master/Worker;必要时重启集群 | 启动依赖服务(HDFS/YARN/ZK);清理残留进程后再启 |
| 与 Hadoop/YARN 联动异常 | 8088/50070/8020 状态;zkServer.sh status;yarn --daemon start resourcemanager | 重启异常组件;确认 HA/服务角色与网络连通性 |
| 包冲突/安装失败 | yum check;journalctl -xe;/var/log/yum.log | 移除冲突包或重装;必要时改用替代文件管理器 |
| 以上清单覆盖了 DolphinDB 的日志/资源/ODBC 要点、DolphinScheduler 的进程/依赖/端口要点,以及 Dolphin 文件管理器 的安装/冲突要点,便于快速定位与恢复。 |