Ubuntu上排查Kafka配置问题的系统化流程
一 快速定位流程
二 配置文件与关键参数检查
三 常见故障与修复对照表
| 症状 | 快速检查 | 修复建议 |
|---|---|---|
| 服务起不来或闪退 | 查看 server.log;核对 zookeeper.connect、broker.id、log.dirs | 修正配置;确保 Zookeeper 运行;检查 磁盘空间 与目录权限 |
| 端口 9092 被占用 | 执行 **netstat -tuln | grep 9092** |
| 客户端连不上或访问不到 | 测试 telnet |
使用可达的主机名/IP;开放防火墙端口;必要时配置 advertised 地址 |
| 无法创建/查找 Topic | 检查 auto.create.topics.enable;用命令行列出 Topic | 显式创建 Topic;生产建议关闭自动创建 |
| 版本升级后启动报错(如 Cluster ID 不一致) | 查看 log.dirs 下元数据 | 备份后清理该目录,重启让 Broker 重建元数据 |
| 高并发下出现 “Too many open files” | 执行 ulimit -n | 提升 文件描述符 限制(limits.conf 与 systemd 配置) |
| 磁盘写满或性能骤降 | 检查 磁盘空间 与 I/O | 扩容磁盘;调整 log.retention 与 log.segment.bytes;清理过期数据 |
四 最小闭环验证与常用命令
五 提升可观测性与稳定性