Debian系统下Kafka故障排查方法如下:
systemctl status kafka查看服务状态,确保Kafka进程正常运行。/var/log/kafka/server.log),分析错误信息如Input/Output error、OOM等。/etc/kafka/server.properties,确认listeners、advertised.listeners、zookeeper.connect等配置正确。log.dirs目录存在且有写权限。top、free -h、df -h监控CPU、内存、磁盘空间,确保资源充足。jstat或GC日志分析内存管理问题,排查内存泄漏或频繁GC。ping、telnet测试网络连通性,确保Kafka节点间及客户端通信正常。zkCli.sh验证Kafka与ZooKeeper的连接状态。kafka-topics.sh查看Topic分布、分区状态,检查是否有异常副本(OSR)。kafka-reassign-partitions.sh重新分配分区。cmdline-jmxclient.jar获取JMX指标(如Leader数、副本同步状态)。fsck修复文件系统错误(非正常关机后)。操作前建议:备份重要数据,优先通过日志和配置调整解决问题,避免盲目重启服务。若问题复杂,可参考Kafka官方文档或社区论坛寻求进一步支持。