Kafka通过以下机制实现故障恢复:
replication.factor)存储数据,故障时从ISR(同步副本集合)中选举新Leader。acks=all确保数据写入ISR,避免丢失。unclean.leader.election.enable=false(禁止非ISR副本当选,确保数据安全)。kafka-reassign-partitions.sh工具可手动调整分区分配。生产环境建议:
replication.factor≥3、min.insync.replicas=2,并跨机架部署Broker。unclean.leader.election,避免数据不一致。