K8S在Debian上的故障排查路线图
一 快速定位路径
二 节点与系统层检查
三 常见故障与修复要点
四 日志与监控手段
五 一键排查清单
| 检查项 | 关键命令或路径 | 期望结果/处理 |
|---|---|---|
| 节点与控制面连通 | kubectl cluster-info;kubectl get nodes | 显示API地址与节点列表;NotReady则查kubelet与网络 |
| 组件服务状态 | systemctl status kubelet;journalctl -u kubelet -f | kubelet active且日志无致命错误 |
| 工作负载状态 | kubectl get pods -A;kubectl describe pod |
定位异常Pod与事件原因 |
| 资源压力 | kubectl top pod -A;kubectl top node | 无持续高占用;磁盘满则清理/扩容 |
| 网络连通 | ping/curl;ss -lntp | 节点间与Pod网络互通;端口监听正确 |
| 服务暴露 | kubectl get svc;ss -lntp | 类型与端口映射正确;外网可访问对应NodePort/LB |
| 防火墙与安全组 | ufw status;云安全组规则 | 放行6443、2379、2380、10250、10251、10252、10255等 |
| 内核与模块 | lsmod | grep br_netfilter;sysctl -p |
| 容器运行时 | crictl ps;ctr images ls | 容器与镜像可正常管理 |
| 日志与监控 | tail -f /var/log/syslog;dmesg;Prometheus/Grafana | 无系统级异常;监控面板数据正常 |