以下是Kubernetes在Ubuntu上的故障排查方法:
sudo apt update && sudo apt upgrade命令。kubeadm version、kubelet --version、kubectl version检查核心组件版本是否兼容。kubectl get nodes查看节点状态,对NotReady节点执行kubectl describe node <节点名>分析原因。kubectl cluster-info检查主节点及核心组件(如kube-apiserver、kube-controller-manager)是否正常。kubectl get pods --all-namespaces查看Pod状态,对异常Pod执行kubectl describe pod <Pod名>查看事件和错误信息。kubectl logs <Pod名> [-c <容器名>]查看容器日志,定位应用错误或启动失败原因。docker pull <镜像名>手动验证镜像可拉取性。ping、curl、traceroute测试Pod间及服务的网络连通性。kubectl get netpol查看网络策略,确认是否因规则限制导致通信异常。kubectl top nodes和kubectl top pods查看资源使用情况,调整Pod资源请求或扩容节点。kubectl auth can-i检查Pod或ServiceAccount的权限,必要时添加Role/RoleBinding。journalctl -u kubelet查看kubelet服务日志,排查节点级错误。kubeadm reset重置集群(注意备份数据),然后重新初始化。kubectl debug命令进入Pod调试,或通过临时容器排查运行时问题。参考来源: