CentOS系统K8S部署的资源分配策略

CentOS系统K8S部署资源分配策略

1. 节点规划与基础配置

在CentOS上部署K8S前，需根据应用类型规划节点角色：控制平面节点（建议3节点高可用，承担API Server、Controller Manager等核心组件，资源需求较低但需高稳定性）、计算节点（根据应用负载选择CPU/内存配置，如Web服务需侧重CPU，数据库服务需侧重内存）、存储节点（若需持久化存储，选择SSD提升IO性能，配置足够存储容量）。基础配置包括关闭防火墙（systemctl stop firewalld）、禁用SELinux（setenforce 0）、配置静态网络（避免IP变动影响集群通信）。

2. 资源请求与限制（Requests/Limits）

资源请求（Requests）：定义Pod启动时所需的最小资源量（如memory: "64Mi"、cpu: "250m"），Kubernetes调度器会优先将Pod调度到满足请求的节点，确保Pod能正常启动。资源限制（Limits）：定义Pod能使用的最大资源量（如memory: "128Mi"、cpu: "500m"），防止单个Pod占用过多资源导致节点或其他Pod崩溃（如容器内存超过限制会被OOM Killer终止）。需根据应用实际负载设置（如Nginx Pod可设置requests: cpu="250m", memory="64Mi"，limits: cpu="500m", memory="128Mi"）。

3. 命名空间与资源配额

通过**命名空间（Namespace）隔离不同环境（如dev、prod）或团队的资源，避免相互干扰。结合资源配额（ResourceQuota）**限制命名空间内的资源总量（如cpu: "4", memory: "16Gi"、pods: "20"），防止单个团队过度占用集群资源（如限制prod命名空间的CPU总量不超过集群的50%）。

4. 自动伸缩策略

水平Pod自动伸缩（HPA）：根据CPU利用率（或自定义指标，如QPS）自动调整Pod副本数量（如minReplicas: 3、maxReplicas: 10、targetCPUUtilizationPercentage: 80），应对流量峰值（如电商秒杀场景，流量增长时自动扩容Pod）。
垂直Pod自动伸缩（VPA）：根据Pod历史资源使用情况自动调整requests和limits（如updateMode: "Auto"），优化长期运行的Pod资源分配（如数据分析服务，随数据量增长自动增加内存）。

5. 调度策略优化

节点亲和性（Node Affinity）：将Pod调度到具有特定标签的节点（如env: product），满足应用对节点属性的需求（如支付服务需要高速SSD节点，可设置requiredDuringSchedulingIgnoredDuringExecution）。
反亲和性（Pod Anti-Affinity）：避免将同类Pod调度到同一节点（如topologyKey: "kubernetes.io/hostname"），提高应用高可用性（如Redis Cluster的多个分片分布在不同节点，防止单点故障）。
拓扑感知调度：利用Kubernetes的CPU Manager功能，根据节点NUMA拓扑结构分配CPU（如将CPU密集型Pod绑定到独立NUMA节点，减少跨节点访问延迟）。

6. 存储资源管理

使用**PersistentVolume（PV）和PersistentVolumeClaim（PVC）**分离存储资源定义与使用（如PV定义为nfs类型，PVC申请10Gi存储），实现存储资源的动态分配（通过StorageClass如local-path按需创建PV）。选择高效的CNI插件（如Calico，支持网络策略且性能较好），优化Pod网络性能。

7. 监控与持续优化

使用Prometheus+Grafana监控集群资源使用情况（如节点CPU/内存利用率、Pod资源请求/限制对比），设置告警规则（如sum(rate(container_cpu_usage_seconds_total[5m])) by (node) / sum(kube_node_status_capacity_cpu_cores) > 0.8，CPU使用率超过80%时触发告警）。定期分析监控数据，调整资源请求/限制（如某Pod长期使用率低于requests的50%，可适当降低requests值，提高资源利用率）。

8. QoS分层管理

根据应用重要性划分QoS等级，优先保障关键业务资源：

Guaranteed：requests == limits（如核心数据库服务），Kubernetes会优先保障其资源，避免被驱逐。
Burstable：requests < limits（如普通Web服务），适合资源需求波动的应用，允许在节点资源充足时使用更多资源。
BestEffort：未设置requests/limits（如后台批处理任务），在节点资源紧张时最后被驱逐。