k8s在centos上的资源调度如何优化

K8s在CentOS上的资源调度优化策略

调整CentOS内核参数以提升网络、文件处理及连接跟踪能力，减少调度瓶颈。关键参数包括：

增大文件句柄上限（fs.file-max=1000000），应对高并发场景下的文件描述符需求；
优化ARP缓存（net.ipv4.neigh.default.gc_thresh1=1024、gc_thresh2=4096、gc_thresh3=8192），提升网络地址解析效率；
扩大全连接队列（net.core.somaxconn=65535），避免TCP连接因队列满被拒绝；
调整连接跟踪表大小（net.netfilter.nf_conntrack_max=10485760），适应大规模容器连接场景。
以上参数需写入/etc/sysctl.conf并通过sysctl -p生效。

etcd作为K8s核心元数据存储，其性能直接影响调度效率。优化措施：

根据集群规模调整APIServer参数，避免请求堆积：

节点数量≥3000时，设置--max-requests-inflight=3000、--max-mutating-requests-inflight=1000；
节点数量1000-3000时，设置为--max-requests-inflight=1500、--max-mutating-requests-inflight=500；
开启--enable-admission-plugins=ResourceQuota，限制命名空间资源总量，防止过度占用。

通过调度策略与性能参数调整，提升调度效率与资源均衡性：

亲和性与反亲和性：使用nodeAffinity将Pod调度到带特定标签的节点（如GPU节点），或用podAntiAffinity将同类Pod分散到不同节点，提升容错性与资源利用率；
拓扑分布：启用podTopologySpread插件，根据Zone、节点等拓扑域均衡分布Pod，避免单节点过载；
调度性能：调整--percentage-of-nodes-to-score（如设置为50%），减少调度时评估的节点数量，降低延迟。

合理设置Pod的requests（调度最小资源）与limits（运行最大资源），避免资源浪费或不足：

收集数据：通过kubectl top pods、Prometheus+Grafana监控容器的CPU/内存平均使用率与峰值；
设置原则：requests≈实际平均使用量（如CPU平均使用1核，则设为1），limits≥峰值使用量（如峰值2核，则设为2）；
QoS分级：根据业务重要性设置Pod的QoS级别（Guaranteed：requests=limits，适用于关键应用；Burstable：requests<limits，适用于普通应用；BestEffort：无requests/limits，适用于批处理任务）。

通过高级调度规则优化Pod分布与资源利用：

节点亲和性：强制或优先将Pod调度到带特定标签的节点（如disk=ssd、gpu=nvidia），提升应用性能；
Pod反亲和性：避免同类Pod集中在同一节点（如topologyKey: kubernetes.io/hostname），防止单节点故障导致多个Pod不可用；
污点与容忍度：给故障节点添加污点（kubectl taint nodes node1 key=value:NoSchedule），仅允许有对应容忍度的Pod调度过来，隔离问题节点。

提升底层硬件性能，适配容器存储需求：

通过监控工具实时掌握集群状态，实现资源动态扩缩容：

监控：使用Prometheus+Grafana监控集群的CPU、内存、磁盘、网络等指标，及时发现资源瓶颈；
自动扩缩容：配置Horizontal Pod Autoscaler（HPA），根据CPU/内存使用率或自定义指标（如QPS）自动调整Pod数量（如targetAverageUtilization=70）；
垂直扩缩容：使用Vertical Pod Autoscaler（VPA），根据历史资源使用情况自动调整Pod的requests与limits，优化资源分配。

最新问答