Hadoop在Linux上的任务调度怎样优化

Hadoop在Linux上的任务调度优化指南

一调度器与队列策略

选择调度器：多租户与资源隔离优先选用Capacity Scheduler（容量配额、队列层级、弹性上限）；强调小作业快速响应与大作业稳态吞吐时选Fair Scheduler（队列间公平、支持抢占）；单队列、简单作业可用FIFO。
队列设计与配额：按业务划分队列（如etl、hive、streaming），为每队列设置capacity（额定容量）与maximum-capacity（上限），避免单一队列饥饿；结合用户限额因子与抢占策略保障关键业务。
作业放置与优先级：利用队列优先级与应用优先级影响调度顺序；对延迟敏感作业设置更高优先级，同时配合队列配额防止资源被长期占用。
动态资源与容器：启用动态资源分配（如 MapReduce 的 AM 动态增减容器），按作业阶段伸缩 Map/Reduce 容器数，提高资源利用率与排队时延表现。

二数据局部性与分片策略

三容器与内存资源配置

容器内存与CPU：按节点资源设置yarn.nodemanager.resource.memory-mb（NM可分配内存）、yarn.nodemanager.resource.cpu-vcores（虚拟核数）；必要时启用yarn.nodemanager.resource.detect-hardware-capabilities自动探测，并按需设置count-logical-processors-as-cores与pcore-vcore-multiplier。
Map/Reduce容器：为任务设置mapreduce.map.memory.mb、mapreduce.reduce.memory.mb与对应vcores，确保容器内存与JVM堆、Shuffle/排序缓冲区匹配，避免OOM与过度占用。
并发度与容器数：结合数据量与容器规格计算合理的并发 Map/Reduce 数，避免过多小容器导致调度与I/O开销放大。
示例（示意）：在3台×4GB内存、4核CPU的小集群中，可设置 NM 可分配内存为4GB，并按作业需求配置 Map/Reduce 容器规格与并发度，避免资源碎片与过度并发。

四 Linux系统层面的优化

I/O 调度器：数据密集型负载优先Deadline/NOOP/BFQ；通用负载可用CFQ。根据磁盘类型（SSD/NVMe/HDD）与访问模式选择合适调度器。
文件系统与挂载：为数据盘挂载时启用noatime，减少元数据写放大；选择ext4等适合大文件顺序读写的文件系统。
预读与缓存：通过blockdev调大预读缓冲区，提升顺序读吞吐；保障足够的Page Cache以加速 Shuffle 与中间数据访问。
资源与稳定性：适当提升ulimit -n（文件描述符）与net.core.somaxconn（连接队列）；生产环境建议关闭 swap以避免抖动；必要时优化TCP收发缓冲与内核网络参数，降低网络时延。

五监控、作业与平台优化

监控与告警：使用YARN ResourceManager UI、HDFS Web UI与Ganglia/Ambari持续观测队列/应用/容器的CPU、内存、I/O、网络与调度延迟，基于指标迭代调参。
作业侧优化：合理使用Combiner减少网络传输；为中间/输出数据启用压缩（如Snappy/LZO）降低 I/O 与带宽；在 Shuffle 阶段增大内存缓冲区并控制溢写；对长尾任务启用推测执行；对迭代/交互式作业考虑Tez/Spark替代 MapReduce。
平台侧优化：在Capacity Scheduler中配置多队列与队列优先级，为关键业务预留容量与抢占能力；结合动态资源分配与容器复用提升稳态吞吐。

最新问答