CentOS上HDFS负载均衡实操指南
一 核心概念与适用场景
二 数据面均衡 Balancer步骤
<property>
<name>dfs.datanode.balance.bandwidthPerSec</name>
<value>10485760</value>
</property>
hdfs balancer -threshold 10
hdfs balancer -status
阈值 10 表示各 DataNode 使用率与集群平均值差异不超过 10% 时视为均衡完成。三 控制面均衡 客户端访问与HAProxy示例
global
log /dev/log local0
log /dev/log local1 notice
daemon
defaults
log global
mode tcp
option tcplog
timeout connect 5000ms
timeout client 50000ms
timeout server 50000ms
frontend hdfs_front
bind *:8020
default_backend hdfs_back
backend hdfs_back
balance roundrobin
server namenode1 192.168.1.11:8020 check
server namenode2 192.168.1.12:8020 check
<property>
<name>fs.defaultFS</name>
<value>hdfs://your-lb-host:8020</value>
</property>
四 监控 自动化与注意事项
crontab -e
0 * * * * /usr/local/hadoop/bin/hdfs balancer -threshold 10