CentOS 上 HDFS 存储策略的选择与落地
一 核心概念与策略类型
| 策略 | 放置规则 | 典型场景 | 成本与性能 |
|---|---|---|---|
| HOT | 全部副本在 DISK | 频繁读写、在线分析 | 成本中、性能高 |
| WARM | 部分在 DISK、部分在 ARCHIVE | 偶尔访问、历史查询 | 成本较低、性能中等 |
| COLD | 全部副本在 ARCHIVE | 长期归档、合规留存 | 成本最低、延迟高 |
| ALL_SSD | 全部副本在 SSD | 高吞吐/低延迟作业 | 成本高、性能最佳 |
| ONE_SSD | 1 个副本在 SSD,其余在 DISK | 读写均衡、加速热子集 | 成本中、性能中高 |
| LAZY_PERSIST | 单副本先落 RAM_DISK,延迟持久化到 DISK | 短生命周期中间数据、容忍数据丢失 | 成本中、写吞吐高(注意风险) |
| 以上策略需集群具备对应存储类型,否则无法按策略落盘。 |
二 选择流程与决策要点
三 配置与落地步骤
四 典型场景与推荐策略
五 优化与常见问题