Ubuntu上HDFS存储策略选型与落地
一、先明确存储类型与策略
二、策略选择决策矩阵
| 策略 | 放置规则 | 典型场景 | 成本与注意 |
|---|---|---|---|
| HOT | 全部放 DISK | 实时/高频访问、交互式查询 | 成本中等,可靠性由副本保障 |
| WARM | 1 份 DISK + 其余 ARCHIVE | 偶尔访问的历史数据、近线分析 | 成本低于 HOT,访问延迟略高 |
| COLD | 全部放 ARCHIVE | 长期归档、合规留存 | 成本最低,访问延迟最高 |
| ALL_SSD | 全部放 SSD | 高并发/低延迟作业、热点表 | 成本最高,吞吐与IOPS最佳 |
| ONE_SSD | 1 份 SSD + 其余 DISK | 读写都敏感但无需全SSD | 成本适中,兼顾热点性能 |
| LAZY_PERSIST | 1 份 RAM_DISK + 其余 DISK | 容忍数据丢失的临时/中间数据 | 成本最低(内存),需防断电丢数据 |
| 说明:若业务对可靠性要求极高,可在 COLD 层采用 纠删码(EC) 替代三副本以进一步降本,但访问延迟会升高。 |
三、在 Ubuntu 上的落地步骤
四、常见场景的推荐配置
五、运维与避坑要点