CentOS下HBase备份策略
一、策略总览
二、常用备份方式与适用场景
| 方式 | 适用场景 | 关键命令或配置 | 优点 | 局限 |
|---|---|---|---|---|
| Snapshot 快照 | 表级时间点保护、快速回滚 | hbase shell: snapshot ‘snap1’,‘tbl’; list_snapshots; restore_snapshot ‘snap1’ | 轻量、秒级创建、对业务影响小 | 依赖HDFS与表结构;需配合离线拷贝或复制做长期保留/异地 |
| DistCp 拷贝 | 跨集群/跨机房/离线归档 | hadoop distcp hdfs://src/hbase /backup/hbase_20241126 | 吞吐高、适合大数据量、可并行 | 需合适带宽与窗口;对在线业务有负载 |
| Export/Import | 小中规模迁移/导出到外部存储 | hbase org.apache.hadoop.hbase.mapreduce.Export tbl /backup/tbl_20241126;Import tbl /backup/tbl_20241126 | 简单直观、可跨版本/跨平台 | MR作业开销大,适合非高峰/小表 |
| Replication 复制 | 近实时灾备、双活/多活 | hbase shell: add_peer ‘1’, CLUSTER_KEY=>‘zk1,zk2,zk3:2181:/hbase’; enable_table_replication ‘tbl’ | 持续同步、RPO低 | 非真正备份,需配合快照/离线拷贝做基线 |
| HBase Backup/Restore | 命名备份集、计划任务、集中管理 | hbase backup create full | incremental ‘bk_20241126’ /backup/hbase;hbase backup restore ‘bk_20241126’ | 运维友好、可编排 |
三、推荐备份策略与频率
四、关键操作示例
五、注意事项与最佳实践