Debian 上 HBase 数据备份与恢复实操指南
一 常用方案与适用场景
二 快速上手 Snapshot 备份与恢复
echo "status" | hbase shellhbase.snapshot.enabled=true 并重启集群。snapshot 'your_table', 'snap_20251215'list_snapshotshbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot snap_20251215 -copy-to hdfs://backup-nn:8020/hbase/backup/snap_20251215 -mappers 8 -bandwidth 100disable 'your_table'restore_snapshot 'snap_20251215'enable 'your_table'clone_snapshot 'snap_20251215', 'your_table_bak'三 其他方案与命令示例
hbase org.apache.hadoop.hbase.mapreduce.Export your_table /backup/hbase/export/your_table_fullhbase org.apache.hadoop.hbase.mapreduce.Export your_table /backup/hbase/export/your_table_20251215 1 1734230400000 1734316800000hbase org.apache.hadoop.hbase.mapreduce.Import your_table /backup/hbase/export/your_table_fullhadoop distcp hdfs://nn1:8020/hbase hdfs://nn1:8020/hbase_backup/backup_20251215hadoop distcp hdfs://nn1:8020/hbase hdfs://nn2:8020/hbase_backup/backup_20251215/hbase),并确保权限与目录结构正确后启动 HBase。add_peer '1', 'zk-quorum:2181:/hbase'alter 'your_table', {NAME => 'cf', REPLICATION_SCOPE => '1'}stop_replication四 方法对比与选择建议
| 方法 | 是否在线 | 速度与开销 | 适用场景 | 关键命令/要点 |
|---|---|---|---|---|
| Snapshot | 是 | 创建极快、低开销 | 日常备份、点-in-time 恢复、克隆测试表 | snapshot / restore_snapshot / clone_snapshot / ExportSnapshot |
| Export/Import | 是 | 依赖 MR,适中开销 | 小规模、跨集群迁移、时间窗口增量 | Export(支持 starttime/endtime)/ Import(可 bulk) |
| DistCp | 否(需停写) | 大数据量吞吐高 | 灾备、集群迁移、离线归档 | hadoop distcp hdfs://src hdfs://dst |
| Replication | 是 | 异步低延迟 | 持续容灾、近实时同步 | add_peer / alter REPLICATION_SCOPE / stop_replication |
五 注意事项与最佳实践
hbase.import.version 等),必要时按官方迁移指南执行。