在CentOS上使用HDFS(Hadoop Distributed File System)进行数据备份与恢复,可以遵循以下步骤:
hdfs-site.xml中配置备份策略,例如设置复制因子(dfs.replication)为大于1的值,以确保数据有多个副本。hdfs dfs -get命令将HDFS上的文件或目录复制到本地文件系统或其他存储系统。hdfs dfs -get /path/to/source /path/to/destination
distcp工具进行分布式复制。hadoop distcp hdfs://namenode:port/path/to/source hdfs://namenode:port/path/to/destination
hdfs dfs -put命令将备份文件上传回HDFS。hdfs dfs -put /path/to/backup /path/to/destination
hdfs dfsadmin -restoreSnapshot <snapshotName>
通过以上步骤,可以在CentOS上有效地进行HDFS的数据备份与恢复。