温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

怎么用HDFS恢复被删除的文件

发布时间:2021-08-05 18:29:01 来源:亿速云 阅读:111 作者:chen 栏目:云计算

本篇内容主要讲解“怎么用HDFS恢复被删除的文件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用HDFS恢复被删除的文件”吧!

Hadoop有一个“垃圾回收站”的功能,用于恢复在过去一段时间内被删除文件。若某个文件被删除了多次,你还可以恢复具体哪一次删除的文件。该功能默认是关闭状态,若想开启,需要在$HADOOP_HOME/etc/hadoop/core-site.xml文件中,添加以下配置:

<property>
	<name>fs.trash.interval</name>
  	<value>10</value>
</property>

上面的配置意思为:Hadoop会设立一个回收站,回收站每隔10分钟清空一次。

若在一个回收周期内多次删除同一个文件或目录,则Trash内会分版本保存你每次删除的文件。这就意味你可以恢复在某个时刻所删除的文件。

举个例子:

时间点动作Trash内容
12:40回收站清空empty
12:41删除fruit.datafruit.data
12:42重新上传fruit.data且再次删除fruit.datafruit.data,fruit.data1446352935186
12:45重新上传fruit.data且再次删除fruit.datafruit.data,fruit.data1446352935186,fruit.data1446353100390
12:50回收站清空empty

根据上表,在12:41第二次删除friut.data,回收站中出现了fruit.‍data1446352935186‍,后面的那串数字就是你删除时刻的时间戳。那么我们就可在垃圾回收站清空之前,恢复12:41或12:45删除的文件。

结合hive的使用,一般会有很多定时任务向hive中插入更新数据,那么.Trash中针对某个table就会有很多个版本的存在,若想查看某个时刻的数据,只要在Trash中把该时间的数据恢复即可,针对误删特别有用。

到此,相信大家对“怎么用HDFS恢复被删除的文件”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI