CentOS 清理重复文件的识别机制与工具
识别原理
常用工具与识别方式
rdfind
rdfind /pathrdfind -dryrun true /pathfdupes
fdupes -r -S /pathfdupes -r -m /pathFSlint / fslint
Shell 脚本 + find + md5sum(通用方法)
find "/path" -type f -print0 | sort -z | xargs -0 md5sum > /tmp/md5sums.txtawk '{print $1}' /tmp/md5sums.txt | sort | uniq -d识别后处理的安全建议
rdfind -dryrun true /path 或 fdupes -r -m /path,仅查看重复清单与统计,不执行任何删除或链接操作。rdfind -makehardlinks true /path 或 -makesymlinks true)。