Linux 磁盘故障定位与修复实操指南
一、快速定位与判断
二、常见故障场景与处理
| 场景与 dmesg 特征 | 处理要点 |
|---|---|
| 文件系统只读(EXT4-fs 报“Couldn’t remount RDWR … unprocessed orphan inode list”) | 先备份关键数据;在救援/单用户模式对分区执行 fsck(如 fsck -y /dev/mapper/vg0-root),必要时升级 e2fsck 版本后再修复;修复完成再正常挂载。 |
| SMART 健康为 FAILING 或 Reallocated/Pending 不为 0 | 立即全量备份;准备更换磁盘;如为阵列,按阵列流程剔除/更换故障盘并重建。 |
| 大量 “Buffer I/O error / I/O error / Unrecovered read error” | 先备份;卸载后运行只读坏道扫描:badblocks -s -v -o bb.log /dev/sdX;若坏道极少且为逻辑错误,可在离线、已备份前提下用 badblocks -w 重写尝试修复;否则视为物理坏道,隔离或更换。 |
| “UnrecovData 10B8B BadCRC / READ FPDMA QUEUED / hard resetting link” | 高概率为链路问题(SATA 线、电源线、背板、控制器兼容性);优先更换高质量 SATA 线、检查电源与接口、更新驱动/固件;排除后再评估盘体健康。 |
| 根分区无法卸载导致无法 fsck | 进入救援模式或使用 LiveCD/救援系统,对相应逻辑卷或分区执行离线 fsck。 |
三、标准修复流程
四、关键命令速查
五、风险提示