DELL POWEREDGE 2850服务器数据恢复
环境:
DELL POWEREDGE 2850服务器,
6块300G SCSI硬盘组成RAID5,
操作系统LINUX REDHAT, 电脑EXT3。
故障:
最早一块硬盘离线,管理员没发现,直到另一块硬盘掉线导致系统瘫痪才发现故障。联系DELL官方客服,对方建议将其中一块硬盘强制上线,但同时指出操作有风险。管理员将某盘强制上线后,发现操作系统启动异常,于是关掉服务器,联系北亚数据数据恢复中心寻求帮助。
北亚数据恢复
故障分析:
RAID5仅支持一块硬盘掉线的冗余保护,当两块硬盘先后离线后,RAID5无法通过运算提供完整数据块,RAID5便会下线。控制器为了稳定起见,只要有硬盘下线,便不会自动上线,这样不通过人为干预,RAID会进入瘫痪状态。通常情况下,因RAID控制器的敏感性,掉线的硬盘多数不会有严重的物理问题,一般情况下硬盘都是完好的(掉线是因为信号受阻,电源波动或控制器BUG等随机原因),所以数据恢复的可能性较高。强制上线具有较大的风险,如果上线错误,会导致控制器自动做出一些不可逆操作,如果再进入操作系统,因文件系统不一致,会启动修复,电脑 继而导致全部硬盘数据不一致,本案例即是属于此类问题。
数据恢复过程:
1、北亚数据恢复工程师备份所有硬盘,在备份后发现有多块硬盘已经存在坏道,只是RAID没有读到,暂时无下线。
2、北亚数据恢复工程师在备份中分析原来RAID的组成结构,构建虚拟RAID环境。
3、验电脑证RAID结构正确,修正部分后期破坏的结构后将数据导出到另一中间存储。
4、北亚数据恢复工程师重新用完好硬盘搭建DELL 2950上的新RAID5,将数据迁移至新RAID。
历时2天完成数据恢复。从上千万文件中抽样检测,绝大多数没有问题。
电脑