发布信息

服务器存储数据恢复过程及解决方案

作者:软荐小编      2023-11-03 23:04:26     131

服务器数据恢复环境:

某品牌存储中,12块SAS硬盘组成RAID6,分为一个卷,分配给多台Vmware ESXI主机进行共享存储;

卷中存储一定数量的Windows虚拟机,数据磁盘均采用精简模式。

服务器存储故障:

机房断电后,存储不可用。 经管理员检查诊断,初步确定存储阵列因停电而瘫痪。 服务器管理员联系我们的数据恢复中心进行数据恢复。

服务器存储数据恢复流程:

1、服务器数据恢复工程师将故障存储的所有磁盘连接到一台Windows Server服务器上。 故障磁盘被设置为离线(只读)状态。 连接状态如下图所示:(图中HD1-HD12为目标备份盘,HD13-HD24为源故障盘):

虚拟系统数据能否恢复_虚拟化数据恢复_虚拟机文件怎么恢复 虚拟机数据恢复软件教程

北亚数据恢复-服务器存储RAID6数据恢复

2、使用工具低级读取HD13-HD24扇区时,发现大量损坏扇区。 初步判断该硬盘的读取机制比较独特。 我尝试更换运行主机、HBA卡、扩展柜、操作系统,还是出现同样的故障。 与服务器管理员沟通后得知,这个控制器其实对磁盘没有特殊要求。

3、使用专业工具检测硬盘上损坏扇区的分布规律,结果显示:

A。 损坏的扇区以256个扇区为单位分布。

b. 除了损坏扇区片段的起始位置不固定外,后续损坏扇区的间隔为2816个扇区。 所有磁盘上损坏扇区的分布如下(仅列出前3个损坏扇区):

虚拟化数据恢复_虚拟机文件怎么恢复 虚拟机数据恢复软件教程_虚拟系统数据能否恢复

北亚数据恢复-服务器存储RAID6数据恢复

北亚服务器数据恢复工程师临时写了一个小程序,跳过各个磁盘的损坏扇区,对所有磁盘上的数据进行镜像。

服务器存储故障分析:

1. 分析损坏的扇区。

通过对损坏扇区的分析发现,损坏扇区的出现是有规律的:每个损坏扇区的总面积为256个; 损坏扇区分布在固定区域,每跳过11 256个扇区,就会遇到一个坏256扇区。 损坏扇区的位置始终存在于RAID的P奇偶校验或Q奇偶校验区域中; 所有硬盘中,只有10号盘存在天然坏道。

2. 分析分区大小。

分析HD13、HD23、HD24的0-2扇区,发现分区大小与控制器中保留的RAID信息区大小一致。 根据物理硬盘底层性能,发现原来的存储没有启用存储常用的DA技术(520字节扇区)。

分区大小如下图(GPT分区表项的底层表示,彩色部分表示分区大小,单位是512字节扇区,64bit):

虚拟系统数据能否恢复_虚拟机文件怎么恢复 虚拟机数据恢复软件教程_虚拟化数据恢复

北亚数据恢复-服务器存储RAID6数据恢复

3. 重组RAID:

A。 分析RAID结构。

存储采用标准RAID6。 只需要获取RAID中的硬盘数量和RAID的方向即可对RAID进行重组。

b. 分析 RAID 条带大小。

整个存储被划分为一个卷,分配给多台ESXI机器进行共享存储。 卷的文件系统是VMFS文件系统,VMFS卷中存储了大量的Windows虚拟机。 大多数Windows虚拟机都使用NTFS文件系统,因此可以根据NTFS中的MFT序列来分析RAID条带的大小和RAID的方向。

C。 分析RAID中是否有掉盘。

对所有磁盘进行镜像后,发现最后一块硬盘并没有像其他硬盘那样有大量坏扇区,而是有大量未损坏扇区。 这些未损坏的扇区大部分都是0扇区,因此可以判断这块硬盘很热。 准备磁盘。

d. 重组RAID

根据分析得到的RAID信息,重新整理RAID。 重组后,可以看到目录结构,但不确定是否是最新状态。 服务器数据恢复工程师随机测试了几台虚拟机,发现部分虚拟机正常。 他们最初确定 RAID 中存在断开连接的磁盘。 我依次把RAID中的各个磁盘踢掉,然后检查哪里数据异常,但没有发现问题。 仔细分析底层数据发现问题不在RAID层面,而在VMFS文件系统。 如果VMFS文件系统大于16TB,还会有一些其他记录信息,因此在设置RAID时需要跳过这些记录信息。 重新整理RAID后虚拟机文件怎么恢复 虚拟机数据恢复软件教程,我验证了其中一台虚拟机,发现将所有磁盘添加到RIAD后,该虚拟机可以启动。 但是,当磁盘丢失时,启动就会出现问题。 因此可以判断RAID没有缺盘。 处于最佳状态。

4、验证数据:

A。 验证虚拟机。

对比较重要的虚拟机进行验证后,发现大部分虚拟机都可以启动进入登录界面; 有些虚拟机启动时蓝屏或者启动时检测到磁盘,用光盘修复后可以启动。

部分虚拟机启动方式如下:

虚拟机文件怎么恢复 虚拟机数据恢复软件教程_虚拟系统数据能否恢复_虚拟化数据恢复

北亚数据恢复-服务器存储RAID6数据恢复

b. 验证数据库。

对重要虚拟机中的数据库进行验证,没有发现任何问题,只是其中一个数据库丢失了一些数据。 仔细检查后发现,数据库中并不存在这些数据。 通过查询master数据库中的系统视图,发现所有原始数据库信息如下:

虚拟机文件怎么恢复 虚拟机数据恢复软件教程_虚拟化数据恢复_虚拟系统数据能否恢复

北亚数据恢复-服务器存储RAID6数据恢复

C。 检查整个VMFS卷是否完整。

由于虚拟机数量较多,验证每台虚拟机的时间会很长。 我们检查了整个VMFS卷,发现部分虚拟机或虚拟机文件损坏。 名单如下:

虚拟化数据恢复_虚拟机文件怎么恢复 虚拟机数据恢复软件教程_虚拟系统数据能否恢复

北亚数据恢复-服务器存储RAID6数据恢复

5、恢复数据:

A。 服务器数据恢复工程师与管理员沟通了当前数据恢复情况。 管理员验证了几个重要的虚拟机后,用户反映恢复的数据没有问题。 数据恢复工程师立即着手恢复所有数据。

b. 准备目标阵列,将重组后的RAID数据镜像到目标阵列。 然后使用工具解析整个VMFS文件系统。 由于有些虚拟机的数据盘很大,但数据却很少,可以直接导出数据并创建新的虚拟盘虚拟机文件怎么恢复 虚拟机数据恢复软件教程,最后将导出的数据复制到新创建的虚拟盘中。

C。 使用上述方法将恢复的虚拟机一一恢复到用户的ESXI中。 后续的数据迁移过程由北亚数据恢复工程师和用户工程师完成,这里不再赘述。

数据恢复结果:

本例中,存储故障是由坏道引起的,最终恢复的数据是部分损坏的,但并没有影响整体数据,最终结果在可以接受的范围内。

相关内容 查看全部