扇区虚拟机:服务器存储瘫痪数据恢复成功案例-服务器数据恢复
【温馨提醒】本文收集整理于互联网,不确保内容真实性和质量度,仅供参考!若有服务器产品相关问题,请咨询[YINGSOO]在线客服,获取专业解答!
【畅销产品】加拿大物理服务器价格 | 俄罗斯物理服务器价格 | 法国物理服务器价格 | 俄罗斯物理服务器价格
【精选文章】站群服务器选哪个节点更合适?性价比之王非它莫属! | 服务器是什么?服务器长什么样子的?
一、服务器数据恢复故障描述
机房突然断电导致整个存储瘫痪,加电后存储依然无法使用。经过用户方工程师诊断后认为是断电导致存储阵列损坏。
整个存储是由12块日立硬盘(3t sAs硬盘)组成的RAid-6磁盘阵列,被分成一个卷,分配给几台Vmware的esXi主机做共享存储。整个卷中存放了大量的windows虚拟机,虚拟机基本都是模板创建的,因此系统盘都统一为160g。数据盘大小不确定,并且数据盘都是精简模式。
二、服务器数据恢复备份数据
将故障存储的所有磁盘和备份sss数据的目标磁盘连入到一台windows server 2008的服务器上。故障磁盘都设为脱机(只读)状态,在专业工具winHex下看到连接状态如下图所示:(图中Hd1-Hd12为目标备份磁盘,Hd13-Hd24为源故障磁盘,型号为HUs723030ALs640):
图一:
使用winHex 对Hd13-Hd24以底层方式读取扇区,发现了大量损坏扇区。初步判断可能是这种硬盘的读取机制与常见的硬盘不一样。尝试更换操作主机,更换HbA卡,更换扩展柜,更换为Linux操作系统,均呈现相同故障。与用户方工程师联系,对方回应此控制器对磁盘没有特殊要求。
使用专业工具对硬盘损坏扇区的分布规律进行检测,发现如下规则:
1、损坏扇区分布以256个扇区为单位。2、除损坏扇区片断的起始位置不固定外,后面的损坏扇区都是以2816个扇区为间隔。
所有磁盘的损坏扇区分布如下表(只列出前3个损坏扇区):
临时写了个小程序,对每个磁盘的损坏扇区做绕过处理。用此程序镜像完所有盘的数据。
三、服务器数据恢复故障分析
1、分析损坏扇区
仔细分析损坏扇区发现,损坏扇区呈规律性出现。
-每段损坏扇区区域大小总为256。-损坏扇区分布为固定区域,每跳过11个256扇区遇到一个坏的256扇区。-损坏扇区的位置一直存在于RAid的p校验或Q校验区域。-所有硬盘中只有10号盘中有一个自然坏道。
2、分析分区大小
对Hd13、Hd23、Hd24的0-2扇区做分析,可知分区大小为52735352798扇区,此大小按RAid-6的模式计算,除以9,等于5859483644扇区,与物理硬盘大小1049524,和ds800控制器中保留的RAid信息区域大小吻合;同时根据物理硬盘底层表现,分区表大小为512字节,后面无8字节校验,大量的0扇区也无8字节校验。故可知,原存储并未启用存储中常用的dA技术(520字节扇区)。
分区大小如下图(gpt分区表项底层表现,涂色部分表示分区大小,单位512字节扇区,64bit):
图二:
四、重组RAid
1、分析RAid结构
存储使用的是标准的RAid-6阵列,接下来只需要分析出RAid 成员数量以及RAid的走向就可以重组RAid。
-分析RAid条带大小
整个存储被分成一个大的卷,分配给几台esXi做共享存储,因此卷的文件系统肯定是VmFs文件系统。而VmFs卷中又有存放了大量的windows 虚拟机。windows虚拟机中大多使用的是ntFs文件系统,因此可以根据ntFs中的mFt的顺序分析出RAid条带的大小以及RAid的走向。
-分析RAid是否存在掉线盘
镜像完所有磁盘。后发现最后一块硬盘中并没有像其他硬盘一样有大量的坏道。其中有大量未损坏扇区,这些未损坏扇区大多是全0扇区。因此可以判断这块硬盘是热备盘。
2、重组RAid
根据分析出来的RAid结构重组RAid,能看到目录结构。但是不确定是否为最新状态,检测几个虚拟机发现有部分虚拟机正常,但也有很多虚拟机数据异常。初步判断RAid中存在掉线的磁盘,依次将RAid中的每一块磁盘踢掉,然后查看刚才数据异常的地方,未果。又仔细分析底层数据发现问题不是出在RAid层面,而是出在VmFs文件系统上。VmFs文件系统如果大于16tb的话会存在一些其他的记录信息,因此在组建RAid的时候需要跳过这些记录信息。再次重组RAid,查看以前数据异常的地方可以对上了。针对其中的一台虚拟机做验证,将所有磁盘加入RiAd中后,这台虚拟机是可以启动的,但缺盘的情况下启动有问题。因此判断整个RAid处在不缺盘的状态为最佳。
五、验证数据
1、验证虚拟机;针对用户较为重要的虚拟机做验证,发现虚拟机大多都可以开机,可以进入登陆界面。有部分虚拟机开机蓝屏或开机检测磁盘,但是光盘[香港云服务器购买]修复之后都可以启动。部分虚拟机现象开机如下:
图三:
2、验证数据库;针对重要的虚拟机中的数据库做验证,发现数据库都正常。其中有一个数据库,据用户描述是缺少部分数据,但是经过仔细核对后发现这些数据在数据库中本来就不存在。通过查询 master 数据库中的系统视图,查出原来的所有数据库信息如下:
图四:
3、检测整个VmFs卷是否完整;由于虚拟机的数量很多,每台都验证的话,所需的时间会很长,因此我们对整个VmFs卷做检测。在检测VmFs卷的过程中发现有部分虚拟机或虚拟机的文件被破坏。列表如下:
图五:
六、恢复数据
1、生成数据;本公司工程师跟客户沟通并且描述了目前恢复的情况。用户经过对几台重要的虚拟机验证后,用户反应恢复的数据可以接受,接着本公司工程师立即着手准备恢复所有数据。
先准备目标磁盘,使用一台dell 的md 1200加上11块3t的硬盘组成一个RAid阵列。接着将重组的RAid数据镜像到目标阵列上。然后利用专业的工具UFs解析整个VmFs文件系统。
2、尝试挂载恢复的VmFs卷;将恢复好的VmFs卷连接到我们的虚拟化环境中的一台esXi5.5主机上,尝试将其挂载到的esXi5.5的环境中。但是由于版本(客户的esXi主机是5.0版本)原因或VmFs本身有损坏,导致其挂载不成功。继续尝试使用esXi的命令挂载也不成功,于是放弃挂载VmFs卷。
七、移交数据
由于时间紧迫,先安排本公司工程师将md 1200 阵列上的数据带到用户现场。然后使用专业工具”UFs”依次导出VmFs卷中的虚拟机。
1、将md 1200阵列上的数据通过HbA卡连接到用户的Vcenter服务器上。
2、在Vcenter服务器安装“UFs”工具,然后使用“UFs”工具解释VmFs卷。
3、使用“UFs”工具将VmFs卷中的虚拟机导入到Vcenter服务[香港站群主机]器上。
4、使用Vcenter的上传功能将虚拟机上传到esXi的存储中。
5、接着将上传完的虚拟机添加到清单,开机验证即可。
6、如果有虚拟机开机有问题,则尝试使用命令行模式修复。或者重建虚拟机并将恢复的虚拟机磁盘(既VmdK文件)拷贝过去。
7、由于部分虚拟机的数据盘很大,而数据很少。像这种情况就可以直接导出数据,然后新建一个虚拟磁盘,最后将导出的数据拷贝至新建的虚拟磁盘中即可。
统计了一下整个存储中虚拟机的数量,大约有200台虚拟机。目前的情况只能通过上述方式将恢复的虚拟机一台一台的恢复到用户的esXi中。由于是通过网络传输,因此整个迁移的过程中网络是一个瓶颈。经过不断的调试以及更换主机最终还是无法达到一个理想的状态,由于时间紧张,最终还是决定在当前的环境迁移数据。
八、数据恢复总结
1、故障总结;所有磁盘坏道的规律如下表:
经过仔细分析后得出坏道的结论如下:
-除去sn:YHJ6LeUd上的一个自然坏道外,其余坏道均分布于RAid-6的Q校验块中。
-坏道区域多数表现为完整的256个扇区,正好当时创建RAid-6时的一个完整RAid块大小。
-活动区域表现为坏道,非活动区域坏道有可能不出现,如热备盘,上线不足10%,坏道数量就比其他在线盘少(热备盘的镜像4小时完成,其他有坏道盘大概花费40小时)
-其他非Q校验区域完好,无任何故障。
结论:
通常情况,经如上坏道规则表现可推断,坏道为控制器生成Q校验,向硬盘下达io指令时,可能表现为非标指令,硬盘内部处理异常,导致出现规律性坏道。
2、数据恢复总结;数据恢复过程中由于坏道数量太多,以致备份数据时花费了很长世间。整个存储是由坏道引起的,导致最终恢复的数据有部分破坏,但不影响整体数据,最终的结果也在可接受范围内。
整个恢复过程,用户方要求紧急,我方也安排工程师加班加点,最终在最短的时间内将数据恢复出来。后续的数据迁移过程中由我方工程师和用户方工程师配合完成。
什么是公有云_私有云有何区别
随着云计算技术水平的发展,诞生了诸如云主机等一系列基于云计算的产品,使得我们已经步入了云计算时代,而我们在依赖云计算提供便捷的同时,都在思考云计算到底是什么?什么是公有云和私有云?二者又有何区别?今天,就随小编一起来了解一下吧。
首先,先从概念上来区分公有云和私有云。
公有云:通常指第三方提供商为用户提供的能够使用的云,公有云一般可通过Internet使用,可能是免费或成本低廉的,公有云的核心属性是共享资源服务。
私有云:是为一个客户单独使用而进行构建的,是对数据、安全性和服务质量的有效措施。并可以控制在此基础设施上部署应用程序的方式。私有云可部署在企业数据中心的防火墙内,也可以[香港主机高防]将它们部署在一个安全的主机托管场所,私[计算器价格]有云的核心属性是专有资源。
其次,公有云和私有云有哪些区别。
1、云建设地点不同
公有云:互联网上发布的云计算服务;
私有云:企业内部(专网)发布的云服务。
2、云服务的协议开发程序不同
公有云:协议开放的云计算服务,不需要专有的客户端软件解析。号称nosoftware,所有应用都是以服务的形式提供给用户的,而不是以软件包的形式提供。
私有云:微软的“云端(云+端)”,最终用户需要有专用的软件。
3、服务器对象不同
公有云:则是针对外部客户,通过网络方式提供可扩展的弹性服务。
私有云:为“一个”客户单独使用而构建的,可以有效的对数据、安全性和服务质量进行控制。
YINGSOO:https://www.yingsoo.com
热门文章:【独享100m】【企业如何根据数据中心的需求选择服务器】【有关网站服务器托管问题解答】【站群服务器选哪个节点更合适】【香港高防服务器怎么样】【国外服务器出租需谨记的四点】【计算服务器】【手游服务器】【大型游戏服务器】【北京服务器托管】【高防cdn服务器】【香港服务器托管一般怎么收费】【邮件服务器怎么搭】【美国虚拟主机购买】【阿里云服务器怎么用】【服务器托管服务商哪家好】【三种方法区分独立服务器和VPS服务器】【香港优质线路服务器使用时要注意】【YINGSOO香港服务器特点介绍】【云服务器购买指南】【美国公有云服务商】【企业租用大带宽】【贵州服务器租用】【服务器维护方案】【宿迁BGP】【云服务器环境】【服务器文件】【十大云服务器】【美国高配稳定服务器如何租用】【饥荒联机版服务器】
韩国云服务器出租控制面板自主管理,5分钟交付,KT高品质机房,平均延迟低至80ms,2019年韩国云服务器出租销量再度破表,1200家企业共同选择,高达95%的续约率印证YINGSOO品质
https://www.yingsoo.com/products/cloud-kr.html
海外双线云服务器租用,YINGSOO国外云服务器套餐,限时特惠,注册满减,助力企业出海,YINGSOO国外云服务器安全,稳定,易用,弹性扩展,按需配置,3天免费试用,7x24在线支持
版权声明:本站文章来源标注为YINGSOO的内容版权均为本站所有,欢迎引用、转载,请保持原文完整并注明来源及原文链接。禁止复制或仿造本网站,禁止在非www.yingsoo.com所属的服务器上建立镜像,否则将依法追究法律责任。本站部分内容来源于网友推荐、互联网收集整理而来,仅供学习参考,不代表本站立场,如有内容涉嫌侵权,请联系alex-e#qq.com处理。