某客户戴尔R730服务器,操作系统为Windows Server 2012,ERP公司的技术人员在运维过程中,经常向我司技术人员反馈:微软自带远程桌面,在输入用户名和密码之后黑屏,无法登录进入桌面,我司技术人员通过anydesk工具发现可以远程操作服务器,但是速度非常,点一下鼠标需要等10秒甚至30秒才有响应,直接远程重启服务器后正常,但是第二天又会黑屏。。。
就这么忍受了一段时间,突然某一天,客户机房突然停电,服务器卡在启动界面,半小时也没进系统,赶到客户的机房一看,是下图所示状况:
系统提示磁盘错误,需要花费一个多小时来修复
微软时间,那是相当地不靠谱,它都提醒需要一个多小时,那我估计三小时也完不成,就算真进了系统,估计还是得换硬盘,与其等待,不如马上开始,直接按住电源键强制关机,开机后在合适的时机,按ctrl+R进入阵列卡管理界面,看到服务器有两组RAID5阵列,一组是由3块intel 512G固态硬盘组成,另外一组是由3块3T SAS硬盘组成,很显然,第一组是用来安装操作系统以及ERP应用软件,第二组是用来存储数据的,还好第二组阵列正常,感觉好了一点点,没那么慌了,毕竟数据无价嘛,第一组阵列中,有块固态硬盘显示missing,选择Force Online强制上线失败,看来得替换硬盘了,但是手边没硬盘啊,汗。。。
按照惯例,先插优盘进入WinPE,确认一下有没有什么需要备份的,由于之前提示需要花费一个多小时才能进入系统,为了节省时间,我把坏的固态硬盘直接拔掉了,然后用优盘启动服务器,没想到,还是非常慢,平时进PE只要一分钟,这次足足等了20分钟!进入PE之后,发现硬盘不能识别,安装阵列卡驱动后,正常识别,一看硬盘使用空间,更慌了,第二组机械硬盘做的阵列,逻辑硬盘,被分成两个区,里面空的!我滴个天哪,所有数据都在固态硬盘的阵列里面!是谁这么作死?把重要数据放到固态硬盘的!这个时候,我连打电话给ERP公司骂人的心情都没了,没办法了,赶紧备份吧,怕优盘写入速度慢,又到车里翻了个移动硬盘出来插上,开始备份,但是下图的备份速度说明,我真是想多了,优盘速度完全足够了,呵呵
果然是磁盘错误,重要数据必须要备份出来,那读写速度真是酸爽
是的,你没看错,传输速率0.29MiB/s,3~4G的文件,我都没心情计算时间,盯了5分钟屏幕,最低速度只有0.12MiB/s,最快0.33MiB/s,仰天长叹啊。。。收拾一下心情,开车回公司拿硬盘,翻了半天也没有512G固态,这大礼拜天的,到哪儿去拿个intel 512G固态啊,算了算了,拿个500G机械硬盘先顶上吧,读写速度是有点跟不上,但是至少有个硬盘能充当Hot Spare,这样系统应该能起来了。。。
回到机房还没备份完,好在等的时间不长,最起码ERP数据算是安全了, 仔细检查了一遍,幸亏没其他数据了,不然可能要在机房过夜了,这里蚊子很凶残的,我怕活不到明天早上!
把500G机械硬盘塞进去,重启服务器,再次进入阵列卡配置界面,把这块二等残废盘设置成Hot Spare,服务器顺利进入系统,机械硬盘所在的硬盘位指示灯,疯狂闪烁,我想它一定很忙吧,哈哈哈。。。紧接着,把数据拷回服务器,毫无疑问,肯定是拷到机械硬盘的那个阵列里面了,这个时候总算是有心情向ERP公司吐槽了,只是吐槽一下而已,心中的火早没了,而且过程还算顺利,心情不错,郑重提醒一下,也就算了,大家都不容易。对方远程桌面试了几次,没啥问题,速度很快,貌似一切正常,打道回府喽。。。
可是故事(事故)还没结束,第二天早上,ERP公司打来电话,远程桌面又黑屏了!
Anydesk远程登录服务器,黑屏!Anydesk竟然也黑屏,连续重试,无效!只能让技术员赶去机房看一下了。。。好不容易赶过去,发现桌面能进,那还好,先松了口气,看了一下任务管理器,又怒了,进程里面10来个远程桌面用户,占了很多内存,肯定又是ERP公司技术人员的坏习惯啊,估计远程桌面结束后即不注销又不断开,只是把窗口关掉,下一次另外一个人远程,就又开一个远程桌面,导致大量的程序跑在后台,系统能不卡吗?问了一遍,没一个人远程在线的,一下子全部强制注销了,再通知远程,顺利地连接进来了,但是好景不长,由于程序需要联合调试,第三个技术人员远程桌面的时候,又黑屏了,而且前面两位的远程桌面明显卡顿,并且注销后,再也无法登录,全部黑屏!
没完了这是!256G的内存,承受不了几个远程桌面?这不是笑话么?难道是我塞进去的机械硬盘跟不上固态硬盘的节奏,导致读写有错误?可能性不大啊,因为不开远程桌面的时候,操作系统正常,ERP软件也都正常啊,难道是内存错误?重启服务器,进入硬件检测界面,检测内存。。。刚检测10分钟,还没出报告呢,客户急急忙忙跑到机房,要求ERP不能中断,仓库正在收发货,产线等料下线,好吧,只能放弃检测,打开服务器机箱盖,把4条内存拔下来放手里摸了一遍,其中两条温度明显高一些,烫手,果断不插回去,只用两条内存开机。。。128G内存,跑得溜溜的,一个多月过去了,没啥问题,嘿嘿。 可是返修的内存为啥还没回来尼?!
万万没想到:微软远程桌面黑屏的元凶,竟然是内存!
鄙人从事IT行业20年,现在准备写一下IT相关的小技巧及小趣事,有兴趣的可以关注一下,谢谢!
路由