- 相關(guān)推薦
怎么排除服務(wù)器中RAID5故障
但是,對HP的一些老服務(wù)器(如HP LH6000)數據的恢復與新服務(wù)器(如HP ProLian系列服務(wù)器)的數據恢復是不同的。所以不同的服務(wù)器對RAID 5故障的處理也是不同的。曾接觸過(guò)兩臺服務(wù)器因意外斷電而造成的RAID 5陣列卡數據故障,由于采用了不同的策略而解決了問(wèn)題。
故障修復
一臺是HP LH6000的服務(wù)器,4塊18GB的硬盤(pán)做成RAID 5磁盤(pán)陣列,其陣列卡是NetRaid;另一臺是HP ProLian ML370服務(wù)器,4塊146GB的硬盤(pán)做成RAID 5磁盤(pán)陣列,其陣列卡是Smart Array 642并帶有熱備份硬盤(pán)(Hot Spare)。兩者操作系統都為Window 2000,數據庫是Server 2000。
HP LH6000的故障如下: 一塊硬盤(pán)紅燈閃亮,機器還在正常運行,但沒(méi)有多久,系統就不能正常運行,這時(shí)才發(fā)現另一塊硬盤(pán)的紅燈也在閃亮。
解決辦法如下:
1.啟動(dòng)服務(wù)器,自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。查看陣列信息,發(fā)現硬盤(pán)狀態(tài)為Failed,運用修改配置將一硬盤(pán)強行設置成OnLine。重新啟動(dòng)服務(wù)器,在進(jìn)入系統前的硬件自檢時(shí)無(wú)效,啟動(dòng)失敗。
2.啟動(dòng)服務(wù)器,自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。選擇磁盤(pán)陣列,將原來(lái)OnLine掛起來(lái)的硬盤(pán)手工Fail掉,然后再把另一塊Failed的硬盤(pán)手工設置成OnLine,重新啟動(dòng)服務(wù)器就可以進(jìn)入系統了。
3.查看系統及數據庫都運行正常后,再進(jìn)陣列配置工具把Failed的硬盤(pán)手工設置成Rebuild,100%完成重建后再重啟服務(wù)器,所有的陣列及系統都恢復原狀了。
另一臺運行ERP系統的服務(wù)器(HP ProLiant ML370),由4塊146GB熱插拔硬盤(pán)通過(guò)RAID卡(Smart array陣列卡)配置成一臺具有RAID 5級的磁盤(pán)陣列。其中一塊硬盤(pán)在運行過(guò)程中突然出現故障。服務(wù)器RAID 5自動(dòng)啟用熱備份硬盤(pán)(Hot Spare),對損壞硬盤(pán)進(jìn)行邏輯替代。整個(gè)硬盤(pán)的數據訪(fǎng)問(wèn)任務(wù)仍然完整地運行在原來(lái)的讀寫(xiě)進(jìn)程序列中,應用程序和數據庫沒(méi)有發(fā)生影響。
通過(guò)HP自帶的ACU工具查看硬盤(pán)狀態(tài)進(jìn)行檢查,發(fā)現紅燈示警的硬盤(pán)處于脫機狀態(tài)。如果HP ProLiant服務(wù)器中的Raid 5有兩塊硬盤(pán)出現亮紅燈時(shí),表明系統已經(jīng)崩潰,數據庫也就不能訪(fǎng)問(wèn),但系統不會(huì )自動(dòng)關(guān)機。當第二塊硬盤(pán)亮紅燈后,用常規的手段是不能恢復數據的,只有付費找專(zhuān)業(yè)的第三方數據恢復公司恢復數據。
因此,對惠普老型號HP LH6000系列服務(wù)器來(lái)說(shuō),陣列的設計方面與現在HP ProLiant系列服務(wù)器的陣列有很多不同。就操作方法看,HP LH6000服務(wù)器的陣列操作方法有很多可選項,包括陣列失敗后可以重新刪除陣列并重建等,初始化也是手工選擇的。但是HP ProLiant系列服務(wù)器陣列的初始化是在配置陣列后自動(dòng)在后臺執行的,所以ProLiant系列服務(wù)器在陣列出錯后是不能重配陣列的。
HP LH6000服務(wù)器會(huì )因其他意外的原因導致陣列中的磁盤(pán)出現掉線(xiàn)現象,可讓維護人員手工選擇用Online或Offline、Rebuild等來(lái)恢復數據。但是現在的HP ProLiant系列服務(wù)器在陣列中不會(huì )再出現像老的服務(wù)器那樣有磁盤(pán)掉線(xiàn)的現象,所以硬盤(pán)亮紅燈的時(shí)候,這塊硬盤(pán)基本上是損壞了需要更換。當然可以選擇熱插拔硬盤(pán)來(lái)重建(Rebuild),看硬盤(pán)還能不能再用一段時(shí)間。
做好技術(shù)后備
從以上兩個(gè)例子可以看出,同一品牌、不同系列的服務(wù)器因其內含技術(shù)的不同,其Raid 5磁盤(pán)故障的排除也是不同的。但經(jīng)過(guò)重建(Rebuild)數據后,數據被拯救了,從中可以得出以下經(jīng)驗:
我們認為任何先進(jìn)的技術(shù)手段都不是萬(wàn)無(wú)一失的。如果要確保數據安全,就一定要做好備份工作,最好每天做一次數據庫的異地備份。至少備用一塊新硬盤(pán)。需要指出的是,加入陣列的硬盤(pán)必須大于或等于故障硬盤(pán)的容量。
如果條件允許,推薦“RAID 5+熱備盤(pán)”的陣列創(chuàng )建方案。這樣在數據丟失前,我們有兩次更換硬盤(pán)的機會(huì )。對于一般的應用,只用RAID 5即可,可以同時(shí)提供數據的存取性能、可靠性和最大的磁盤(pán)空間。
管理員必須經(jīng)常觀(guān)察陣列的狀態(tài),包括查看磁盤(pán)陣列的黃色警告燈和管理軟件里的驅動(dòng)器狀態(tài)。出現故障,及時(shí)排除。無(wú)論是什么級別的陣列,在排除故障前,都應做好數據備份。
【怎么排除服務(wù)器中RAID5故障】相關(guān)文章:
硬盤(pán)引導故障怎么排除05-09
怎么排除顯卡的花屏故障10-11
電腦故障排除方法11-05
電腦故障排除的方法08-02
硬盤(pán)故障排除方法09-12
CPU故障的檢查及排除10-18
內存故障排除方法09-24
電工的故障排除技巧10-18
硬盤(pán)故障排除「實(shí)例」10-29
硬件故障如何排除09-23