- 相關(guān)推薦
交換機故障排查常見(jiàn)方法與分析原則
在日常學(xué)習、工作和生活中,大家對交換機都再熟悉不過(guò)了吧,下面是小編為大家整理的交換機故障排查常見(jiàn)方法與分析原則,希望對大家有所幫助。
交換機故障排查常見(jiàn)方法與分析原則
交換機的故障多種多樣,不同的故障有不同的表現形式。故障分析時(shí)要通過(guò)各種現象靈活運用排除方法(如排除法、對比法、替換法),找出故障所在,并及時(shí)排除。
1.排除法
當我們面對故障現象并分析問(wèn)題時(shí),無(wú)意中就已經(jīng)學(xué)會(huì )使用排除法來(lái)確定發(fā)生故障的方向了。這種方法是指依據所觀(guān)察到的故障現象,盡可能全面地列舉出所有可能發(fā)生的故障,然后逐個(gè)分析、排除。在排除時(shí)要遵循由簡(jiǎn)到繁的原則,提高效率。使用這種方法可以應付各種各樣的故障,但維護人員需要有較強的邏輯思維,對交換機知識有全面深入的了解。
2.對比法
所謂對比法,就是利用現有的、相同型號的且能夠正常運行的交換機作為參考對象,和故障交換機之間進(jìn)行對比,從而找出故障點(diǎn)。這種方法簡(jiǎn)單有效,尤其是系統配置上的故障,只要簡(jiǎn)單地對比一下就能找出配置的不同點(diǎn),但是有時(shí)要找一臺型號相同、配置相同的交換機也不是一件容易的事。
3.替換法
這是最常用的方法,也是在維修電腦中使用頻率較高的方法。替換法是指使用正常的交換機部件來(lái)替換可能有故障的部件,從而找出故障點(diǎn)的方法。它主要用于硬件故障的診斷,但需要注意的是,替換的部件必須是相同品牌、相同型號的同類(lèi)交換機才行。
當然為了使排障工作有章可循,可以在故障分析時(shí),應按照以下的原則來(lái)分析。
1.由外而內
如果交換機存在故障,我們可以先從外部的各種指示燈上辨別,然后根據故障指示,再來(lái)檢查內部的相應部件是否存在問(wèn)題。比如POWER LED為綠燈表示電源供應正常,熄滅表示沒(méi)有電源供應;LINK LEDs為黃色表示現在該連接工作在10Mb/s,綠色表示為100 Mb/s,熄滅表示沒(méi)有連接,閃爍表示端口被管理員手動(dòng)關(guān)閉;RDP LED表示冗余電源;MGMT LED表示管理員模塊。無(wú)論能否從外面的出故障所在,都必須登錄交換機以確定具體的故障所在,并進(jìn)行相應的排障措施。
2.由軟到硬
發(fā)生故障,誰(shuí)都不想動(dòng)不動(dòng)就那螺絲刀去先拆了交換機再說(shuō),所以在檢查時(shí),總是先從系統配置或系統軟件上著(zhù)手進(jìn)行排查。如果軟件上不能解決問(wèn)題,那就是硬件有問(wèn)題了。比如某端口不好用,那我們可以先檢查用戶(hù)所連接的端口是否不在相應的VLAN中,或者該端口是否被其他的管理員關(guān)閉,或者配置上的其他原因。如果排除了系統和配置上的各種可能,那就可以懷疑到真正的問(wèn)題所在——硬件故障。
3.先易后難
在遇到故障分析較復雜時(shí),必須先從簡(jiǎn)單操作或配置來(lái)著(zhù)手排除。這樣可以加快故障排除的速度,提高效率。
總結
由于交換機故障現象多種多樣,沒(méi)有固定的排除步驟,而有的故障往往具有明確的方向性,一眼就能識別得出。所以只能根據具體情況具體分析了,所以如果希望能夠成為交換機故障的排除高手,就一定要在日常工作中積累經(jīng)驗,每弄好一個(gè)問(wèn)題都用心的去回顧問(wèn)題根源以及解決方法。這樣才能不斷的提高自己。
交換機故障排查常見(jiàn)方法與分析原則 網(wǎng)絡(luò )知識
一、交換機硬件故障:
交換機故障一般可以分為硬件故障和軟件故障兩大類(lèi)。硬件故障主要指交換機電源、背板、模塊、端口 等部件的故障,可以分為以下幾類(lèi)。
。1)電源故障:
由于外部供電不穩定,或者電源線(xiàn)路老化、靜電、雷擊等原因導致電源損壞或者風(fēng)扇停止,從而不能正常工作。由于電源緣故而導致機內其他部件損壞的事情也經(jīng)常發(fā)生。
針對這類(lèi)故障,首先應該做好外部電源的供應工作,通過(guò)引入獨立的電力線(xiàn)來(lái)提供獨立的電源,并添加穩壓器來(lái)避免瞬間高壓或低壓現象。一般來(lái)說(shuō),有兩路電供電,但由于各方面的原因,不可能為每臺交換機提供雙路供電,可以添加UPS(不間斷電源)來(lái)保證交換機的正常供電,最好使用提供穩壓功能的UPS。另外還要在機房?jì)仍O置專(zhuān)業(yè)的避雷措施,來(lái)避免雷電對交換機的傷害。
。2)端口故障:
這是最常見(jiàn)的硬件故障,無(wú)論是光纖端口還是雙絞線(xiàn)的RJ-45端口,在插拔接口時(shí)一定要小心。如果不小心把光纖插頭弄臟,可能導致光纖端口污染而不能正常通信。我們經(jīng)?吹胶芏嗳讼矚g帶電插拔接頭,理論上講是可以的,但是這樣也無(wú)意中增加了端口的故障發(fā)生率。在搬運時(shí)不小心,也可能導致端口物理?yè)p壞。如果購買(mǎi)的水晶頭尺寸偏大,插入交換機時(shí),也容易破壞端口。此外,如果接在端口上的雙絞線(xiàn)有一段暴露在室外,萬(wàn)一這根電纜被雷電擊中,就會(huì )導致所連交換機端口被擊壞,或者造成更加不可預料的損傷。
一般情況下,端口故障是某一個(gè)或者幾個(gè)端口損壞。所以,在排除了端口所連計算機的故障后,可以通過(guò)更換所連端口,來(lái)判斷其是否損壞。遇到此類(lèi)故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果端口確實(shí)被損壞,那就只能更換端口了。
。3)模塊故障:
交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴展模塊等。這些模塊發(fā)生故障的機率很小,不過(guò)一旦出現問(wèn)題,就會(huì )遭受巨大的經(jīng)濟損失。如果插拔模塊時(shí)不小心,或者搬運交換機時(shí)受到碰撞,或者電源不穩定等情況,都可能導致此類(lèi)故障的發(fā)生。
當然上面提到的這3個(gè)模塊都有外部接口,比較容易辨認,有的還可以通過(guò)模塊上的指示燈來(lái)辨別故障。比如:堆疊模塊上有一個(gè)扁平的梯形端口,或者有的交換機上是一個(gè)類(lèi)似于USB的接口。管理模塊上有一個(gè)CONSOLE口,用于和網(wǎng)管計算機建立連接,方便管理。如果擴展模塊是光纖連接的話(huà),會(huì )有一對光纖接口。
在排除此類(lèi)故障時(shí),首先確保交換機及模塊的電源正常供應,然后檢查各個(gè)模塊是否插在正確的位置上,最后檢查連接模塊的線(xiàn)纜是否正常。在連接管理模塊時(shí),還要考慮它是否采用規定的連接速率,是否有奇偶校驗,是否有數據流控制等因素。連接擴展模塊時(shí),需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有一個(gè),那就是應當立即聯(lián)系供應商給以更換。
。4)背板故障:
交換機的各個(gè)模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會(huì )造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導致機內溫度升高,致使元器件燒壞。
在外部電源正常供電的情況下,如果交換機的各個(gè)內部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況唯一的辦法就是更換背板了。但硬件更新后,同一名稱(chēng)的電路板塊可能有多種不同的型號。在一般情況下,新型號電路板的功能會(huì )兼容舊型號電路板的功能。但舊型號的電路板的功能,就不一定能兼容新型號電路板的功能了。
。5)線(xiàn)纜故障:
連接電纜和配線(xiàn)架的跳線(xiàn)是用來(lái)連接模塊、機架和設備用的。如果這些連接電纜內的纜芯或跳線(xiàn)發(fā)生了短路、斷路或虛接,就會(huì )形成通信系統的故障。
從上面的幾種硬件故障來(lái)看,機房環(huán)境不佳極易導致各種硬件故障,所以在建設機房時(shí),必須先做好防雷接地及供電電源、室內溫度、室內濕度、防電磁干擾、防靜電等環(huán)境的建設,為網(wǎng)絡(luò )設備的正常工作提供良好的環(huán)境。
二、交換機的軟件故障:
交換機的軟件故障是指系統及其配置上的故障,它可以分為以下幾類(lèi)。
。1)系統錯誤:
程序BUG:軟件程序設計存在著(zhù)缺陷。交換機系統是硬件和軟件的結合體。在交換機內部有一個(gè)可刷新的只讀存儲器,它保存的是這臺交換機所必需的軟件系統。由于當時(shí)設計的原因,存在一些漏洞,在條件合適時(shí),會(huì )導致交換機滿(mǎn)載、丟包、錯包等情況的發(fā)生。
對于此類(lèi)問(wèn)題,我們需要養成經(jīng)常瀏覽設備廠(chǎng)商網(wǎng)站的習慣,如果有新的系統推出或者新的補丁,請及時(shí)更新。
。2)配置不當:
由于各種交換機配置不一樣,網(wǎng)絡(luò )管理員往往在配置交換機時(shí)會(huì )出現配置錯誤。主要錯誤有:
1、系統數據錯誤:系統數據,包括軟件設置,用于對整個(gè)系統進(jìn)行定義。如系統數據出現錯誤,也會(huì )造成系統全方位的故障,對整個(gè)交換局產(chǎn)生影響。
2、局數據錯誤:局數據是根據交換局的具體情況而定義的。當局數據出現錯誤時(shí),也會(huì )對整個(gè)交換局產(chǎn)生影響。
3、用戶(hù)數據錯誤:用戶(hù)數據對每一個(gè)用戶(hù)的情況進(jìn)行定義,如果用戶(hù)數據被錯誤設置,會(huì )對某個(gè)用戶(hù)產(chǎn)生影響。
4、硬件設置不合適:硬件設置是為減少電路板的種類(lèi),而在電路板上設置的一組或幾組開(kāi)關(guān),用以定義該電路板的工作狀態(tài)或在系統中所處位置,如硬件設置得不正確,必會(huì )導致該電路板工作不正常。這類(lèi)故障有時(shí)很難發(fā)現,需要一定的經(jīng)驗積累。如果不能確定配置是否有問(wèn)題,請先恢復出廠(chǎng)默認配置,然后再一步一步地配置。最好在配置之前,先閱讀說(shuō)明書(shū)。
。3)外部因素:
由于病毒或者黑客攻擊等情況的存在,有可能某臺主機向所連接的端口發(fā)送大量不符合封裝規則的數據包,造成交換機處理器過(guò)分繁忙,致使數據包來(lái)不及轉發(fā),進(jìn)而導致緩沖區溢出產(chǎn)生丟包現象。還有一種情況就是廣播風(fēng)暴,它不僅會(huì )占用大量的網(wǎng)絡(luò )帶寬,而且還將占用大量的CPU處理時(shí)間。網(wǎng)絡(luò )如果長(cháng)時(shí)間被大量廣播數據包所占用,正常的點(diǎn)對通信就無(wú)法正常進(jìn)行,網(wǎng)絡(luò )速度就會(huì )變慢或者癱瘓。
總之,軟件故障應該比硬件故障較難查找,解決問(wèn)題時(shí),可能不需要花費過(guò)多的金錢(qián),而需要較多的時(shí)間。要網(wǎng)絡(luò )管理員在平時(shí)的工作中養成記錄日志的習慣。每當發(fā)生故障時(shí),及時(shí)做好故障現象記錄、故障分析過(guò)程、故障解決方案、故障歸類(lèi)總結等工作,以積累自己的經(jīng)驗。每解決一個(gè)問(wèn)題后都用心的去回顧問(wèn)題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網(wǎng)絡(luò )管理的重任。
【交換機故障排查常見(jiàn)方法與分析原則】相關(guān)文章:
網(wǎng)絡(luò )常見(jiàn)故障分析及處理方法11-04
新手常見(jiàn)網(wǎng)絡(luò )的故障與排查08-27
光纖常見(jiàn)故障怎么排查06-20
常見(jiàn)的CPU故障及維護方法10-19
常見(jiàn)的網(wǎng)絡(luò )故障分析與處理04-15
顯卡常見(jiàn)故障案例分析05-13
排查電腦音箱常見(jiàn)故障的技巧08-13
膽機常見(jiàn)故障及維修方法10-21