交換機(jī)常見故障解決辦法
交換機(jī)常見故障解決辦法
交換機(jī)的優(yōu)越性能和價(jià)格的大幅度下降,促使了交換機(jī)的迅速普及。網(wǎng)絡(luò)管理員在工作中經(jīng)常會(huì)遇到各種各樣的交換機(jī)故障,如何迅速、準(zhǔn)確地查出故障并排除故障呢?接下來(lái)是小編為大家收集的交換機(jī)常見故障解決辦法,希望能幫到大家。
交換機(jī)常見故障解決辦法
交換機(jī)的優(yōu)越性能和價(jià)格的大幅度下降,促使了交換機(jī)的迅速普及。網(wǎng)絡(luò)管理員在工作中經(jīng)常會(huì)遇到各種各樣的交換機(jī)故障,如何迅速、準(zhǔn)確地查出故障并排除故障呢?本文就常見的故障類型和排障步驟做一個(gè)簡(jiǎn)單的介紹。由于交換機(jī)在公司網(wǎng)絡(luò)中應(yīng)用范圍非常廣泛,從低端到中端,從中端到高端,幾乎涉及每個(gè)級(jí)別的產(chǎn)品,所以交換機(jī)發(fā)生故障的機(jī)率比路由器,硬件防火墻等要高很多,這也是為什么我們首先討論交換機(jī)故障的分類與排除故障步驟的原因。
一,交換機(jī)故障分類:
交換機(jī)故障一般可以分為硬件故障和軟件故障兩大類。硬件故障主要指交換機(jī)電源、背板、模塊、端口等部件的故障,可以分為以下幾類。
(1)電源故障:
由于外部供電不穩(wěn)定,或者電源線路老化或者雷擊等原因?qū)е码娫磽p壞或者風(fēng)扇停止,從而不能正常工作。由于電源緣故而導(dǎo)致機(jī)內(nèi)其他部件損壞的事情也經(jīng)常發(fā)生。
如果面板上的POWER指示燈是綠色的,就表示是正常的;如果該指示燈滅了,則說(shuō)明交換機(jī)沒有正常供電。這類問題很容易發(fā)現(xiàn),也很容易解決,同時(shí)也是最容易預(yù)防的。
針對(duì)這類故障,首先應(yīng)該做好外部電源的供應(yīng)工作,一般通過(guò)引入獨(dú)立的電力線來(lái)提供獨(dú)立的電源,并添加穩(wěn)壓器來(lái)避免瞬間高壓或低壓現(xiàn)象。如果條件允許,可以添加UPS(不間斷電源)來(lái)保證交換機(jī)的正常供電,有的UPS提供穩(wěn)壓功能,而有的沒有,選擇時(shí)要注意。在機(jī)房?jī)?nèi)設(shè)置專業(yè)的避雷措施,來(lái)避免雷電對(duì)交換機(jī)的傷害。現(xiàn)在有很多做避雷工程的專業(yè)公司,實(shí)施網(wǎng)絡(luò)布線時(shí)可以考慮。
(2)端口故障:
這是最常見的硬件故障,無(wú)論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時(shí)一定要小心。如果不小心把光纖插頭弄臟,可能導(dǎo)致光纖端口污染而不能正常通信。我們經(jīng)常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無(wú)意中增加了端口的故障發(fā)生率。在搬運(yùn)時(shí)不小心,也可能導(dǎo)致端口物理?yè)p壞。如果購(gòu)買的水晶頭尺寸偏大,插入交換機(jī)時(shí),也容易破壞端口。此外,如果接在端口上的雙絞線有一段暴露在室外,萬(wàn)一這根電纜被雷電擊中,就會(huì)導(dǎo)致所連交換機(jī)端口被擊壞,或者造成更加不可預(yù)料的損傷。
一般情況下,端口故障是某一個(gè)或者幾個(gè)端口損壞。所以,在排除了端口所連計(jì)算機(jī)的故障后,可以通過(guò)更換所連端口,來(lái)判斷其是否損壞。遇到此類故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果端口確實(shí)被損壞,那就只能更換端口了。
二,交換機(jī)的軟件故障:
交換機(jī)的軟件故障是指系統(tǒng)及其配置上的故障,它可以分為以下幾類。
(1)系統(tǒng)錯(cuò)誤:
交換機(jī)系統(tǒng)是硬件和軟件的結(jié)合體。在交換機(jī)內(nèi)部有一個(gè)可刷新的只讀存儲(chǔ)器,它保存的是這臺(tái)交換機(jī)所必需的軟件系統(tǒng)。這類錯(cuò)誤也和我們常見的 Windows、Linux一樣,由于當(dāng)時(shí)設(shè)計(jì)的原因,存在一些漏洞,在條件合適時(shí),會(huì)導(dǎo)致交換機(jī)滿載、丟包、錯(cuò)包等情況的發(fā)生。所以交換機(jī)系統(tǒng)提供了諸如Web、TFTP等方式來(lái)下載并更新系統(tǒng)。當(dāng)然在升級(jí)系統(tǒng)時(shí),也有可能發(fā)生錯(cuò)誤。
對(duì)于此類問題,我們需要養(yǎng)成經(jīng)常瀏覽設(shè)備廠商網(wǎng)站的習(xí)慣,如果有新的系統(tǒng)推出或者新的補(bǔ)丁,請(qǐng)及時(shí)更新。
(2)配置不當(dāng):
初學(xué)者對(duì)交換機(jī)不熟悉,或者由于各種交換機(jī)配置不一樣,管理員往往在配置交換機(jī)時(shí)會(huì)出現(xiàn)配置錯(cuò)誤。比如VLAN劃分不正確導(dǎo)致網(wǎng)絡(luò)不通,端口被錯(cuò)誤地關(guān)閉,交換機(jī)和網(wǎng)卡的模式配置不匹配等原因。這類故障有時(shí)很難發(fā)現(xiàn),需要一定的經(jīng)驗(yàn)積累。如果不能確保用戶的配置有問題,請(qǐng)先恢復(fù)出廠默認(rèn)配置,然后再一步一步地配置。最好在配置之前,先閱讀說(shuō)明書,這也是網(wǎng)管所要養(yǎng)成的習(xí)慣之一。每臺(tái)交換機(jī)都有詳細(xì)的安裝手冊(cè)、用戶手冊(cè),深入到每類模塊都有詳細(xì)的講解。由于很多交換機(jī)的手冊(cè)是用英文編寫的,所以英文不好的用戶可以向供應(yīng)商的工程師咨詢后再做具體配置。
(3)密碼丟失:
這可能是每個(gè)管理員都曾經(jīng)經(jīng)歷過(guò)的。一旦忘記密碼,都可以通過(guò)一定的操作步驟來(lái)恢復(fù)或者重置系統(tǒng)密碼。有的則比較簡(jiǎn)單,在交換機(jī)上按下一個(gè)按鈕就可以了。而有的則需要通過(guò)一定的操作步驟才能解決。
此類情況一般在人為遺忘或者交換機(jī)發(fā)生故障后導(dǎo)致數(shù)據(jù)丟失,才會(huì)發(fā)生。
(4)外部因素:
由于病毒或者黑客攻擊等情況的存在,有可能某臺(tái)主機(jī)向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成交換機(jī)處理器過(guò)分繁忙,致使數(shù)據(jù)包來(lái)不及轉(zhuǎn)發(fā),進(jìn)而導(dǎo)致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風(fēng)暴,它不僅會(huì)占用大量的網(wǎng)絡(luò)帶寬,而且還將占用大量的CPU處理時(shí)間。網(wǎng)絡(luò)如果長(zhǎng)時(shí)間被大量廣播數(shù)據(jù)包所占用,正常的點(diǎn)對(duì)通信就無(wú)法正常進(jìn)行,網(wǎng)絡(luò)速度就會(huì)變慢或者癱瘓。
一塊網(wǎng)卡或者一個(gè)端口發(fā)生故障,都有可能引發(fā)廣播風(fēng)暴。由于交換機(jī)只能分割沖突域,而不能分割廣播域(在沒有劃分VLAN的情況下),所以當(dāng)廣播包的數(shù)量占到通信總量的30%時(shí),網(wǎng)絡(luò)的傳輸效率就會(huì)明顯下降。
總的來(lái)說(shuō)軟件故障應(yīng)該比硬件故障較難查找,解決問題時(shí),可能不需要花費(fèi)過(guò)多的金錢,而需要較多的時(shí)間。最好在平時(shí)的工作中養(yǎng)成記錄日志的習(xí)慣。每當(dāng)發(fā)生故障時(shí),及時(shí)做好故障現(xiàn)象記錄、故障分析過(guò)程、故障解決方案、故障歸類總結(jié)等工作,以積累自己的經(jīng)驗(yàn)。比如有時(shí)在進(jìn)行配置時(shí),由于種種原因,當(dāng)時(shí)沒有對(duì)網(wǎng)絡(luò)產(chǎn)生影響或者沒有發(fā)現(xiàn)問題,但也許幾天以后問題就會(huì)逐漸顯現(xiàn)出來(lái)。如果有日志記錄,就可以聯(lián)想到是否前幾天的配置有錯(cuò)誤。由于很多時(shí)候都會(huì)忽略這一點(diǎn),以為是在其他方面出現(xiàn)問題,當(dāng)走了許多彎路之后,才找到問題所在。所以說(shuō)記錄日志及維護(hù)信息是非常必要的。
三 交換機(jī)故障的一般排障步驟:
交換機(jī)的故障多種多樣,不同的故障有不同的表現(xiàn)形式。故障分析時(shí)要通過(guò)各種現(xiàn)象靈活運(yùn)用排除方法(如排除發(fā)、對(duì)比法、替換法),找出故障所在,并及時(shí)排除。
(1)排除法:
當(dāng)我們面對(duì)故障現(xiàn)象并分析問題時(shí),無(wú)意中就已經(jīng)學(xué)會(huì)使用排除法來(lái)確定發(fā)生故障的方向了。這種方法是指依據(jù)所觀察到的故障現(xiàn)象,盡可能全面地列舉出所有可能發(fā)生的故障,然后逐個(gè)分析、排除。在排除時(shí)要遵循有簡(jiǎn)到繁的原則,提高效率。使用這種方法可以應(yīng)付各種各樣的故障,但維護(hù)人員需要有較強(qiáng)的邏輯思維,對(duì)交換機(jī)知識(shí)有全面深入的了解。
(2)對(duì)比法:
所謂對(duì)比法,就是利用現(xiàn)有的、相同型號(hào)的且能夠正常運(yùn)行的交換機(jī)作為參考對(duì)象,和故障交換機(jī)之間進(jìn)行對(duì)比,從而找出故障點(diǎn)。這種方法簡(jiǎn)單有效,尤其是系統(tǒng)配置上的故障,只要簡(jiǎn)單地對(duì)比一下就能找出配置的不同點(diǎn),但是有時(shí)要找一臺(tái)型號(hào)相同、配置相同的交換機(jī)也不是一件容易的事。
(3)替換法:
這是我們最常用的方法,也是在維修電腦中使用頻率較高的方法。替換法是指使用正常的交換機(jī)部件來(lái)替換可能有故障的部件,從而找出故障點(diǎn)的方法。它主要用于硬件故障的診斷,但需要注意的是,替換的部件必須是相同品牌、相同型號(hào)的同類交換機(jī)才行。
當(dāng)然為了使排障工作有章可循,我們可以在故障分析時(shí),按照以下的原則來(lái)分析。
1,由遠(yuǎn)到近
由于交換機(jī)的一般鼓掌(如:端口故障)都是通過(guò)所連接計(jì)算機(jī)而發(fā)現(xiàn)的,所以經(jīng)常從客戶端開始檢查。我們可以沿著客戶端計(jì)算機(jī)—>端口模塊—>水平線纜—>跳線—>交換機(jī)這樣一條路線,逐個(gè)檢查,先排除遠(yuǎn)端故障的可能。
2,由外而內(nèi)
如果交換機(jī)存在故障,我們可以先從外部的各種指示燈上辨別,然后根據(jù)故障指示,再來(lái)檢查內(nèi)部的相應(yīng)部件是否存在問題。比如POWERLED為綠燈表示電源供應(yīng)正常,熄滅表示沒有電源供應(yīng);LINKLEDs為黃色表示現(xiàn)在該連接工作在10Mb/s,綠色表示為100Mb/s,熄滅表示沒有連接,閃爍表示端口被管理員手動(dòng)關(guān)閉;RDP LED表示冗余電源;MGMT LED表示管理員模塊。無(wú)論能否從外面的出故障所在,都必須登錄交換機(jī)以確定具體的故障所在,并進(jìn)行相應(yīng)的排障措施。
3,由軟到硬
發(fā)生故障,誰(shuí)都不想動(dòng)不動(dòng)就那螺絲刀去先拆了交換機(jī)再說(shuō),所以在檢查時(shí),總是先從系統(tǒng)配置或系統(tǒng)軟件上著手進(jìn)行排查。如果軟件上不能解決問題,那就是硬件有問題了。比如某端口不好用,那我們可以先檢查用戶所連接的端口是否不在相應(yīng)的VLAN中,或者該端口是否被其他的管理員關(guān)閉,或者配置上的其他原因。如果排除了系統(tǒng)和配置上的各種可能,那就可以懷疑到真正的問題所在——硬件故障上。
4,先易后難
在遇到故障分析較復(fù)雜時(shí),必須先從簡(jiǎn)單操作或配置來(lái)著手排除。這樣可以加快故障排除的速度,提高效率。
四,總結(jié):
由于交換機(jī)故障現(xiàn)象多種多樣,沒有固定的排除步驟,而有的故障往往具有明確的方向性,一眼就能識(shí)別得出。所以只能根據(jù)具體情況具體分析了,當(dāng)然不管是什么樣的故障對(duì)于一個(gè)新上任的網(wǎng)絡(luò)管理員來(lái)說(shuō)都是困難的事,所以如果你希望能夠成為交換機(jī)故障的排除高手,就一定要在日常工作中積累經(jīng)驗(yàn),每弄好一個(gè)問題都用心的去回顧問題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網(wǎng)絡(luò)管理的重任。
看了“交換機(jī)常見故障解決辦法”還想看: