筆者公司局域網(wǎng)采用的是星型拓撲結(jié)構(gòu)千兆以太網(wǎng)技術(shù),中心機房配備一臺華為6506三層路由交換機,各樓層采用華為3026或者背板堆疊的2026接入核心交換機,各部門計算機通過直接接入或用級連方式通過接入層交換機接進網(wǎng)絡(luò)。中心的服務(wù)器有多臺,提供FTP、文件服務(wù)、Web等多項服務(wù)。全網(wǎng)分為5個VLAN,根據(jù)業(yè)務(wù)不同為不同網(wǎng)段定義了IP地址。
隨著接進網(wǎng)絡(luò)PC的不斷增多及信息流量的增加,在網(wǎng)絡(luò)維護中遇到過各類問題及
故障,現(xiàn)在分析其中影響較大的一個故障,談?wù)勗诠芾砼c維護上的一點經(jīng)驗和體會。
◆故障現(xiàn)象
某日有多個用戶反映網(wǎng)絡(luò)連接情況時通時斷,有時同一樓層的計算機都無法互相Ping通,故障用戶分布在多個樓層,故障點不集中。對個別端口做互換測試,故障仍然存在。在故障計算機上進行測試,發(fā)現(xiàn)可以Ping通網(wǎng)絡(luò)中的部分服務(wù)器或計算機,Ping核心交換機的IP地址常出現(xiàn)不通、丟包、時延大的現(xiàn)象。利用華為的網(wǎng)絡(luò)軟件對可管理的交換機做檢查,沒有明顯的報錯。
◆故障排查
首先懷疑為核心交換機物理故障,觀察交換機的指示燈狀態(tài)以及各端口的狀態(tài),顯示正常。對核心交換機清除緩存、關(guān)閉重啟,并檢查交換機的配置情況,沒有改變。
經(jīng)過以上的檢查和測試,分析故障應(yīng)該不在硬件部分,利用Sniffer抓包分析軟件將網(wǎng)絡(luò)中的數(shù)據(jù)包抓下來分析,發(fā)現(xiàn)有大量數(shù)據(jù)包來自同一個MAC地址,目的地址是根本不存在的IP,懷疑是類似于“沖擊波殺手”一類會造成網(wǎng)絡(luò)堵塞的蠕蟲病毒。根據(jù)網(wǎng)絡(luò)正常時建立的IP地址及MAC地址對應(yīng)表查出該機屬于某層的一臺PC,初步確認故障點后將MAC地址對應(yīng)的計算機從網(wǎng)絡(luò)中斷開并升級殺毒軟件,然后重新接入網(wǎng)絡(luò),此時故障仍然存在。
為了確定具體故障點,要求該單位提供其接入拓撲圖分析,發(fā)現(xiàn)該單位將分屬于兩(
電腦沒聲音)個不同VLAN的連線分別連接兩(電腦沒聲音)個不同的Hub,當天為了使用方便,將兩(電腦沒聲音)個Hub用級聯(lián)的方式連接到了一起,將其連線斷開后,故障徹底排除。
◆故障原因
此次故障原因分析主要是由于網(wǎng)絡(luò)中有環(huán)路存在,造成每一幀都在網(wǎng)絡(luò)中重復廣播,引起了廣播風暴。要消除這種網(wǎng)絡(luò)循環(huán)連接帶來的網(wǎng)絡(luò)廣播風暴可以使用STP協(xié)議(生成樹協(xié)議),以網(wǎng)絡(luò)中一臺交換機為節(jié)點生成一棵轉(zhuǎn)發(fā)樹,而樹是沒有環(huán)路的,這樣所有的數(shù)據(jù)都只在這棵樹所指示的路徑上傳輸,就不會產(chǎn)生廣播風暴,但由于SPT算法的開銷非常大,所以交換機上都未啟用該協(xié)議。
為避免在接入層出現(xiàn)同樣的故障,從而影響整個局域網(wǎng)絡(luò)用戶的使用,所以在接入層啟用樹生成協(xié)議是必要的,或者在診斷故障時可以打開SPT協(xié)議協(xié)助確定故障點。
◆經(jīng)驗總結(jié)
在故障發(fā)生時,應(yīng)首先了解故障前網(wǎng)絡(luò)的改動,建立完善的網(wǎng)絡(luò)文檔資料。包括網(wǎng)絡(luò)布線圖、IP及MAC對應(yīng)表等,否則在確定MAC地址端口時會消耗大量的時間。現(xiàn)在有很多局域網(wǎng)工具軟件都可以通過掃描獲取網(wǎng)絡(luò)中的計算機的這些信息,如LanExplorer等。
附:產(chǎn)生廣播風暴的原因
一般情況下,產(chǎn)生網(wǎng)絡(luò)廣播風暴的原因,主要有以下幾種:
1、網(wǎng)絡(luò)設(shè)備原因:我們經(jīng)常會有這樣一個誤區(qū),交換機是點對點轉(zhuǎn)發(fā),不會產(chǎn)生廣播風暴。在我們購買網(wǎng)絡(luò)設(shè)置時,購買的交換機,通常是智能型的Hub,卻被奸商當做交換機來賣。這樣,在網(wǎng)絡(luò)稍微繁忙的時候,肯定會產(chǎn)生廣播風暴了。
2、網(wǎng)卡損壞:如果網(wǎng)絡(luò)機器的網(wǎng)卡損壞,也同樣會產(chǎn)生廣播風暴。損壞的網(wǎng)卡,不停向交換機發(fā)送大量的數(shù)據(jù)包,產(chǎn)生了大量無用的數(shù)據(jù)包,產(chǎn)生了廣播風暴。由于網(wǎng)卡物理損壞引起的廣播風暴,故障比較難排除,由于損壞的網(wǎng)卡一般還能上網(wǎng),我們一般借用Sniffer局域網(wǎng)管理軟件,查看網(wǎng)絡(luò)數(shù)據(jù)流量,來判斷故障點的位置。
3、網(wǎng)絡(luò)環(huán)路:曾經(jīng)在一次的網(wǎng)絡(luò)故障排除中,發(fā)現(xiàn)一個很可笑的錯誤,一條雙絞線,兩(電腦沒聲音)端插在同一個交換機的不同端口上,導致了網(wǎng)絡(luò)性能急驟下降,打開網(wǎng)頁都非常困難。這種故障,就是典型的網(wǎng)絡(luò)環(huán)路。網(wǎng)絡(luò)環(huán)路的產(chǎn)生,一般是由于一條物理網(wǎng)絡(luò)線路的兩(電腦沒聲音)端,同時接在了一臺網(wǎng)絡(luò)設(shè)備中。
4、網(wǎng)絡(luò)病毒:目前,一些比較流行的網(wǎng)絡(luò)病毒,F(xiàn)unlove、震蕩波、RPC等病毒,一旦有機器中毒后,會立即通過網(wǎng)絡(luò)進行傳播。網(wǎng)絡(luò)病毒的傳播,就會損耗大量的網(wǎng)絡(luò)帶寬,引起網(wǎng)絡(luò)堵塞,引起廣播風暴。
5、黑客軟件的使用:目前,一些上網(wǎng)者,經(jīng)常利用網(wǎng)絡(luò)執(zhí)法官、網(wǎng)絡(luò)剪刀手等黑客軟件,對網(wǎng)吧的內(nèi)部網(wǎng)絡(luò)進行攻擊,由于這些軟件的使用,網(wǎng)絡(luò)也可能會引起廣播風暴。
注意局域網(wǎng)環(huán)路引起的廣播風暴