廣播風暴(broadcast storm)簡單的講是指當廣播數(shù)據(jù)充斥網(wǎng)絡無法處理,并占用大量網(wǎng)絡帶寬,導致正常業(yè)務不能運行,甚至徹底癱瘓,這就發(fā)生了“廣播風暴”。一個數(shù)據(jù)幀或包被傳輸?shù)奖镜鼐W(wǎng)段 (由廣播域定義)上的每個節(jié)點就是廣播;由于網(wǎng)絡拓撲的設計和連接問題,或其他原因導致廣播在網(wǎng)段內大量復制,傳播數(shù)據(jù)幀,導致網(wǎng)絡性能下降,甚至網(wǎng)絡癱瘓,這就是廣播風暴。
廣播風暴估計學習網(wǎng)絡專業(yè)的基本上都了解也清楚其危害,如果局域網(wǎng)內部斷網(wǎng)或者網(wǎng)絡延時非常高,在排除了人為因素之后,那么很有可能就是廣播風暴導致的,目前我們常見的廣播風暴有同一個網(wǎng)段主機較多的原因,但是絕大多數(shù)還是病毒導致.。
廣播風暴也叫網(wǎng)絡廣播風暴,廣播風暴(broadcast storm)故障,即一個數(shù)據(jù)包或幀被傳送到本地網(wǎng)段(由廣播域定義)上的每個節(jié)點就是廣播;網(wǎng)絡上的廣播幀由于被轉發(fā),數(shù)量急劇增加而出現(xiàn)正常網(wǎng)絡通信的反常現(xiàn)象。廣播風暴會占用相當可觀的網(wǎng)絡帶寬,導致正常數(shù)據(jù)包無法正常運行。當廣播數(shù)據(jù)充斥網(wǎng)絡無法處理并占用大量網(wǎng)絡帶寬,導致正常業(yè)務不能運行,這就發(fā)生了廣播風暴,造成局域網(wǎng)局部或整個網(wǎng)絡癱瘓。
廣播風暴是一種很嚴重的網(wǎng)絡故障。以預防為主的防治措施應是主要對策。要養(yǎng)成良好的網(wǎng)絡設備管理習慣,加強故障監(jiān)控是主要的防范措施,追查截殺惡意程序和病毒入侵時刻不能放松。要不斷研究排除和預防廣播風暴的先進技術,及時升級和優(yōu)化最安全可靠的防火墻,提高互聯(lián)網(wǎng)設備維護水平,確?;ヂ?lián)網(wǎng)安全高速運行。
1、大規(guī)模耗用鏈路帶寬,使得正常數(shù)據(jù)不能得到有效傳輸
網(wǎng)絡中的HUB、交換機等交換設備會對廣播數(shù)據(jù)幀進行泛洪操作。若網(wǎng)絡中出現(xiàn)環(huán)路,交換設備經(jīng)過多次泛洪之后,網(wǎng)絡中就會出現(xiàn)大量方向互異的廣播流,遠遠大過了交換設備所能承載的數(shù)據(jù)上限,從而正常的數(shù)據(jù)幀傳輸受到了抑制,便會導致信道的擁塞,其結果往往是延時或丟幀。
2、造成交換機資源被占用,導致死機
交換機對每個幀都要進行諸如緩存、檢錯、查詢MAC地址表等操作,這些操均會占用其部分CPU,當大量的廣播幀經(jīng)過交換機處理時,就會大量占用系統(tǒng)資源,最終造成其“死機”狀態(tài)。
廣播風暴的產(chǎn)生有多種原因,如蠕蟲病毒、交換機端口故障、網(wǎng)卡故障、鏈路冗余沒有啟用生成樹協(xié)議、網(wǎng) 廣播風暴 線線序錯誤或受到干擾等。從目前來看,蠕蟲病毒和ARP攻擊是造成網(wǎng)絡廣播風暴最主要的原因。雖說如今網(wǎng)絡廣播風暴已經(jīng)很少見了,但在一些使用集線器的網(wǎng)絡中仍然非常常見。解決網(wǎng)絡廣播風暴最快捷的方法是給集線器斷電然后上電啟動即可,但這只是治標不治本的方法,要徹底解決,最好使用交換機設備,并劃分VLAN、通過端口控制網(wǎng)絡廣播風暴。否則,如果廣播風暴是由于網(wǎng)卡損壞所致,要從上百臺計算機找出故障計算機簡直就是大海撈針,那將是網(wǎng)管員的一場噩夢。 下面就幾個引發(fā)廣播風暴的原因及其對策進行闡述。
1、誤將智能型集線器作為交換機引發(fā)廣播風暴
采購人員或者奸商將智能型集線器當作交換機使用,這樣,當網(wǎng)絡稍微繁忙時,由于集線器的天生缺陷,故引發(fā)了廣播風暴。
對策:檢查所使用的網(wǎng)絡設備是否是交換機,如果不是則更換正確的交換機,切記不要使用集線器。
2、網(wǎng)線短路
壓制網(wǎng)線時沒有做好,或者網(wǎng)線表面有磨損導致短路,會引起交換機的端口阻塞,因為交換機大多都使用存儲轉發(fā)技術,它的工作原理是對某一段數(shù)據(jù)包進行分析判斷尋址,并進行轉發(fā),在發(fā)出前均存儲在交換機的緩沖區(qū)內,當網(wǎng)線發(fā)生短路時,該交換機將接收到大量的不符合分裝原則的包,造成交換機處理器工作繁忙, 數(shù)據(jù)包來不及轉發(fā),從而導致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象,導致廣播風暴。
對策:使用MRGT等流量查看軟件可以查看出現(xiàn)短路的端口,如果交換機是可網(wǎng)管的,也可以通過逐個封閉端口來進行處理查找,進而找到有問題的網(wǎng)線。找到短路的網(wǎng)線后,更換一根網(wǎng)線。
3、接入層拓撲環(huán)
當網(wǎng)絡中存在環(huán)路,就會造成每一幀都在網(wǎng)絡中重復廣播,引起廣播風暴。要消除這種網(wǎng)絡循環(huán)連接帶來的網(wǎng)絡廣播風暴可以使用STP協(xié)議(生成樹協(xié)議),以網(wǎng)絡中一臺交換機為節(jié)點生成一棵轉發(fā)樹,這樣所有的數(shù)據(jù)都只在這棵樹所指示的路徑上傳輸,就不會產(chǎn)生廣播風暴——因為樹沒有環(huán)路。但因為STP算法開銷太大,交換機默認都沒啟用該協(xié)議。
對策:在接入層啟用樹生成協(xié)議,或者在診斷故障時打開樹生成協(xié)議,以便協(xié)助確定故障點。在廣播風暴發(fā)生時,應首先了解發(fā)生故障前網(wǎng)絡的改動,建立完善的網(wǎng)絡文檔資料,包括:網(wǎng)絡布線圖、IP地址和MAC地址對應表等,可以通過局域網(wǎng)工具軟件來掃描獲取這些信息。
4、傻瓜交換機
可網(wǎng)管的交換機由于具備生成樹協(xié)議功能,可自動切斷級聯(lián)交換機環(huán)回端口,避免網(wǎng)絡拓撲環(huán)的產(chǎn)生,但這個功能,傻瓜交換機并不具備。在同一傻瓜交換機上的不同端口,或傻瓜交換機之間有冗余的連接,就導致網(wǎng)絡拓撲環(huán)的發(fā)生,進而導致網(wǎng)絡廣播風暴,造成網(wǎng)絡通訊失敗。
對策:用于級聯(lián)交換機的跳線應當做一些特殊標記,最好選擇使用不同顏色的跳線,與其他普通跳線相區(qū)別。
5、蠕蟲病毒
當網(wǎng)絡中某計算機感染蠕蟲病毒時,如Funlove、震蕩波、RPC等病毒,如果查看該網(wǎng)卡的發(fā)送包和接收包的數(shù)量時發(fā)現(xiàn)發(fā)包數(shù)在快速增加,則說明該計算機感染了蠕蟲病毒,通過網(wǎng)絡傳播,損耗大量的網(wǎng)絡帶寬,引起網(wǎng)絡堵塞,導致廣播風暴。
對策:為每臺計算機安裝殺毒軟件,并配置補丁服務器(WSUS)來保證局域網(wǎng)內所有的計算機都能及時打上最新的補丁。
作為網(wǎng)絡管理員,在面對網(wǎng)絡廣播風暴發(fā)生時,要冷靜分析廣播風暴產(chǎn)生的原因,可使用二分法、排除法、替換法和網(wǎng)線插拔法等多種方法綜合運用,一步一步地進行故障排除,快速定位引發(fā)廣播風暴的故障點,查出引發(fā)廣播風暴的原因,及時采取相應措施來消滅廣播風暴。 總的來看,要解決廣播風暴的問題,可以從以下幾個方面入手:
一、在局域網(wǎng)中安裝WSUS補丁服務器,保證局域網(wǎng)所有計算機都能及時打上最新的補丁。
二、最好在局域網(wǎng)內安裝網(wǎng)絡版的防毒服務器,如無條件,起碼也得保證單機版的防毒軟件的病毒庫是經(jīng)常更新的。
三、檢查每一臺計算機的網(wǎng)卡、網(wǎng)線和交換機的每一個端口,檢查是否有廣播風暴 故障。
四、當廣播風暴發(fā)生時,觀察交換機的指示燈不啻為很好的方法,可直接觀察網(wǎng)絡連通性及網(wǎng)絡流量。
要避免廣播風暴,可以采用恰當劃分VLAN、縮小廣播域、隔離廣播風暴,還可在千兆以太網(wǎng)口上啟用廣播風暴控制,最大限度地避免網(wǎng)絡再次陷入癱瘓。當端口接受到大量的廣播、單播或組播的包時,就會發(fā)生廣播風暴。轉發(fā)這些包會導致網(wǎng)絡速度變慢或超時,在交換機上借助對端口的廣播風暴控制可以有效避免硬件損壞或鏈路故障導致的廣播風暴的網(wǎng)絡癱瘓。
從實際經(jīng)驗來看,90%以上的網(wǎng)絡廣播風暴是病毒所致,因此,在局域網(wǎng)中配備防病毒系統(tǒng),購置IDS入侵檢測系統(tǒng)、網(wǎng)絡流量檢測工具等,以加強網(wǎng)絡病毒的防治,加強對網(wǎng)絡線路運行狀態(tài)的監(jiān)控,及時發(fā)現(xiàn)和處理網(wǎng)絡上的異常流量和病毒攻擊等問題,并制定計算機安全管理制度,確保網(wǎng)絡線路的正常運行。