單位局域網(wǎng),3臺服務(wù)器群集管理,安裝有趨勢科技的防毒服務(wù)器版,每日自動更新病毒庫和掃描引擎。1臺銳捷S4909三層交換機,下接14臺SMC二層交換機,其中網(wǎng)絡(luò)中心的交換機通過ADSL+寬帶路由器的方式和外網(wǎng)相連。局域網(wǎng)中有180多個工作站,使用固定IP地址,工作站安裝有還原卡,在每次啟動時自動還原到系統(tǒng)初始設(shè)定值,并從服務(wù)器上下載更新工作軟件,以確保操作系統(tǒng)的安全、軟件運行環(huán)境的正確及使用最新版本的軟件。
網(wǎng)速好慢
有十多個用戶報告工作站啟動時無法從服務(wù)器上更新工作軟件,流量高峰期所有用戶均報告響應(yīng)速度慢,極易提示沒有響應(yīng)。該現(xiàn)象持續(xù)了一周左右,一直沒找到原因。
IP分配有問題
首先可以排除工作站網(wǎng)卡的問題,因為十多臺工作站的網(wǎng)卡同時出現(xiàn)故障的可能性幾乎不存在。其次,工作站軟件問題因為系統(tǒng)還原的原因也可以排除。
關(guān)閉寬帶路由器以斷開外網(wǎng)的連接,故障依舊。檢查服務(wù)器防毒軟件的日志,沒有發(fā)現(xiàn)異常報告。檢查其中一臺出錯工作站( 192.168.1.103,下稱103#工作站),在該工作站上ping群集IP地址(192.168.1.1)時,提示超時,而此時從中心工作站(192.168.1.19,下稱19#工作站)也無法ping到103#工作站,好像問題在網(wǎng)絡(luò)上。
奇怪的是,在103#工作站上ping服務(wù)器實際IP地址(192.168.1.2)時,都很正常,而且此后進行的網(wǎng)絡(luò)動作都有正常的響應(yīng),只是速度還是偏慢,停止響應(yīng)的頻率較其他工作站高,但是只要同時在DOS窗口下保持連續(xù)ping服務(wù)器的IP地址,則該工作站可正常運行!
同時在網(wǎng)絡(luò)中心工作站上使用多種單機版殺毒軟件對103#工作站進行遠程查殺病毒,均無功而返!
為避免在工作站和網(wǎng)絡(luò)中心間來回奔走,遂將103#工作站帶回網(wǎng)絡(luò)中心進行分析研究。無意中發(fā)現(xiàn)一個奇怪的現(xiàn)象:19#工作站正在ping 103#工作站,而且每一個發(fā)出的數(shù)據(jù)包都有正常的響應(yīng)。大為不解,103#工作站明明已經(jīng)下網(wǎng)了,怎么可能有響應(yīng)呢?再說根據(jù)網(wǎng)絡(luò)規(guī)則即使有相同IP地址的工作站,也應(yīng)該會在登錄網(wǎng)絡(luò)時提示,同時禁用后來的工作站,可是現(xiàn)在卻沒有提示。
將103#工作站接入網(wǎng)絡(luò),ping服務(wù)器IP地址(192.168.1.2),仔細觀察返回的數(shù)據(jù)包,發(fā)現(xiàn)每7~10個中就有1個的time超過150ms,綜合上述現(xiàn)象,初步可以斷定這個異常數(shù)據(jù)包來自一個未知信息點。
斷開103號工作站,在19號工作站上用Telnet訪問該未知信息點,居然有登錄界面出現(xiàn),要求輸入Username和Password,胡亂試了幾次都沒有成功,嘗試著轉(zhuǎn)到IE上用192.168.1.103進行訪問,出現(xiàn)了友好的訪問界面。仔細觀察發(fā)現(xiàn),竟然是樓層交換機的管理界面?磥碓揑P地址是分配給這臺交換機了。
關(guān)閉IP自動獲取
逐一登錄交換機,停用其IP地址,關(guān)閉其IP地址自動獲取功能,很快網(wǎng)絡(luò)就恢復(fù)正常了。
關(guān)閉DHCP功能
原來網(wǎng)絡(luò)中的樓層交換機是沒有分配IP地址的,服務(wù)器也關(guān)閉了DHCP功能,工作站使用固定IP,樓層交換機的IP地址來源應(yīng)該另有一個DHCP服務(wù)器。再三詢問中心工作人員近期是否進行了網(wǎng)絡(luò)軟件或硬件的調(diào)整,終于他們回憶起大概在一周前因為寬帶路由器死機,用Reset鍵復(fù)位后,只重新進行了少量的配置,似乎沒有關(guān)閉DHCP功能。從那以后就陸續(xù)出現(xiàn)這種現(xiàn)象。
將寬帶路由器接到單機上重新配置,果然其DHCP功能是開啟的,于是趕緊關(guān)閉。
至此,故障的根源很清楚了,當寬帶路由器的DHCP開啟后,將IP池中的IP地址向網(wǎng)絡(luò)中的機器發(fā)送,而二層交換機正處于自動獲取IP地址的狀態(tài),兩者一拍即合,二層交換機立即租用了IP地址。同時,服務(wù)器對出錯工作站的響應(yīng)卻被具有相同IP地址的交換機截取,而交換機在識別到不是自己需要的數(shù)據(jù)包后做了拋棄處理,如此循環(huán)往復(fù),工作站就接收不到應(yīng)有的數(shù)據(jù)了。
這次故障很大程度上是人為失誤造成的,但是如果事先給每一臺交換機配置一個固定的IP地址,不僅可以避免這次故障,而且可以更方便地對這些交換機進行遠程管理。