根據經驗發現大多數網絡故障是與硬件有關的:比如電纜、中繼器、Hub、Switch和網卡等。本文描述了以太網典型故障的查找過程。
一、故障查找的一般規則
以太網的故障查找可分為5個步驟:
1.收集所有可以收集到的有價值的信息,分析故障的現象。 2.將故障定位到某一特定的網段,或者是單一獨立功能組(模塊),也可以是某一用戶。 3.確認是特定的硬件故障還是軟件故障。 4.定位與修復故障。 5.驗證故障的排除。
一般來說,最好的辦法是先把故障細分或隔離在一個小的功能段上,即首先排除最大的簡單段,從任何一個方便的、靠近問題的站點入手,利用二分法隔離故障,再繼續使用二分法直至把故障劃分到最小的單位。網管人員不要過多指望用戶會給出完整準確的情況描述,最好由自己來確認一下。當然也可以讓用戶演示所發現的問題。由于網絡故障帶來的壓力和混亂,人們經常忽略一些細節問題。如果某個部件出了問題,最好不要立即去替換它,除非能肯定故障的來源。
二、故障查找應注意的事項
由于以太網采用通用總線拓撲結構以及物理層可擴展的潛在問題,所以某個特定物理層的問題會以不同的方式顯示出來,而且由于采用的測試手段、位置和環境不同,顯示出的現象還常常有矛盾。
為了避免被假象誤導,推薦兩個故障查找的步驟:
1.沿網段多做幾次測試
如果故障現象隨測試點的不同還保持一樣的話,就可以依照所測試出的故障現象去排除。如果故障現象在一些或所有的測試點都不相同的話,就要把查找故障的方向定在物理層(除非有特別提示),例如去查找壞的電纜、噪聲環境、接地循環等故障。
2.要提高測試質量,在測試的同時要把測試儀器設置成至少可同時發送較低的流量。由于增加了網絡流量,微小的和間歇性的物理層問題會被暴露出來。
三、典型的網絡故障
故障1、不能訪問服務器或某項服務
在這里設定服務器或某項服務以前是正常的,并且已經做過如下的工作:
重新冷啟動PC機(熱啟動不能復位全部的適配卡)。
確認PC機沒有本身的硬件故障。
確認所有的網絡電纜都連接正確。
確認所有的網卡驅動軟件都正常地裝入,沒有報告錯誤。
確認服務器或服務沒有改變,比如重新配置增加硬? 軟件。
要測試一下這一故障是否只影響該工作站(本地故障)還是會影響其它站點(大范圍故障),可以通過其它工作站裝入服務器或服務來證明這一點。這些工作站要在同一網段或Hub上。如果故障在同一網段或Hub上的其它的站點也存在,就試著從其它的Hub或網段上的站點進行測試。
(一)本地故障
在進行硬件故障查找以前,要確認其它用戶也不能登錄從這臺機器上,這就排除了用戶帳號的錯誤。對一個單一的站點來說,典型的故障多發生在壞的電纜、壞的網卡、驅動軟件或是工作站設置的不正確等問題上。
(二)全局問題
通常來說,在同軸網中的物理層故障會導致災難性的網絡故障。使用“二分法”來查找這類故障是可以很快定位解決的。間歇性的故障是比較難以隔離的。
|