當前位置:
首頁 > 最新 > x86 伺服器 4 類常見問題匯總和故障案例

x86 伺服器 4 類常見問題匯總和故障案例

X86應該是我們廣為熟知的架構,說起X86平台的CPU,我們可能會如數家珍的報出N多種,Inter的至強5600、至強7500,AMD強勁的12核心x86處理器--「Magny-Cours」(馬尼庫爾)等等。在它的基礎上,輔以帶ECC、ChipKill、熱插拔技術的內存;防止數據異常丟失的RAID硬碟;提供不中斷電力供應的冗餘電源等等共同構建出一個完整的X86伺服器。然而用得多了,遇到的故障自然就不會少,而故障可能由於網卡、風扇、電源、cpu、內存、硬碟、raid、主板、靜電等等,以及各種不明原因。

社區最近組織活動探討IBM、LENOVO、DELL等x86伺服器運維難點與故障處理,在此由社區專家aix7(長春龍泰科技有限責任公司 項目經理張勇)分享和整理了一些常見問題和故障案例,大家來看一看,以下故障你是否遇到過……

伺服器常見問題匯總

伺服器支撐著整個企業的信息數據,對公司的信息儲存、業務開展、正常運作等等環節都具有著至關重要的意義。然而,伺服器在日常運行過程中,由於其複雜的硬體結構、繁瑣的運行原理,經常會出現一些大大小小的問題。下面精心整理一些伺服器的常見問題匯總,幫助各位排憂解難。

1.系統藍屏、頻繁死機、重啟、反映速度遲鈍

伺服器的與我們平常電腦不論是硬體結構還是運行系統,都是極其類似的。因此,就如同我們的電腦一樣,一樣可能會感染病毒,同樣會因為系統漏洞、軟體衝突、硬體故障導致死機、藍屏、重啟等故障,同樣會因為垃圾緩存信息過多而導致反應遲鈍。

2.遠程桌面連接超出最大連接數

由於伺服器默認為允許連接數為2個,如果登陸後忘記註銷,而是直接關閉遠程桌面的話,伺服器識別此次登陸還是留在伺服器端的。出現這種情況,最常見的就是重啟伺服器,但是,如果是高峰期,重啟伺服器帶來的損失是顯而易見的。那麼此時,就可以利用mstsc/console指令進行強行登陸了。打開「運行」框,鍵入「mstsc/v:xxx.xxx.xxx.xxx(伺服器IP)/console」,即可強行登陸到遠程桌面了。

3.無法刪除的文件該怎麼清理

遇到這種情況,可能是該文件還在運行中,可以重啟刪之,或者運行CMD,輸入arrtib-a-s-h-r想要刪除的文件夾名,最後輸入del想要刪除的文件夾名即可刪除,運行該命令後無法恢復,請慎用。

4.系統埠隱患

對於伺服器來說,首要保障穩定性和安全性。因此,我們僅需保證伺服器最基本的功能即可,就像音效卡都是默認禁止的。我們並不需要太多的功能,也不需要太多的埠支持。像一些不必要,而且風險較高的埠大可封掉。而一些必要的,又有風險的埠,比如:3389、80等埠,我們可以通過修改註冊表的方法將其設置不特殊的秘密埠,這樣伺服器埠的安全隱患就不復存在了。

故障案例

1、IBM 3650M3伺服器外接220V意外斷電後,再來電,伺服器無法啟動,如何處理?

按以下步驟處理:

查看伺服器是否有桔色燈,按桔色類指示檢查硬體,檢查電源工作是否正常,有AC,沒有DC是有電源有輸入沒有輸出。啟動鍵不亮,是主板沒有加電。IMM應該不通,無法查看IMM日誌。不加電的故障,首先判斷電源是好是壞,最好用的方法是短接電源黑綠插頭,風扇能轉動起來,電源多數是好的。相反,更換電源即可。若判斷電源能正常工作,那就在機箱內拔掉各種板卡做最小化測試,要是有加電反映,那就是板卡導致的,要是仍無加電反映,那就更換主板。

2、IBM 3650M4伺服器硬碟更換流程,兩塊330g硬碟做的raid1,另一塊硬碟600g硬碟沒有做raid1,600g硬碟損壞後如何更換?

正常情況下把壞硬碟移除插入新硬碟就可以了,如果操作系統無法識別到硬碟就需要重啟動伺服器進入webbios中重新激活新硬碟後,操作系統才能正常使用硬碟。

2塊300GB 做RAID1,損壞一塊直接更換即可。

如果另外一塊600GB硬碟就單盤使用,已經故障的話,系統內已經無法識別這塊盤了,數據也沒有了。更換後,如果無法識別,需要進RAID Web配置界面進行初始化配置。

另外,不建議單塊盤直接使用,無數據保護。

3、lenovo 萬全伺服器,用戶反應最近幾天辦理業務時速度很慢,經常卡住沒反應,經查應用系統沒有問題,如何處理?

首先檢查辦理業務速度慢的是個別用戶,還是所有用戶,如果是所有用戶都慢,需要進看伺服器的cpu和內存佔用率是否很高、之後查看網卡工作狀態是否正常。

網路,應用,中間件,資料庫,操作系統,伺服器,存儲都會涉及到,要做綜合分析。先從系統層面著手,看看有沒有異常進程,資源使用率是否合理,IO是否有瓶頸,網路是否有丟包,連接數是否正常.....逐步排查,向外擴展排查範圍。

4、dell伺服器報W1228 ROMB Batt

這個報警是陣列卡的電池容量如果在停電的狀態下無法使用超過24小時,也就是電池壽命將要完結,這個報警不會影響操作系統運行,即使電池故障也不會影響操作系統,只是在陣列卡上的緩存將被禁用而性能上有所影響,建議您如果伺服器在保修期內請致電商家進行報修。

5、更換陣列卡後如何載入驅動?

原來用的是raid1,兩塊146G的盤現在要加一個raid5的陣列卡,原先的陣列卡不支持raid5所以只能更換新的陣列卡,但是直接用新的陣列卡連接原來的raid1陣列,系統藍屏重啟。請教一下如果在不重新做系統的情況下載入新的陣列卡驅動到系統?因為原系統上面有一套單獨購買的錄音程序原來的開發公司遷移程序是要費用的。

一般raid1要實現更高級別的陣列擴容,那麼首先raid1要支持raid5,即本身兩塊盤在獨立的陣列卡支持raid5、raid1的情況下創建的raid1,那麼這種情況下,只需要加一個電池保護就可以實現raid1至raid5的擴容。就你所說的這種情況,兩塊盤如果不打算加至三塊或者三塊以上做raid5的話,建議你還是保持原環境,否則出現藍屏諸如0x0000007B的報錯很正常,而且陣列會亂數據有風險。

【提醒:切不可在不做任何備份的情況下,直接更換其他不同型號的陣列卡並開機啟動,此類操作很有風險】

6、IBM X3650M3機器重裝系統問題?

一台3650安裝系統,之前安裝linux系統。現在要更換成2003系統,我在ibm官網上下載了serversguide引導盤,通過用引導盤去安裝,引導盤啟動很正常,按照啟動提示一直做,沒有任何報錯,但是通過引導盤做完後,重啟進入系統居然提示「boot fault」,難道是引導盤的問題,又去下了個9.0的版本,結果還是一樣,也沒有安裝完成。當時都不找到是什麼問題,raid也是正常的,硬碟也沒有問題。

通過用軟體將raid驅動和硬體驅動集成到2003iso鏡像後,然後在去安裝系統,就可以正常進入系統,實在不行硬體驅動也可以單獨安裝,raid驅動要集成到2003iso鏡像中。

7、Lenovo x3650m4伺服器更換主板後,無法進入系統,請問如何處理?

針對 2008R2、linux6 以上版本更換主板後無法啟動,完整解決辦法圖文文檔,請到社區此鏈接下載:

http://www.talkwithtrend.com/Document/detail/tid/414491


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 talkwithtrend 的精彩文章:

如何實現容器雲上的服務編排設計?

TAG:talkwithtrend |