再談 x86 伺服器故障,這些問題其實可以這樣處理

2021-02-24 twt企業IT社區

昨天我們推送了《x86 伺服器 4 類常見問題匯總和故障案例》(點擊標題可回顧),分享了在社區交流活動中,多位社區會員探討的伺服器故障處理經驗之談,受到了很多讀者關注。當然,難題的解決路徑可能不只一條,有熱心高手,在看到公眾號推送後,就針對該文提出了自己的觀點,並分享了實踐經驗。我們將此作為該文後續推送,以便大家從多個角度分析和解決問題。

以下內容為社區會員徐康針對原文中的故障處理提出的見解,供參考。

IBM 3650M3伺服器外接220V意外斷電後,再來電,伺服器無法啟動,如何處理?

【原文分享】

按以下步驟處理:

查看伺服器是否有桔色燈,按桔色類指示檢查硬體,檢查電源工作是否正常,有AC,沒有DC是有電源有輸入沒有輸出。啟動鍵不亮,是主板沒有加電。IMM應該不通,無法查看IMM日誌。不加電的故障,首先判斷電源是好是壞,最好用的方法是短接電源黑綠插頭,風扇能轉動起來,電源多數是好的。相反,更換電源即可。若判斷電源能正常工作,那就在機箱內拔掉各種板卡做最小化測試,要是有加電反映,那就是板卡導致的,要是仍無加電反映,那就更換主板。

【本文作者提出】 

IBM M3的伺服器第一次通電時間會很長,表現狀況為 通電後,按電源後,電源燈在閃,風扇在轉,無屏顯,內部健康燈無報錯。只有一個建議——等。10-30分鐘後再來。曾經一臺新的3650 m3伺服器,通電按下電源鍵,出去吃了個飯回來剛剛亮屏啟動。如果是一個多小時以上沒有反應,那就是主板掛了。

如果cpu 內存電源之類的有問題,前面板的內部健康燈會亮或者閃橙色燈。診斷面板上有相對應故障的設備的燈亮起,告訴你具體是那個硬體設備故障,不需要做最小化測試。

▲那個藍色的那塊扣出來就是診斷面板

 

遠程桌面連接超出最大連接數

【原文分享】

由於伺服器默認為允許連接數為2個,如果登陸後忘記註銷,而是直接關閉遠程桌面的話,伺服器識別此次登陸還是留在伺服器端的。出現這種情況,最常見的就是重啟伺服器,但是,如果是高峰期,重啟伺服器帶來的損失是顯而易見的。那麼此時,就可以利用mstsc/console指令進行強行登陸了。打開「運行」框,鍵入「mstsc/v:xxx.xxx.xxx.xxx(伺服器IP)/console」,即可強行登陸到遠程桌面了。

【本文作者提出】 

遠程桌面最大數量和伺服器無關,是windows系統限制,就是在購買是說的多少用戶的windows。解決的方法可以通過增加用戶數來解決,服務裡添加遠程桌面許可伺服器參考連接https://blog.csdn.net/hanzheng260561728/article/details/73901193

臨時想使用可以使用伺服器的帶外管理來遠程kvm(hp的ilo dell的idrac等ipmi)

 

IBM 3650M4伺服器硬碟更換流程,兩塊330g硬碟做的raid1,另一塊硬碟600g硬碟沒有做raid1,600g硬碟損壞後如何更換?

【原文分享】

正常情況下把壞硬碟移除插入新硬碟就可以了,如果作業系統無法識別到硬碟就需要重啟動伺服器進入webbios中重新激活新硬碟後,作業系統才能正常使用硬碟。

2塊300GB 做RAID1,損壞一塊直接更換即可。

如果另外一塊600GB硬碟就單盤使用,已經故障的話,系統內已經無法識別這塊盤了,數據也沒有了。更換後,如果無法識別,需要進RAID Web配置界面進行初始化配置。

另外,不建議單塊盤直接使用,無數據保護。

【本文作者提出】 

注意插入的必須是沒有raid信息的硬碟,更換方面以及注意事項建議諮詢800後更換。自己想了解可以百度lsi的陣列卡使用手冊。Ibm、dell用的都是lsi的陣列卡。

lenovo 萬全伺服器,用戶反應最近幾天辦理業務時速度很慢,經常卡住沒反應,經查應用系統沒有問題,如何處理?

【原文分享】

首先檢查辦理業務速度慢的是個別用戶,還是所有用戶,如果是所有用戶都慢,需要進看伺服器的cpu和內存佔用率是否很高、之後查看網卡工作狀態是否正常。

網絡,應用,中間件,資料庫,作業系統,伺服器,存儲都會涉及到,要做綜合分析。先從系統層面著手,看看有沒有異常進程,資源使用率是否合理,IO是否有瓶頸,網絡是否有丟包,連接數是否正常逐步排查,向外擴展排查範圍。

【本文作者提出】  

業務慢的話,和硬體基本無關。檢測硬體日誌可以確定是否有硬體故障。

dell伺服器報W1228 ROMB Batt < 24hr錯誤如何處理?

【原文分享】

這個報警是陣列卡的電池容量如果在停電的狀態下無法使用超過24小時,也就是電池壽命將要完結,這個報警不會影響作業系統運行,即使電池故障也不會影響作業系統,只是在陣列卡上的緩存將被禁用而性能上有所影響,建議您如果伺服器在保修期內請致電商家進行報修。

【本文作者提出】   

bbwc電池問題,更換電池或者移除電池。

Bbwc電池是保證意外掉電後給陣列卡cache供電,保證陣列卡cache中的數據不丟失。現在更多的是用fbwc,掉電後cache數據回寫到flash上

最後再分享幾句經驗之談,給剛入伺服器運維和售後的朋友:

一定不要自以為是,在沒有萬全退路前,或者不知道後果前,不要擅自決定一些操作。請查閱文檔或者800廠商後以書面方式給出解決方案後再操作。操作前列出操作步驟,以及可能發生的結果,應對方法。

伺服器在條件允許的情況下一定要配置帶外管理。帶外管理可以實時查看硬體狀況,硬體報錯日誌,遠程kvm,遠程掛載iso等等功能,甚至可以有藍屏截圖,操作錄屏等等。

一些好習慣:拆前先拍照,截圖,硬碟拿下來前編個號。

遇見硬體故障不要著急,在帶外管理裡看日誌,分析故障硬體。打800不丟人,有問題就800。運維售後保護好自己,不要擅自操作去抗鍋。

長按二維碼關注公眾號

相關焦點

  • 伺服器RAID 5故障問題解決方法詳解
    【IT168 技術】由於技術的不斷進步,不同型號的伺服器出現RAID 5故障後,處理方法也不同。基於對伺服器安全性與可靠性的考慮,通常會對伺服器的磁碟採用磁碟陣列RAID(Redundant Array of Inexpensive Disk)進行磁碟冗餘備份。
  • Intel X86伺服器架構(十)封神路之MCE診斷
    上篇我畫了一幅圖: 昨天有位大哥問,學樸,你都是從哪裡總結的公眾號裡這些x86架構技術文檔?以後,我會儘量公開能公開的參考文檔。 其實,我寫這個x86架構系列文檔,還真不是從海水司的知識庫裡學習的,都是社會上的老朋友提供的相關素材,自己一點點學習吸收,再在實踐中驗證,再share出來的。所謂專業積累多少年的部門知識庫裡,沒有這些底層架構知識。 言歸正傳。
  • 聯想集團宣布將完成收購IBM x86伺服器業務
    聯想將隨即成為全球x86伺服器第三大廠商 (x86伺服器全球市場總規模達421億美元)。 「隨著IBM x86伺服器業務收購交易的完成,聯想將再添一項全球一流的業務,進一步壯大我們在企業級設備和服務方面的實力,並隨即成為全球伺服器市場第三大廠商。」聯想集團董事長兼執行長楊元慶表示,「現在,我們將專注於業務的順利整合,為用戶提供平穩順暢的過渡。
  • PC能替代伺服器嗎?全方位解析二者區別_華為伺服器_伺服器x86服務...
    伺服器與PC有何區別?    相信這是很多人都在考慮的問題。是的,隨著移動網際網路的發展,依託於網際網路的創新公司越來越多,這些公司大多在10人以下,甚至僅一兩個人,但他們對伺服器卻有著自己的需求,Web網站,App支持,列印需求等等,讓伺服器成為這些企業辦公必不可少的設備之一。
  • 工程師筆記|伺服器出故障了我卻不知道?
    想必大家都經歷過手機、電腦等電子設備出問題的情況,跟手機、電腦一樣,伺服器運轉過程中也會出點故障,作為承載了企業各種業務的平臺,伺服器出故障的影響非同小可,嚴重時可能危及業務開展,而如果故障發現不及時,企業就會蒙受更大的損失。
  • x86反擊戰再繼續,「藍色巨人」推專為AI設計的POWER9
    在x86不斷成熟的今天,這一次,IBM能以性能反擊成功麼?一伺服器市場,X86與IBM POWER的愛恨情仇總是繞不開的話題。面對已經佔據伺服器市場90%以上份額的x86,四年前,IBM出售x86伺服器業務,聚焦高端市場。四年之後,伺服器市場開始迎來新的大變量——人工智慧。
  • 搞不清楚PowerPC、x86和ARM,別說你懂嵌入式!
    當時Intel也在推行64位技術,但是其IA64架構並不兼容X86,只是用在伺服器Itanim上。為了和AMD展開競爭,Intel也在2004年推出了自己的64位版X86,也就是EM64T。這其實也證明,X86指令集的彈性完全可以拿來對付Intel,所以即使Intel統治了整個市場,其它公司依然可以改變X86的發展方向。
  • x86 和 ARM 誰能主宰伺服器市場?Linux 之父和 Redis 之父有分歧了
    Arm 表示他們已在行動裝置領域取得了不錯的成績,但因為整體性能的一些不足,所以未能在伺服器市場佔有一席之地。不過他們一直在努力提升性能,以將其市場從行動裝置擴大到伺服器。為實現這一目標,Arm 在2018年做了很多的工作 —— 推出了堪稱性能巔峰的全新 Cortex A76 微架構,而這兩款即將發布的產品,毫無疑問正是承載了 Arm 進軍伺服器市場的宏願。
  • ARM vs x86 vs RISC-V,未來屬於誰?
    而且,x86架構還在通過不同的方法進行改進,無論AMD、VIA都可以通過X86指令集的彈性來對付Intel,迫使x86進行改變。 通過幾十年的技術積累,x86伺服器在伺服器領域的地位幾乎是獨孤求敗。小巧靈活的x86伺服器在市場上應用十分廣泛,網際網路以及區域網內的文件、列印、通訊、web、電子郵件、資料庫以及應用服務等多個領域都可以一展身手。
  • Facebook伺服器再曝故障 全球崩潰無法登錄
    Facebook於周日早上發生故障,導致該公司所有社交媒體平臺受到影響。Instagram,WhatsApp和Messenger都遇到了類似的中斷問題。全球用戶報告使用Facebook和Instagram時遇到了困難。
  • 性能大躍進 幹翻x86!ARM Neoverse N1伺服器處理器搶先解析
    前陣子,我們又看到了華為推出的全新鯤鵬920伺服器晶片,該晶片有望成為業界性能最高的ARM伺服器CPU。上述三種產品之間最大的共性是,每種產品都代表了各供應商在實施基於ARMv8架構許可的定製微體系結構方面所做的努力。這實際上引出了一個問題:ARM自己的伺服器和基礎設施市場計劃是什麼?
  • 河南省某中心醫院核心平臺建設為何拋棄x86轉投浪潮K1 Power陣營
    浪潮K1 Power極限降低故障率,只為對安全的承諾和堅持說罷了「穩」對HIS、對醫院的重要性,再來聊一聊河南省某中心醫院面臨的問題,以及他們是如何藉助浪潮K1 Power解決的。該醫院是一所集醫療、急救、教學、科研、預防、保健、康復於一體的三級甲等綜合醫院。
  • 性能更強的SPARC和Power為啥鬥不過x86
    在高端領域,Power架構具備大規模SMP系統性能,其可以保障內存在訪問任意一枚CPU時速度是一致的。而x86則是採用了NUMA結構,CPU和內存分區,這就意味著在訪問自己部分的內存速度飛快,而其他部分內存速度要慢不少。也正是因此,4路以上的x86伺服器相對較少。
  • 《爐石傳說》故障之我見
    局部,承擔的玩家人數有限,一組伺服器有問題,不會影響全服資料庫類型多為MySQL,但也不全是,自研遊戲我們可控制資料庫類型,但代理遊戲不可控,有一個經驗數據,代理的國家不同,資料庫不同,韓國遊戲常為 SQL Server,日本常為 postgresql 美國常為 Oracle
  • DHCP中繼故障處理的具體流程
    那麼關於這方面的一些故障處理,我們也講解過了DHCP伺服器故障處理的一些流程和方法。那麼這裡我們在來著重講解一下DHCP中繼故障處理過程。希望對大家能夠有所幫助。DHCP中繼故障處理◆典型組網環境DHCP中繼的典型組網如下圖所示。DHCP中繼的故障處理將基於該網絡。
  • x86架構&linux內核系列(三)——我眼中的intel x86架構(一)
    另一點,是為了裝逼,顯示筆者在圈子裡德高望重,字裡行間暗示自己是個老不死,呃,老衲是你爸爸的戰友……    可是摸著良心說,我真的不能算和x86伺服器很相熟。畢竟從前我是搞小機和存儲的。就借著之前的高度和相通的一些經驗來看待x86 intel架構吧。
  • ARM首次成功模擬運行x86-ARM,二進位轉換器,模擬器,x86...
    ARM在移動領域風生水起,但是要想在桌面和伺服器上佔領一席之地,最大的麻煩就在於不兼容最為普及的x86代碼系統和程序,而出路只有兩條:要麼大力推進自己的生態系統,要麼模擬運行x86,就像曾經的全美達那樣(下場比較慘)。
  • 新華三發布Superdome Flex280伺服器,為企業關鍵業務應用保駕護航
    在承載企業核心業務的伺服器上,x86以其極高的性價比和開源開放的架構設計,迅速取代大型機、小型機。為了保證核心業務的高可用性,x86伺服器也進行了細分,關鍵業務伺服器也就應運而生。在硬體方面,Superdome Flex 280一是通過更高的容錯設計,實現了故障的自愈;二是通過微碼功能,實現了故障暫時隔離,不讓故障直接傳導給作業系統,而是暫時隔離,以此來保證應用正常運行;三是通過提供更細顆粒度的報告和日誌,更加準確地定位故障,為用戶提供更好的修正建議。
  • 伺服器12種基本故障及排查方法
    考慮選用另外的刻錄軟體,用NERO來進行測試(版本為V5.5.9.0),用該軟體執行快速擦寫後再對光碟進行刻錄,依舊發生上述的現象。但是用SONY的CD-RW光碟則無此問題。點評:擦寫光碟時和刻錄軟體及刻錄機都有很大的關係,請工程師在解決問題時可以從多個角度考慮問題。
  • 新華三2019年Q3銷售額增速位列中國x86伺服器市場第一
    近日,全球權威市場研究機構 IDC 公布了「2019 年第三季度中國 x86伺服器市場跟蹤報告」,據 IDC 數據顯示,該季度中國伺服器市場出貨量為 86.2萬臺,同比下降4.2%,銷售額 48.3 億美元,整體市場增長疲軟。