Linux運維常見故障及處理的 32 個錦囊妙計(一)

2021-02-15 kedacom測試天地

此文匯總了Linux運維在做項目過程可能出現的故障及解決方法,看看是否與你有共鳴,並對你有幫助呢?

問題:
某天研發某同事找我說幫他看看他寫的shell腳本,死活不執行,報錯。我看了下,腳本很簡單,也沒有常規性的錯誤,報「:badinterpreter:Nosuchfileordirectory」錯。

看這錯,我就問他是不是在windows下編寫的腳本,然後在上傳到linux伺服器的……果然。

原因:
在DOS/windows裡,文本文件的換行符為rn,而在nix系統裡則為n,所以DOS/Windows裡編輯過的文本文件到了nix裡,每一行都多了個^M。

解決:
1)重新在linux下編寫腳本;
2)vi:%s/r//g:%s/^M//g(^M輸入用Ctrl+v,Ctrl+m)
附:sh-x腳本文件名,可以單步執行並回顯結果,有助於排查複雜腳本問題。

問題:
/var/spool/clientmqueue目錄佔用空間超過100G。

原因:
cron中執行的程序有輸出內容,輸出內容會以郵件形式發給cron的用戶,而sendmail沒有啟動所以就產生了/var/spool/clientmqueue目錄下的那些文件,日積月累可能撐破磁碟。

解決:
1)直接手動刪除:ls|xargsrm-f;
2)徹底解決:在cron的自動執行語句後加上>/dev/2>&1。

問題:
某天研發某同事說10.50訪問10.52memcached服務異常,讓我們檢查下看網絡/服務/系統是否有異常。檢查發現系統正常,服務正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同時發現該機器的namesever是不起作用的。

原因:
becauseyourPCdoesn’tdoareverseDNSlookuponyourIPthen…whenyoutelnet/ftpintoyourlinuxbox,it』lldoadnslookuponyou。

解決:
1)修改/etc/hosts使hostname和ip對應;
2)在/etc/resolv.conf注釋掉nameserver或者找一個「活的」nameserver。

問題:
同事在mysql裡建表建不成功,提示如下:
mysql>createtablewosontest(colddname1char(1));
ERROR1005(HY000):Can’t create table『wosontest』(errno:30)
經檢查mysql用戶權限以及相關目錄權限沒問題;用perror30提示信息為:OSerrorcode30:Read-onlyfilesystem。

可能原因:
1)文件系統損壞;
2)磁碟又壞道;
3)fstab文件配置錯誤,如分區格式錯誤錯誤(將ntfs寫成了fat)、配置指令拼寫錯誤等。

解決:
1)由於是測試機,重啟機器後恢復;
2)網上說用mount可解決。

問題:
某天發現某臺機器df-h已用磁碟空間為90G,而du-sh/*顯示所有使用空間加起來才30G,囧。

原因:
可能某人直接用rm刪除某個正在寫的文件,導致文件刪了但磁碟空間沒釋放的問題。

解決:
1)最簡單重啟系統或者重啟相關服務。
2)幹掉進程

從lsof的輸出中,我們可以發現pid為25575的進程持有著以文件描述號(fd)為33打開的文件/oradata/DATAPRE/UNDOTBS009.dbf。

在我們找到了這個文件之後可以通過結束進程的方式來釋放被佔用的空間:echo>/proc/25575/fd/33


3)刪除正在寫的文件一般用cat/dev/null>file。

相關焦點

  • Podman 常見故障處理
    具有超過十年的網際網路運維及五年以上團隊管理經驗,多年容器雲的運維,尤其在Docker和kubernetes領域非常精通。Podman簡介由谷歌,Redhat、微軟、IBM、Intel、思科聯合成立的組織(OCI)制定了一系列容器運行的規範。
  • 引流小博士:散熱器營銷培訓,解決散熱器營銷的三個錦囊妙計!
    希望這篇散熱器營銷培訓,解決散熱器營銷的三個錦囊妙計!的文章大家會喜歡!不打折、不推銷,讓客戶主動上門?不管你是微商、淘寶、天貓、京東、直銷,還是傳統實體企業?養生、醫療、整形、教育、培訓、瑜伽、健身、餐飲、軟體、保險、金融……還是賣產品,賣護膚品、保健品、白酒、服裝、箱包、數碼產品、珠寶首飾……或者,項目招商,護膚品招商、保健品招商、美容院招商、軟體招商、培訓招商、金融招商、醫療招商、建材招商……你都能每天獲客500-1000客戶,並不斷裂變收錢……散熱器營銷培訓一:
  • 苦逼運維的ELK之路(一) -- 組件安裝篇
    我之前公司沒有運維,線上跑的業務環境是開發部署的,每臺業務配置都不一樣,讓我糾結的是每次給丫部署好環境,TMD一會兒就變了,雖然沒有自動化運維工具,10+臺機器通過管理手工還可以接受,可無腦開發,業務上線10分鐘就TMD一個版本,組件還不同,我內心中漂浮著數萬頭草泥馬...不出問題還好,出現故障我勒個去啊,一臺一臺翻日誌,出個應急加班還沒有加班費,我嘞個我嘞個我嘞個去啊……」這樣的場景是真實存在的
  • 又一個Linux發行版的32位死了
    來自:開源中國,作者:白開水不加糖 連結:https://www.oschina.net/news/116864/manjaro-linux但是由於某些原因,一些開發人員仍在繼續維護 32 位版本的作業系統。其中就包括微軟,該公司直到 2020 年都仍支持 32 位 Windows 10 作業系統。不過隨著 64 位系統逐漸成為市場的唯一選擇,微軟目前也已經開始取消 Windows 10 對 32 位系統的支持。
  • Linux 系統日常運維九大技能和運維網絡知識總結 | 周末送資料
    以下內容基本上可以涵蓋RedHat和CentOS層面90%的日常運維工作,並總結了系統運維中網絡方面的規劃、操作及故障處理等知識。
  • A320常見故障快速處理
    以下是A320常見故障的快速處理,大家可以進行收藏以備不時之需。故障現象處理過程電子艙通風故障:可能出現進氣扇和排風扇、設備通風、活門等的警告信息。1如只有電子設備艙通風的故障警告,地面檢查蒙皮進氣活門和出氣活門,確認開度正常,進出氣量正常,進氣口無外來物。復位計算機跳開關(122VU-Y17),一般信息會消失,等一分鐘左右後通過MCDU做AEVC的測試,如立即測試可能會出現虛假的測試正常信息。如果過一會信息再次出現,根據排故程來看可能性最大的是氣濾,其次是計算機。更換氣濾很快,過站可以執行。
  • 五個 PostgreSQL 典型故障案例及處理 | 進階技巧
    本文整理了5個故障案例,並介紹了詳細的處理方法,希望能夠對大家用好PostgreSQL有所幫助。【作者】泊涯,公司分部測試經理,集團公司技術專家成員之一,目前主要在客戶現場做銀行系統的性能診斷分析優化和測試管理工作。
  • 【微信精選】在孤單、寂寞、無助的時候,打開這10個錦囊
    我們要學會給自己的生活尋找出口,換個角度,新學一種技能……也許困難就會引刃而解。我們且叫它們「妙計」。今特送上10個錦囊,裡面藏有不少「妙計」。在品讀中感悟,其實生活可以別樣的美好。關注小妙方?微信每日推送全球範圍內最有價值、最有洞見的新鮮商業資訊,是商旅人士的必備錦囊,企業家的決策利器。證券時報網wwwstcncom↑(長按以上微信號可複製)財經類最受歡迎、影響力最大的公眾號之一。資本市場第一權威公眾號。《證券時報》是證監會、銀監會、保監會指定信息披露報紙。守望資本市場,推動社會進步。
  • 印表機常見問題及故障處理辦法 一
    > 在我們的生活中印表機已經很普及了,在工作和家庭中很多場景下都需要使用到,為我們的工作和學習提高了效率,但是在使用過程中也不可避免的會碰到各種意外,那麼我們在使用印表機的過程中哪些故障是很常見的呢
  • x86 伺服器常見問題和故障診斷流程 | 資料
    以下是由社區會員分享,社區專家AIX7整理的一些常見問題、故障案例,故障診斷流程。伺服器常見問題匯總伺服器支撐著整個企業的信息數據,對公司的信息儲存、業務開展、正常運作等等環節都具有著至關重要的意義。然而,伺服器在日常運行過程中,由於其複雜的硬體結構、繁瑣的運行原理,經常會出現一些大大小小的問題。
  • Ceph 日常運維常見難點和故障的解決辦法
    【導讀】Ceph 日常運維中有幾類常見問題,社區日前組織Ceph領域專家進行了線上的答疑交流,對社區會員提出的部分典型問題進行了分享解答
  • Docker 容器 9 類 48 個常見故障的處理和使用規範 | 周末送資料
    ,分為9個類一、啟動類故障1、docker: Cannot connect to the Docker daemon at unix:///var/run/docker.sock.31、overlayfs: Can't delete file moved from base layer to newly created dir even on ext4原因:Centos 提供的文件系統 XFS 和 Overlay 兼容問題導致,解決方式:這個問題的修復在內核 4.4.6以上32
  • 電腦常見故障處理方法培訓.
    二、常見計算機故障分析該部分主要講日常使用電腦過程中的故障是怎麼產生的,產生的原因以及這些故障該如何處理,先從理論上闡述,在從具體故障的處理進行講解。1、引發電腦故障的原因正常使用的故障:主要由機械的正常磨損、使用壽命已到或自然老化引起。
  • 窮遊網:這裡有一個包含十二年用戶體驗妙計的錦囊
    在產品層面,窮遊相繼推出「窮遊錦囊」、「窮遊」、「最世界」以及單獨App形式推出的「行程助手」,這些產品都是基於中國旅行者在海外自由行過程中的不同需求而針對性推出的。 「從公司層面來說,我們主要為出境遊的用戶提供各方面的諮詢和購買方案,相對來說我們的APP也是這樣的,業務比較複雜。
  • 【面試】美團Linux運維工程師面試真題曝光
    作為Linux運維工程師,進入大公司是開啟職業新起點的關鍵,今天馬哥linux運維及雲計算智囊團的小夥伴特別分享了其在美團面試
  • 737-NG常見故障處理
    737NG 飛機常見多發故障的簡易處理警告: 本處理方法結合我們的排故經驗以及其他公司的排故經驗,並參考FIM手冊編寫而成,本處理措施僅供機務過站時在地面參考使用
  • 《三國志大戰》之錦囊攻略
    185sy《三國志大戰》是一款大型3D策略卡牌遊戲,以優質多變的策略玩法為廣大玩家們所津津樂道。
  • x86 伺服器 4 類常見問題匯總和故障案例
    社區最近組織活動探討IBM、LENOVO、DELL等x86伺服器運維難點與故障處理,在此由社區專家aix7 (長春龍泰科技有限責任公司 項目經理 張勇)分享和整理了一些常見問題和故障案例,大家來看一看,以下故障你是否遇到過……伺服器支撐著整個企業的信息數據,對公司的信息儲存、業務開展、正常運作等等環節都具有著至關重要的意義。
  • Linux運維工程師面試題(二)
    一、非專業題:
  • 色選機十大常見故障及處理方法
    編者按本期內容提供:合肥泰禾光電科技股份有限公司(泰禾色選機)如有其它問題可聯繫合肥泰禾光電科技股份有限公司:0551-65399166常見故障一:電磁閥漏氣故障原因:閥內有灰塵;電磁閥損壞處理方法:閥門反覆測試;更換電磁閥常見故障二:電磁閥不動作故障原因:閥後的插頭與插座接觸不良;閥芯斷線;色選板損壞處理方法