此文匯總了Linux運維在做項目過程可能出現的故障及解決方法,看看是否與你有共鳴,並對你有幫助呢?
問題:
某天研發某同事找我說幫他看看他寫的shell腳本,死活不執行,報錯。我看了下,腳本很簡單,也沒有常規性的錯誤,報「:badinterpreter:Nosuchfileordirectory」錯。
看這錯,我就問他是不是在windows下編寫的腳本,然後在上傳到linux伺服器的……果然。
原因:
在DOS/windows裡,文本文件的換行符為rn,而在nix系統裡則為n,所以DOS/Windows裡編輯過的文本文件到了nix裡,每一行都多了個^M。
解決:
1)重新在linux下編寫腳本;
2)vi:%s/r//g:%s/^M//g(^M輸入用Ctrl+v,Ctrl+m)
附:sh-x腳本文件名,可以單步執行並回顯結果,有助於排查複雜腳本問題。
問題:
/var/spool/clientmqueue目錄佔用空間超過100G。
原因:
cron中執行的程序有輸出內容,輸出內容會以郵件形式發給cron的用戶,而sendmail沒有啟動所以就產生了/var/spool/clientmqueue目錄下的那些文件,日積月累可能撐破磁碟。
解決:
1)直接手動刪除:ls|xargsrm-f;
2)徹底解決:在cron的自動執行語句後加上>/dev/2>&1。
問題:
某天研發某同事說10.50訪問10.52memcached服務異常,讓我們檢查下看網絡/服務/系統是否有異常。檢查發現系統正常,服務正常,10.50ping10.52也正常,但10.50telnet10.52很慢。同時發現該機器的namesever是不起作用的。
原因:
becauseyourPCdoesn’tdoareverseDNSlookuponyourIPthen…whenyoutelnet/ftpintoyourlinuxbox,it』lldoadnslookuponyou。
解決:
1)修改/etc/hosts使hostname和ip對應;
2)在/etc/resolv.conf注釋掉nameserver或者找一個「活的」nameserver。
問題:
同事在mysql裡建表建不成功,提示如下:
mysql>createtablewosontest(colddname1char(1));
ERROR1005(HY000):Can’t create table『wosontest』(errno:30)
經檢查mysql用戶權限以及相關目錄權限沒問題;用perror30提示信息為:OSerrorcode30:Read-onlyfilesystem。
可能原因:
1)文件系統損壞;
2)磁碟又壞道;
3)fstab文件配置錯誤,如分區格式錯誤錯誤(將ntfs寫成了fat)、配置指令拼寫錯誤等。
解決:
1)由於是測試機,重啟機器後恢復;
2)網上說用mount可解決。
問題:
某天發現某臺機器df-h已用磁碟空間為90G,而du-sh/*顯示所有使用空間加起來才30G,囧。
原因:
可能某人直接用rm刪除某個正在寫的文件,導致文件刪了但磁碟空間沒釋放的問題。
解決:
1)最簡單重啟系統或者重啟相關服務。
2)幹掉進程
從lsof的輸出中,我們可以發現pid為25575的進程持有著以文件描述號(fd)為33打開的文件/oradata/DATAPRE/UNDOTBS009.dbf。
在我們找到了這個文件之後可以通過結束進程的方式來釋放被佔用的空間:echo>/proc/25575/fd/33
3)刪除正在寫的文件一般用cat/dev/null>file。