系統緩慢+CPU 100%+頻繁Full GC問題的定位排查思路!

2020-12-21 酷扯兒

本文轉載自【微信公眾號:java進階架構師,ID:java_jiagoushi】經微信公眾號授權轉載,如需轉載與原文作者聯繫

處理過線上問題的同學基本上都會遇到系統突然運行緩慢,CPU 100%,以及Full GC次數過多的問題。

當然,這些問題的最終導致的直觀現象就是系統運行緩慢,並且有大量的報警。

本文主要針對系統運行緩慢這一問題,提供該問題的排查思路,從而定位出問題的代碼點,進而提供解決該問題的思路。

對於線上系統突然產生的運行緩慢問題,如果該問題導致線上系統不可用,那麼首先需要做的就是,導出jstack和內存信息,然後重啟系統,儘快保證系統的可用性。

這種情況可能的原因主要有兩種:

代碼中某個位置讀取數據量較大,導致系統內存耗盡,從而導致Full GC次數過多,系統緩慢;代碼中有比較耗CPU的操作,導致CPU過高,系統運行緩慢;相對來說,這是出現頻率最高的兩種線上問題,而且它們會直接導致系統不可用。另外有幾種情況也會導致某個功能運行緩慢,但是不至於導致系統不可用:

代碼某個位置有阻塞性的操作,導致該功能調用整體比較耗時,但出現是比較隨機的;某個線程由於某種原因而進入WAITING狀態,此時該功能整體不可用,但是無法復現;由於鎖使用不當,導致多個線程進入死鎖狀態,從而導致系統整體比較緩慢。對於這三種情況,通過查看CPU和系統內存情況是無法查看出具體問題的,因為它們相對來說都是具有一定阻塞性操作,CPU和系統內存使用情況都不高,但是功能卻很慢。

下面我們就通過查看系統日誌來一步一步甄別上述幾種問題。

1. Full GC次數過多

相對來說,這種情況是最容易出現的,尤其是新功能上線時。對於Full GC較多的情況,其主要有如下兩個特徵:

線上多個線程的CPU都超過了100%,通過jstack命令可以看到這些線程主要是垃圾回收線程通過jstat命令監控GC情況,可以看到Full GC次數非常多,並且次數在不斷增加。首先我們可以使用

top

命令查看系統CPU的佔用情況,如下是系統CPU較高的一個示例:

top - 08:31:10 up 30 min, 0 users, load average: 0.73, 0.58, 0.34KiB Mem: 2046460 total, 1923864 used, 122596 free, 14388 buffersKiB Swap: 1048572 total, 0 used, 1048572 free. 1192352 cached MemPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 9 root 20 0 2557160 288976 15812 S 98.0 14.1 0:42.60 java

可以看到,有一個Java程序此時CPU佔用量達到了98.8%,此時我們可以複製該進程id

9

,並且使用如下命令查看呢該進程的各個線程運行情況:

top -Hp 9

該進程下的各個線程運行情況如下:

top - 08:31:16 up 30 min, 0 users, load average: 0.75, 0.59, 0.35Threads: 11 total, 1 running, 10 sleeping, 0 stopped, 0 zombie%Cpu(s): 3.5 us, 0.6 sy, 0.0 ni, 95.9 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 stKiB Mem: 2046460 total, 1924856 used, 121604 free, 14396 buffersKiB Swap: 1048572 total, 0 used, 1048572 free. 1192532 cached MemPID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 10 root 20 0 2557160 289824 15872 R 79.3 14.2 0:41.49 java 11 root 20 0 2557160 289824 15872 S 13.2 14.2 0:06.78 java

可以看到,在進程為

9

的Java程序中各個線程的CPU佔用情況,接下來我們可以通過jstack命令查看線程id為

10

的線程為什麼耗費CPU最高。

需要注意的是,在jsatck命令展示的結果中,線程id都轉換成了十六進位形式。

可以用如下命令查看轉換結果,也可以找一個科學計算器進行轉換:

root@a39de7e7934b:/# printf "%x\n" 10a

這裡列印結果說明該線程在jstack中的展現形式為

0xa

,通過jstack命令我們可以看到如下信息:

"main" #1 prio=5 os_prio=0 tid=0x00007f8718009800 nid=0xb runnable [0x00007f871fe41000]java.lang.Thread.State: RUNNABLE at com.aibaobei.chapter2.eg2.UserDemo.main(UserDemo.java:9)"VM Thread" os_prio=0 tid=0x00007f871806e000 nid=0xa runnable

這裡的VM Thread一行的最後顯示

nid=0xa

,這裡nid的意思就是作業系統線程id的意思。而VM Thread指的就是垃圾回收的線程。

這裡我們基本上可以確定,當前系統緩慢的原因主要是垃圾回收過於頻繁,導致GC停頓時間較長。我們通過如下命令可以查看GC的情況:

root@8d36124607a0:/# jstat -gcutil 9 1000 10S0 S1 E O M CCS YGC YGCT FGC FGCT GCT 0.00 0.00 0.00 75.07 59.09 59.60 3259 0.919 6517 7.715 8.635 0.00 0.00 0.00 0.08 59.09 59.60 3306 0.930 6611 7.822 8.752 0.00 0.00 0.00 0.08 59.09 59.60 3351 0.943 6701 7.924 8.867 0.00 0.00 0.00 0.08 59.09 59.60 3397 0.955 6793 8.029 8.984

可以看到,這裡FGC指的是Full GC數量,這裡高達6793,而且還在不斷增長。從而進一步證實了是由於內存溢出導致的系統緩慢。

那麼這裡確認了內存溢出,但是如何查看你是哪些對象導致的內存溢出呢?

這個可以dump出內存日誌,然後通過eclipse的mat工具進行查看,如下是其展示的一個對象樹結構:

經過mat工具分析之後,我們基本上就能確定內存中主要是哪個對象比較消耗內存,然後找到該對象的創建位置,進行處理即可。

這裡的主要是PrintStream最多,但是我們也可以看到,其內存消耗量只有12.2%。

也就是說,其還不足以導致大量的Full GC,此時我們需要考慮另外一種情況,就是代碼或者第三方依賴的包中有顯示的

System.gc()

調用。

這種情況我們查看dump內存得到的文件即可判斷,因為其會列印GC原因:

[Full GC (System.gc()) [Tenured: 262546K->262546K(349568K), 0.0014879 secs] 262546K->262546K(506816K), [Metaspace: 3109K->3109K(1056768K)], 0.0015151 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] [GC (Allocation Failure) [DefNew: 2795K->0K(157248K), 0.0001504 secs][Tenured: 262546K->402K(349568K), 0.0012949 secs] 265342K->402K(506816K), [Metaspace: 3109K->3109K(1056768K)], 0.0014699 secs] [Times: user=0.00

比如這裡第一次GC是由於

System.gc()

的顯示調用導致的,而第二次GC則是JVM主動發起的。

總結來說,對於Full GC次數過多,主要有以下兩種原因:

代碼中一次獲取了大量的對象,導致內存溢出,此時可以通過eclipse的mat工具查看內存中有哪些對象比較多;內存佔用不高,但是Full GC次數還是比較多,此時可能是顯示的System.gc()調用導致GC次數過多,這可以通過添加-XX:+DisableExplicitGC來禁用JVM對顯示GC的響應。2. CPU過高

在前面第一點中我們講到,CPU過高可能是系統頻繁的進行Full GC,導致系統緩慢。而我們平常也肯定能遇到比較耗時的計算,導致CPU過高的情況,此時查看方式其實與上面的非常類似。

首先我們通過

top

命令查看當前CPU消耗過高的進程是哪個,從而得到進程id;

然後通過

top -Hp

來查看該進程中有哪些線程CPU過高,一般超過80%就是比較高的,80%左右是合理情況。這樣我們就能得到CPU消耗比較高的線程id。

接著通過該

線程id的十六進位表示

jstack

日誌中查看當前線程具體的堆棧信息。

在這裡我們就可以區分導致CPU過高的原因具體是Full GC次數過多還是代碼中有比較耗時的計算了。

如果是Full GC次數過多,那麼通過

jstack

得到的線程信息會是類似於VM Thread之類的線程

而如果是代碼中有比較耗時的計算,那麼我們得到的就是一個線程的具體堆棧信息。

如下是一個代碼中有比較耗時的計算,導致CPU過高的線程信息:

這裡可以看到,在請求UserController的時候,由於該Controller進行了一個比較耗時的調用,導致該線程的CPU一直處於100%。

我們可以根據堆棧信息,直接定位到UserController的34行,查看代碼中具體是什麼原因導致計算量如此之高。

3. 不定期出現的接口耗時現象

對於這種情況,比較典型的例子就是,我們某個接口訪問經常需要2~3s才能返回,這是比較麻煩的一種情況。

因為一般來說,其消耗的CPU不多,而且佔用的內存也不高。也就是說,我們通過上述兩種方式進行排查是無法解決這種問題的。

而且由於這樣的接口耗時比較大的問題是不定時出現的,這就導致了我們在通過

jstack

命令即使得到了線程訪問的堆棧信息,我們也沒法判斷具體哪個線程是正在執行比較耗時操作的線程。

對於不定時出現的接口耗時比較嚴重的問題,我們的定位思路基本如下:

首先找到該接口,通過壓測工具不斷加大訪問力度,如果說該接口中有某個位置是比較耗時的,由於我們的訪問的頻率非常高,那麼大多數的線程最終都將阻塞於該阻塞點

這樣通過多個線程具有相同的堆棧日誌,我們基本上就可以定位到該接口中比較耗時的代碼的位置。

如下是一個代碼中有比較耗時的阻塞操作通過壓測工具得到的線程堆棧日誌:

"http-nio-8080-exec-2" #29 daemon prio=5 os_prio=31 tid=0x00007fd08cb26000 nid=0x9603 waiting on condition [0x00007000031d5000]java.lang.Thread.State: TIMED_WAITING (sleeping) at java.lang.Thread.sleep(Native Method) at java.lang.Thread.sleep(Thread.java:340) at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386) at com.aibaobei.user.controller.UserController.detail(UserController.java:18)"http-nio-8080-exec-3" #30 daemon prio=5 os_prio=31 tid=0x00007fd08cb27000 nid=0x6203 waiting on condition [0x00007000032d8000] java.lang.Thread.State: TIMED_WAITING (sleeping) at java.lang.Thread.sleep(Native Method) at java.lang.Thread.sleep(Thread.java:340) at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386) at com.aibaobei.user.controller.UserController.detail(UserController.java:18)"http-nio-8080-exec-4" #31 daemon prio=5 os_prio=31 tid=0x00007fd08d0fa000 nid=0x6403 waiting on condition [0x00007000033db000] java.lang.Thread.State: TIMED_WAITING (sleeping) at java.lang.Thread.sleep(Native Method) at java.lang.Thread.sleep(Thread.java:340) at java.util.concurrent.TimeUnit.sleep(TimeUnit.java:386) at com.aibaobei.user.controller.UserController.detail(UserController.java:18)

從上面的日誌可以看你出,這裡有多個線程都阻塞在了UserController的第18行,說明這是一個阻塞點,也就是導致該接口比較緩慢的原因。

4. 某個線程進入WAITING狀態

對於這種情況,這是比較罕見的一種情況,但是也是有可能出現的,而且由於其具有一定的「不可復現性」,因而我們在排查的時候是非常難以發現的。

筆者曾經就遇到過類似的這種情況,具體的場景是,在使用CountDownLatch時,由於需要每一個並行的任務都執行完成之後才會喚醒主線程往下執行。

而當時我們是通過CountDownLatch控制多個線程連接並導出用戶的gmail郵箱數據,這其中有一個線程連接上了用戶郵箱。

但是連接被伺服器掛起了,導致該線程一直在等待伺服器的響應。最終導致我們的主線程和其餘幾個線程都處於WAITING狀態。

對於這樣的問題,查看過jstack日誌的讀者應該都知道,正常情況下,線上大多數線程都是處於

TIMED_WAITING

狀態,而我們這裡出問題的線程所處的狀態與其是一模一樣的,這就非常容易混淆我們的判斷。

解決這個問題的思路主要如下:

通過grep在jstack日誌中找出所有的處於TIMED_WAITING狀態的線程,將其導出到某個文件中,如a1.log如下是一個導出的日誌文件示例:

"Attach Listener" #13 daemon prio=9 os_prio=31 tid=0x00007fe690064000 nid=0xd07 waiting on condition [0x0000000000000000]"DestroyJavaVM" #12 prio=5 os_prio=31 tid=0x00007fe690066000 nid=0x2603 waiting on condition [0x0000000000000000]"Thread-0" #11 prio=5 os_prio=31 tid=0x00007fe690065000 nid=0x5a03 waiting on condition [0x0000700003ad4000]"C1 CompilerThread3" #9 daemon prio=9 os_prio=31 tid=0x00007fe68c00a000 nid=0xa903 waiting on condition [0x0000000000000000]

等待一段時間之後,比如10s,再次對jstack日誌進行grep,將其導出到另一個文件,如a2.log結果如下所示:

"DestroyJavaVM" #12 prio=5 os_prio=31 tid=0x00007fe690066000 nid=0x2603 waiting on condition [0x0000000000000000]"Thread-0" #11 prio=5 os_prio=31 tid=0x00007fe690065000 nid=0x5a03 waiting on condition [0x0000700003ad4000]"VM Periodic Task Thread" os_prio=31 tid=0x00007fe68d114000 nid=0xa803 waiting on condition

重複步驟2,待導出3~4個文件之後,我們對導出的文件進行對比,找出其中在這幾個文件中一直都存在的用戶線程這個線程基本上就可以確認是包含了處於等待狀態有問題的線程。因為正常的請求線程是不會在20~30s之後還是處於等待狀態的。經過排查得到這些線程之後,我們可以繼續對其堆棧信息進行排查如果該線程本身就應該處於等待狀態,比如用戶創建的線程池中處於空閒狀態的線程,那麼這種線程的堆棧信息中是不會包含用戶自定義的類的。這些都可以排除掉而剩下的線程基本上就可以確認是我們要找的有問題的線程。通過其堆棧信息,我們就可以得出具體是在哪個位置的代碼導致該線程處於等待狀態了。這裡需要說明的是,我們在判斷是否為用戶線程時,可以通過線程最前面的線程名來判斷

因為一般的框架的線程命名都是非常規範的,我們通過線程名就可以直接判斷得出該線程是某些框架中的線程,這種線程基本上可以排除掉。

而剩餘的,比如上面的

Thread-0

,以及我們可以辨別的自定義線程名,這些都是我們需要排查的對象。

經過上面的方式進行排查之後,我們基本上就可以得出這裡的

Thread-0

就是我們要找的線程,通過查看其堆棧信息,我們就可以得到具體是在哪個位置導致其處於等待狀態了。

如下示例中則是在SyncTask的第8行導致該線程進入等待了。

"Thread-0" #11 prio=5 os_prio=31 tid=0x00007f9de08c7000 nid=0x5603 waiting on condition [0x0000700001f89000]java.lang.Thread.State: WAITING (parking) at sun.misc.Unsafe.park(Native Method) at java.util.concurrent.locks.LockSupport.park(LockSupport.java:304) at com.aibaobei.chapter2.eg4.SyncTask.lambda$main$0(SyncTask.java:8) at com.aibaobei.chapter2.eg4.SyncTask$$Lambda$1/1791741888.run(Unknown Source) at java.lang.Thread.run(Thread.java:748)

5. 死鎖

對於死鎖,這種情況基本上很容易發現,因為

jstack

可以幫助我們檢查死鎖,並且在日誌中列印具體的死鎖線程信息。

如下是一個產生死鎖的一個

jstack

日誌示例:

可以看到,在jstack日誌的底部,其直接幫我們分析了日誌中存在哪些死鎖,以及每個死鎖的線程堆棧信息。

這裡我們有兩個用戶線程分別在等待對方釋放鎖,而被阻塞的位置都是在ConnectTask的第5行,此時我們就可以直接定位到該位置,並且進行代碼分析,從而找到產生死鎖的原因。

6. 小結

本文主要講解了線上可能出現的五種導致系統緩慢的情況,詳細分析了每種情況產生時的現象,已經根據現象我們可以通過哪些方式定位得到是這種原因導致的系統緩慢。

簡要的說,我們進行線上日誌分析時,主要可以分為如下步驟:

通過

top

命令查看CPU情況,如果CPU比較高,則通過

top -Hp

命令查看當前進程的各個線程運行情況

找出CPU過高的線程之後,將其線程id轉換為十六進位的表現形式,然後在jstack日誌中查看該線程主要在進行的工作。

這裡又分為兩種情況:

如果是正常的用戶線程,則通過該線程的堆棧信息查看其具體是在哪處用戶代碼處運行比較消耗CPU;如果該線程是VM Thread,則通過jstat -gcutil命令監控當前系統的GC狀況然後通過jmap dump:format=b,file=導出系統當前的內存數據。導出之後將內存情況放到eclipse的mat工具中進行分析即可得出內存中主要是什麼對象比較消耗內存,進而可以處理相關代碼;如果通過

top

命令看到CPU並不高,並且系統內存佔用率也比較低。此時就可以考慮是否是由於另外三種情況導致的問題。

可以根據具體情況分析:

如果是接口調用比較耗時,並且是不定時出現,則可以通過壓測的方式加大阻塞點出現的頻率,從而通過jstack查看堆棧信息,找到阻塞點;如果是某個功能突然出現停滯的狀況,這種情況也無法復現,此時可以通過多次導出jstack日誌的方式對比哪些用戶線程是一直都處於等待狀態,這些線程就是可能存在問題的線程;如果通過jstack可以查看到死鎖狀態,則可以檢查產生死鎖的兩個線程的具體阻塞點,從而處理相應的問題。本文主要是提出了五種常見的導致線上功能緩慢的問題,以及排查思路。

當然,線上的問題出現的形式是多種多樣的,也不一定局限於這幾種情況,如果我們能夠仔細分析這些問題出現的場景,就可以根據具體情況具體分析,從而解決相應的問題。

相關焦點

  • 線上一次fullgc搞得雞飛狗跳後,我總結了這篇文章
    過去半年時間裡,我們的廣告系統出現了多次和GC相關的線上問題,有Full GC過於頻繁的,有Young GC耗時過長的,這些問題帶來的影響是:GC過程中的程序卡頓,進一步導致服務超時從而影響到廣告收入。
  • ethtool 原理介紹和解決網卡丟包排查思路
    這次想分享的話題是比較常見伺服器網卡丟包現象排查思路,如果你是想了解點對點的丟包解決思路涉及面可能就比較廣,不妨先參考之前的文章 如何使用 MTR 診斷網絡問題[2],對於 Linux 常用的網卡丟包分析工具自然是 ethtool。ethtool 用於查看和修改網絡設備(尤其是有線乙太網設備)的驅動參數和硬體設置。
  • 記一次 Windows 電腦開機登錄後黑屏的問題分析與排查
    不過這個問題能在我的 Intel 中出現也是很迷;另外文章還有提到:細想以前似乎從未動過這個功能,這麼冒然改好像有點簡單粗暴,之後還可能會得不償失,所以這個方案暫時存著,先找找其它方面的問題;自行排查系統服務就像之前說的,搜索問題有時候並不能得到有效的解決方案,但是某些回復的解決手段或者思路是可以起到一定程度的啟發作用的,比如某一條大致說的是排查系統服務的問題
  • 如何減少長時間的GC暫停?
    因此,在本文中,我列出了可能導致長時間GC暫停的主要原因,以及解決這些問題的潛在解決方案。1.高對象創造率如果您的應用程式的對象創建率很高,那麼為了跟上它,垃圾回收率也將很高。高垃圾回收率也會增加GC暫停時間。因此,優化應用程式以創建更少的對象是減少長時間GC暫停的有效策略。這可能是一個耗時的練習,但值得100%進行。
  • 鴻蒙系統志在5G時代超越安卓,IoT生態發展緩慢問題亟待解決
    可是,當前存在IoT生態發展緩慢的問題,最核心的原因在於作業系統的高度碎片化。即使是同一家企業生產的 IoT 設備之間,都存在連接、配網等障礙,因此,5G時代,打造IoT設備之間的系統互通,除有運營商提供的良好5G網絡支撐外,還需要設備廠商、APP開發商的通力合作。
  • 實現自我隱藏 CPU 利用率的最佳方法,不妨一試!
    我的意思是,你想讓系統以及 task 的 CPU 利用率是多少它就是多少,一切都是由你的程序自己來調製演奏。 這需要一種自指機制。哈哈,完全可以,本文來演示,或者說,你可以把本文的內容看作一個戲弄運維人員的惡作劇。運維人員經常會遇到各種 CPU 高的問題,然後成群結隊地去排查,想讓隊伍更大些嗎?想讓事情更詭異嗎?我讓你查,我讓你查。哈哈。
  • win10系統出現磁碟100%佔用的問題
    一位win10之家的小夥伴在安裝win10 20h2系統的時候,打開任務管理器發現磁碟佔用100%的問題,其實,這是因為當win10系統中Windows Defender在進行掃描時,如果再進行其他的工作,磁碟佔用率就達到了100%,或者還有其他功能的佔用,具體的介紹及解決方法下面一起來看看吧。
  • 三步排查,解決問題
    不過安裝遊戲後,有些網友會遇到遊戲無法正常登錄、進不去遊戲的情況,本文提供了一張故障排查的方法,分為如下三步,希望能給大家解決難題。第1步,檢查本地網絡連接是否正常。當網絡擁堵時很有可能造成Spellbreak無法正常聯網登錄伺服器,包括有線、無線網絡信號穩定性等諸多影響網絡環境的因素都要一一排除,然後進入第2步。
  • CPU到底是什麼,一文弄通!
    (其實人腦也很厲害,拳頭大小的小球球上有100多億個神經細胞)現在知道CPU是幹嘛的了吧,下面的東西會更加具體,看到cpu長什麼樣,怎麼安裝,怎麼識別。二 CPU的模樣假如你自己組裝電腦或者更換CPU的話,買回來的盒裝CPU是這樣的:
  • 基於4G測量報告快速識別方案定位室內外同頻幹擾覆蓋問題
    基於4G測量報告快速識別方案定位室內外同頻幹擾覆蓋問題 陸南昌、韓喆、黃 發表於 2020-12-22 20:58:31 作者:陸南昌、韓喆、黃海暉、趙培、姜書敏
  • 2017高通驍龍cpu排行 2017cpu排行榜
    2017CPU性能排行榜中高通驍龍的cpu排行第幾呢?高通驍龍的cpu有哪些佔據前十名呢?
  • 亞馬遜店鋪流量暴跌,要怎麼排查問題?
    對於這個問題,群裡很多賣家朋友也表示感同身受。那麼,店鋪流量暴跌到底是出了什麼鬼?凡事都有兩面性,店鋪流量暴跌我們可以從外部原因和內部原因兩個方面分析,排查原因:1、店鋪流量暴跌,一般情況下都是競爭環境發生了變化導致的。賣家可以按銷量排查一下平臺上是不是有人跟賣或者低價競爭,有的話點擊率降低是很正常的事。
  • 關於手機使用北鬥導航系統,大部分人都不知道的幾個真相
    GPS本意就是全球衛星導航定位系統,它是一個總稱,可以指美國的衛星導航系統,也可以指俄羅斯的衛星導航系統,也可以指歐盟的格洛納斯衛星導航系統,當然也可以指中國的北鬥衛星導航系統。就因為美國是全球第一個組建成功衛星導航系統的國家,他們當時也將自己的衛星導航系統命名為「全球定位系統」,英文裡簡稱GPS,所以後面的幾十年只要說起GPS,大家都知道,那指的是美國的GPS,因為只有這一家嘛。可是後來出現了四大全球性的衛星導航系統,GPS就不能單獨代表一家了,但是人們的習慣在短時間內是很難改變的。
  • 網易雲信質量數據監控臺重磅發布 助開發者快速排查故障
    通過多項關鍵質量數據,質量數據監控臺可輔助開發者快速定位的五大類問題:網絡問題、設備問題、用戶行為問題、SDK問題、服務問題,提高故障排查的效率。目前網易雲信質量數據監控臺的功能,分為IM即時通訊、音視頻通話和直播三大類,在此我們對常見的問題排查場景重點介紹。
  • 奇葩業主頻繁擋電梯門,100多戶業主叫苦不迭
    樓內有兩部電梯供100多戶業主使用,12月5日深夜,業主發現兩部電梯無法運行,經排查24層電梯門被紙殼箱擋住,而27層電梯門中間放著一把笤帚,電梯門還在不斷的開關……記者了解到,自去年以來,該樓的兩部電梯多次被樓內一戶居民擋住,目前警方已介入調查此事。
  • 微博某業務資料庫連續兩次oom問題分析
    sys cpu花費大量的時間來進行碎片整理,MySQL被"拖"住了,threads running(不是thread connected)堆積的越來越多,qps也降低的很快,MySQL變得越來越無法響應請求。最後A從庫上的MySQL實例被OOM了。至於B的連接數比A要高很多,是因為正常的時候兩個從庫通過域名做的負載均衡。但是出現問題的時候,請求轉發到響應更快,free更充足的B上了。
  • 電商系統促銷模塊腳本引擎的應用
    架構思路Javashop電商系統的架構思路是「面向規則」,用規則將促銷模塊和其他模塊解耦,經過多年的經驗,我們總結出促銷的規則無非減價格或送東西(贈品、優惠券等)。如何顯示給用戶」類似的問題。而且基於規則的擴展也是非常方便的,只需要寫相應的腳本模板就行了。