慌了,面試居然被問到怎麼做高並發系統的限流?

2021-01-20 51CTO

緩存

緩存比較好理解,在大型高並發系統中,如果沒有緩存資料庫將分分鐘被爆,系統也會瞬間癱瘓。使用緩存不單單能夠提升系統訪問速度、提高並發訪問量,也是保護資料庫、保護系統的有效方式。大型網站一般主要是「讀」,緩存的使用很容易被想到。

在大型「寫」系統中,緩存也常常扮演者非常重要的角色。比如累積一些數據批量寫入,內存裡面的緩存隊列(生產消費),以及HBase寫數據的機制等等也都是通過緩存提升系統的吞吐量或者實現系統的保護措施。甚至消息中間件,你也可以認為是一種分布式的數據緩存。

降級

服務降級是當伺服器壓力劇增的情況下,根據當前業務情況及流量對一些服務和頁面有策略的降級,以此釋放伺服器資源以保證核心任務的正常運行。降級往往會指定不同的級別,面臨不同的異常等級執行不同的處理。根據服務方式:可以拒接服務,可以延遲服務,也有時候可以隨機服務。

根據服務範圍:可以砍掉某個功能,也可以砍掉某些模塊。總之服務降級需要根據不同的業務需求採用不同的降級策略。主要的目的就是服務雖然有損但是總比沒有好。

限流

限流可以認為服務降級的一種,限流就是限制系統的輸入和輸出流量已達到保護系統的目的。一般來說系統的吞吐量是可以被測算的,為了保證系統的穩定運行,一旦達到的需要限制的閾值,就需要限制流量並採取一些措施以完成限制流量的目的。

比如:延遲處理,拒絕處理,或者部分拒絕處理等等。

限流的算法

常見的限流算法有:計數器、漏桶和令牌桶算法。

計數器

計數器是最簡單粗暴的算法。比如某個服務最多只能每秒鐘處理100個請求。我們可以設置一個1秒鐘的滑動窗口,窗口中有10個格子,每個格子100毫秒,每100毫秒移動一次,每次移動都需要記錄當前服務請求的次數。

內存中需要保存10次的次數。可以用數據結構LinkedList來實現。格子每次移動的時候判斷一次,當前訪問次數和LinkedList中最後一個相差是否超過100,如果超過就需要限流了。

很明顯,當滑動窗口的格子劃分的越多,那麼滑動窗口的滾動就越平滑,限流的統計就會越精確。

示例代碼如下:

//服務訪問次數,可以放在Redis中,實現分布式系統的訪問計數 Long counter = 0L; //使用LinkedList來記錄滑動窗口的10個格子。 LinkedList<Long> ll = new LinkedList<Long>();  public static void main(String[] args) {     Counter counter = new Counter();      counter.doCheck(); }  private void doCheck() {     while (true)     {         ll.addLast(counter);          if (ll.size() > 10)         {             ll.removeFirst();         }          //比較最後一個和第一個,兩者相差一秒         if ((ll.peekLast() - ll.peekFirst()) > 100)         {             //To limit rate         }          Thread.sleep(100);     } } 

漏桶算法

漏桶算法即leaky bucket是一種非常常用的限流算法,可以用來實現流量整形(Traffic Shaping)和流量控制(Traffic Policing)。貼了一張維基百科上示意圖幫助大家理解:

漏桶算法的主要概念如下:

一個固定容量的漏桶,按照常量固定速率流出水滴; 如果桶是空的,則不需流出水滴; 可以以任意速率流入水滴到漏桶; 如果流入水滴超出了桶的容量,則流入的水滴溢出了(被丟棄),而漏桶容量是不變的。

漏桶算法比較好實現,在單機系統中可以使用隊列來實現(.Net中TPL DataFlow可以較好的處理類似的問題,你可以在這裡找到相關的介紹),在分布式環境中消息中間件或者Redis都是可選的方案。

令牌桶算法

令牌桶算法是一個存放固定容量令牌(token)的桶,按照固定速率往桶裡添加令牌。令牌桶算法基本可以用下面的幾個概念來描述:

令牌將按照固定的速率被放入令牌桶中。比如每秒放10個。

桶中最多存放b個令牌,當桶滿時,新添加的令牌被丟棄或拒絕。

當一個n個字節大小的數據包到達,將從桶中刪除n個令牌,接著數據包被發送到網絡上。

如果桶中的令牌不足n個,則不會刪除令牌,且該數據包將被限流(要麼丟棄,要麼緩衝區等待)。

如下圖:

令牌算法是根據放令牌的速率去控制輸出的速率,也就是上圖的to network的速率。to network我們可以理解為消息的處理程序,執行某段業務或者調用某個RPC。

漏桶和令牌桶的比較

令牌桶可以在運行時控制和調整數據處理的速率,處理某時的突發流量。放令牌的頻率增加可以提升整體數據處理的速度,而通過每次獲取令牌的個數增加或者放慢令牌的發放速度和降低整體數據處理速度。而漏桶不行,因為它的流出速率是固定的,程序處理速度也是固定的。更多算法相關:算法聚合

整體而言,令牌桶算法更優,但是實現更為複雜一些。

限流算法實現

Guava

Guava是一個Google開源項目,包含了若干被Google的Java項目廣泛依賴的核心庫,其中的RateLimiter提供了令牌桶算法實現:平滑突發限流(SmoothBursty)和平滑預熱限流(SmoothWarmingUp)實現。

1. 常規速率:

創建一個限流器,設置每秒放置的令牌數:2個。返回的RateLimiter對象可以保證1秒內不會給超過2個令牌,並且是固定速率的放置。達到平滑輸出的效果

public void test() {     /**      * 創建一個限流器,設置每秒放置的令牌數:2個。速率是每秒可以2個的消息。      * 返回的RateLimiter對象可以保證1秒內不會給超過2個令牌,並且是固定速率的放置。達到平滑輸出的效果      */     RateLimiter r = RateLimiter.create(2);      while (true)     {         /**          * acquire()獲取一個令牌,並且返回這個獲取這個令牌所需要的時間。如果桶裡沒有令牌則等待,直到有令牌。          * acquire(N)可以獲取多個令牌。          */         System.out.println(r.acquire());     } } 

上面代碼執行的結果如下圖,基本是0.5秒一個數據。拿到令牌後才能處理數據,達到輸出數據或者調用接口的平滑效果。acquire()的返回值是等待令牌的時間,如果需要對某些突發的流量進行處理的話,可以對這個返回值設置一個閾值,根據不同的情況進行處理,比如過期丟棄。

2. 突發流量:

突發流量可以是突發的多,也可以是突發的少。首先來看個突發多的例子。還是上面例子的流量,每秒2個數據令牌。如下代碼使用acquire方法,指定參數。

System.out.println(r.acquire(2)); System.out.println(r.acquire(1)); System.out.println(r.acquire(1)); System.out.println(r.acquire(1)); 

得到如下類似的輸出。

如果要一次新處理更多的數據,則需要更多的令牌。代碼首先獲取2個令牌,那麼下一個令牌就不是0.5秒之後獲得了,還是1秒以後,之後又恢復常規速度。這是一個突發多的例子,如果是突發沒有流量,如下代碼:

System.out.println(r.acquire(1)); Thread.sleep(2000); System.out.println(r.acquire(1)); System.out.println(r.acquire(1)); System.out.println(r.acquire(1)); 

得到如下類似的結果:


等了兩秒鐘之後,令牌桶裡面就積累了3個令牌,可以連續不花時間的獲取出來。處理突發其實也就是在單位時間內輸出恆定。這兩種方式都是使用的RateLimiter的子類SmoothBursty。另一個子類是SmoothWarmingUp,它提供的有一定緩衝的流量輸出方案。

/** * 創建一個限流器,設置每秒放置的令牌數:2個。速率是每秒可以210的消息。 * 返回的RateLimiter對象可以保證1秒內不會給超過2個令牌,並且是固定速率的放置。達到平滑輸出的效果 * 設置緩衝時間為3秒 */ RateLimiter r = RateLimiter.create(2,3,TimeUnit.SECONDS);  while (true) {     /**      * acquire()獲取一個令牌,並且返回這個獲取這個令牌所需要的時間。如果桶裡沒有令牌則等待,直到有令牌。      * acquire(N)可以獲取多個令牌。      */     System.out.println(r.acquire(1));     System.out.println(r.acquire(1));     System.out.println(r.acquire(1));     System.out.println(r.acquire(1)); } 

輸出結果如下圖,由於設置了緩衝的時間是3秒,令牌桶一開始並不會0.5秒給一個消息,而是形成一個平滑線性下降的坡度,頻率越來越高,在3秒鐘之內達到原本設置的頻率,以後就以固定的頻率輸出。

圖中紅線圈出來的3次累加起來正好是3秒左右。這種功能適合系統剛啟動需要一點時間來「熱身」的場景。

Nginx

對於Nginx接入層限流可以使用Nginx自帶了兩個模塊:

連接數限流模塊ngx_http_limit_conn_module 漏桶算法實現的請求限流模塊ngx_http_limit_req_module

1. ngx_http_limit_conn_module

我們經常會遇到這種情況,伺服器流量異常,負載過大等等。對於大流量惡意的攻擊訪問,會帶來帶寬的浪費,伺服器壓力,影響業務,往往考慮對同一個ip的連接數,並發數進行限制。

ngx_http_limit_conn_module 模塊來實現該需求。該模塊可以根據定義的鍵來限制每個鍵值的連接數,如同一個IP來源的連接數。並不是所有的連接都會被該模塊計數,只有那些正在被處理的請求(這些請求的頭信息已被完全讀入)所在的連接才會被計數。

我們可以在nginx_conf的http{}中加上如下配置實現限制:

#限制每個用戶的並發連接數,取名one limit_conn_zone $binary_remote_addr zone=one:10m;  #配置記錄被限流後的日誌級別,默認error級別 limit_conn_log_level error; #配置被限流後返回的狀態碼,默認返回503 limit_conn_status 503; 

然後在server{}裡加上如下代碼:

#限制用戶並發連接數為1 limit_conn one 1; 

然後我們是使用ab測試來模擬並發請求:

ab -n 5 -c 5 http://10.23.22.239/index.html 

得到下面的結果,很明顯並發被限制住了,超過閾值的都顯示503:

另外剛才是配置針對單個IP的並發限制,還是可以針對域名進行並發限制,配置和客戶端IP類似。

#http{}段配置 limit_conn_zone $ server_name zone=perserver:10m; #server{}段配置 limit_conn perserver 1; 

2. ngx_http_limit_req_module

上面我們使用到了ngx_http_limit_conn_module 模塊,來限制連接數。那麼請求數的限制該怎麼做呢?這就需要通過ngx_http_limit_req_module 模塊來實現,該模塊可以通過定義的鍵值來限制請求處理的頻率。

特別的,可以限制來自單個IP位址的請求處理頻率。限制的方法是使用了漏鬥算法,每秒固定處理請求數,推遲過多請求。如果請求的頻率超過了限制域配置的值,請求處理會被延遲或被丟棄,所以所有的請求都是以定義的頻率被處理的。

在http{}中配置

#區域名稱為one,大小為10m,平均處理的請求頻率不能超過每秒一次。  limit_req_zone $binary_remote_addr zone=one:10m rate=1r/s; 

在server{}中配置

#設置每個IP桶的數量為5 limit_req zone=one burst=5; 

上面設置定義了每個IP的請求處理只能限制在每秒1個。並且服務端可以為每個IP緩存5個請求,如果操作了5個請求,請求就會被丟棄。

使用ab測試模擬客戶端連續訪問10次:

ab -n 10 -c 10 http://10.23.22.239/index.html 

如下圖,設置了通的個數為5個。一共10個請求,第一個請求馬上被處理。第2-6個被存放在桶中。由於桶滿了,沒有設置nodelay因此,餘下的4個請求被丟棄。

【編輯推薦】

【責任編輯:

武曉燕

TEL:(010)68476606】

點讚 0

相關焦點

  • 「面經」慌了,面試居然被問到怎麼做高並發系統的限流?
    經微信公眾號授權轉載,如需轉載與原文作者聯繫作者:nick haocnblogs.com/haoxinyue/p/6792309.html開濤大神在博客中說過:在開發高並發系統時有三把利器用來保護系統:緩存、降級和限流。
  • 高並發系統如何做到限流,看這篇就對了
    緩存緩存比較好理解,在大型高並發系統中使用緩存不單單能夠提升系統訪問速度、提高並發訪問量,也是保護資料庫、保護系統的有效方式。大型網站一般主要是「讀」,緩存的使用很容易被想到。在大型「寫」系統中,緩存也常常扮演著非常重要的角色。比如累積一些數據批量寫入,內存裡面的緩存隊列(生產消費),以及HBase寫數據的機制等等也都是通過緩存提升系統的吞吐量或者實現系統的保護措施。
  • 開發高並發系統時常見的限流方式及算法
    限流詳解在開發高並發系統時,有很多手段來保護系統,如緩存、降級和限流等。緩存目的是提升系統訪問速度和增大系統處理能力,可謂是抗高並發流量的銀彈。而降級是當服務出問題或者影響到核心流程的性能,需要暫時屏蔽掉,待高峰過去或者問題解決後再打開的場景。
  • PHP高並發高可用系統以及面試分析
    ,或者被對手 ddos 攻擊,都會造成高並發中網站癱瘓,清洗流 量一般就可以的,不要讓辣雞流量貫穿整個業務。提前設計兜底方案 ① 降級,例如商品詳情頁面不展示推薦 商品,或者減少推薦商品展示數量等, ② 限流,不讓更多流量湧入,能 減少很多壓力 ③ 過載臨界點拒絕服務,這個是最壞的情況,直接阻斷壓 垮系統的最後一個流量。2.面試官為什麼會問你,如何設計一個高並發系統?
  • 一次阿里面試,我被問到了如何設計秒殺系統
    在搶購那一刻,會有大量用戶同時高並發的請求應用系統,可能會達到每秒幾萬、幾十萬的請求。如果系統無法處理這麼高的請求,那麼就會崩潰,從而導致系統不可用。對於秒殺活動來說,要求系統不會出現壓力過大而崩潰的場景,並且不會出現超賣、少賣的情形。
  • 技術分享 | 一文了解高並發限流算法
    一、前言作為熱點頻出的電商系統,經常遇到高並發,熱點秒殺的場景。我們在開發設計高並發海量業務請求的系統時,通常利用三板斧:緩存、降級和限流來保障系統穩定性。緩存:使業務數據更靠近數據的使用者,提升程序訪問數據速度和增大系統QPS容量。
  • 「高並發」億級流量場景下如何實現分布式限流?
    分布式限流的關鍵就是需要將限流服務做成全局的,統一的。可以採用Redis+Lua技術實現,通過這種技術可以實現高並發和高性能的限流。Lua是一種輕量小巧的腳本程式語言,用標準的C語言編寫的開源腳本,其設計的目的是為了嵌入到應用程式中,為應用程式提供靈活的擴展和定製功能。
  • 資料庫之一文了解高並發限流算法-愛可生
    一、前言作為熱點頻出的電商系統,經常遇到高並發,熱點秒殺的場景。我們在開發設計高並發海量業務請求的系統時,通常利用三板斧:緩存、降級和限流來保障系統穩定性。緩存:使業務數據更靠近數據的使用者,提升程序訪問數據速度和增大系統QPS容量。
  • 每日一題之 高並發系統
    優質文章,及時送達高並發系統的設計與實現在開發高並發系統時有三把利器用來保護系統:緩存、降級和限流。緩存:緩存比較好理解,在大型高並發系統中,如果沒有緩存資料庫將分分鐘被爆,系統也會瞬間癱瘓。使用緩存不單單能夠提升系統訪問速度、提高並發訪問量,也是保護資料庫、保護系統的有效方式。大型網站一般主要是「讀」,緩存的使用很容易被想到。在大型「寫」系統中,緩存也常常扮演者非常重要的角色。
  • 高並發系統三大利器之限流
    什麼是限流?❝限流可以認為服務降級的一種,限流就是限制系統的輸入和輸出流量已達到保護系統的目的。一般來說系統的吞吐量是可以被測算的,為了保證系統的穩定運行,一旦達到的需要限制的閾值,就需要限制流量並採取一些措施以完成限制流量的目的。
  • 阿里技術官甩出Java高並發秒殺系統,賊叼
    前言我們知道,高並發代表著大流量,高並發系統設計的魅力就在於我們能夠憑藉自己的聰明才智設計巧妙的方案,從而抵抗巨大流量的衝擊,帶給用戶更好的使用體驗作為一名程式設計師,不能連高並發都不會,無論是在面試還是工作中,都是不可避免的一部分,準備好筆記本,詳細介紹高並發:億級高並發系統設計(分為七篇)01 基礎篇高並發系統:它的通用設計方法是什麼
  • Alibaba高並發業務秒殺系統落地實戰文檔,已實踐某大型秒殺場景
    我們知道,高並發代表著大流量,高並發系統設計的魅力就在於我們能夠憑藉自己的聰明才智設計巧妙的方案,從而抵抗巨大流量的衝擊,帶給用戶更好的使用體驗。這些方案好似能操縱流量,讓流量更加平穩得被系統中的服務和組件處理。
  • Nginx面試一般都會問哪些專業的問題呢?
    ,面試的時候一般都會問哪些專業的問題呢?」,但說實話,我對Nginx的了解處於小白的階段。所以,小青不得不向同事以及度娘請教,今天就將我請教的成果整理如下,希望能夠幫助到大家哦!2、為什麼要用Nginx跨平臺、配置簡單、方向代理、高並發連接:處理2-3萬並發連接數,官方監測能支持5萬並發,內存消耗小:開啟10個nginx才佔150M內存 ,nginx處理靜態文件好,耗費內存少,而且Nginx內置的健康檢查功能:如果有一個伺服器宕機,會做一個健康檢查,再發送的請求就不會發送到宕機的伺服器了。重新將請求提交到其他的節點上。
  • 分布式/Spring/高並發/設計模式等問個遍,網易3面絕了
    :Spring框架(IOC、AOP、Spring事物)+高並發+設計模式+分布式架構等對應相關的 [整理的面試]+[收集的筆記]+[手繪的思維導圖]皆可免費分享PDF給面試或者學習等有需要的小夥伴們,直接轉發+私信我【面試】便能立即給你回復網易秋招提前批(Java崗)面試總結
  • 作為資深面試官,被問爛的高並發,說實話,能回答到點的人不多
    在過往的面試中,如果候選人做過高並發的項目,我通常會讓對方談談對於高並發的理解,但是能系統性地回答好此問題的人並不多,大概分成這樣幾類:我們常見的高並發場景有:淘寶的雙11、春運時的搶票、微博大V的熱點新聞等。除了這些典型事情,每秒幾十萬請求的秒殺系統、每天千萬級的訂單系統、每天億級日活的信息流系統等,都可以歸為高並發。
  • 如何設計一個高並發系統?
    面試題如何設計一個高並發系統?面試官心理分析說實話,如果面試官問你這個題目,那麼你必須要使出全身吃奶勁了。為啥?因為你沒看到現在很多公司招聘的 JD 裡都是說啥,有高並發就經驗者優先。如果你確實有真才實學,在網際網路公司裡幹過高並發系統,那你確實拿 offer 基本如探囊取物,沒啥問題。
  • 高並發解決方案
    今天我們得空看看高流量服務的系統架構應該如何設計,才能扛得住突發事件帶來的瞬間高峰流量。在像微博這樣的媒體平臺中,採用緩存集群模式進行設計是最合適的,因為用戶在微博上的訴求主要就是查看獲取相關信息。緩存集群是什麼呢?
  • 這本阿里獨有的「高並發筆記」讓我漲薪30K,你值得擁有
    系統設計目標(三):如何讓系統易於擴展?06. 面試現場第一期:當問到組件實現原理時,面試官是在刁難你嗎?NoSQL:在高並發場景下,資料庫和NoSQL如何做到互補?消息隊列:如何降低消息隊列系統中消息的延遲?04. 面試現場第二期:當問到項目經歷時,面試官究竟想要了解什麼?
  • 高並發系統三大利器:限流、降級、緩存
    高並發意味著大流量,需要運用技術手段抵抗流量的衝擊,這些手段好比操作流量,能讓流量更平穩地被系統所處理,帶給用戶更好的體驗。我們常見的高並發場景有:淘寶的雙11、春運時的搶票、微博大V的熱點新聞等。除了這些典型事情,每秒幾十萬請求的秒殺系統、每天千萬級的訂單系統、每天億級日活的信息流系統等,都可以歸為高並發。
  • 雙十一來臨,阿里教你如何輕鬆應對「女朋友」帶來的高並發場景
    先降級,再限流。4、資料庫扛不住了?上分布式緩存。...處理的步驟太多不列舉,對於Java 程式設計師而言,必須熟練掌握並發編程。公司面試的時候也將高並發的問題加入,面試官:「你的系統如何支撐高並發?」但是不少人回答得毫無邏輯,還有人反問「公司的業務不需要,用戶量級達不到,根本不需要高並發架構設計,哪來的高並發經驗?」卻大大忽略了設計和優化的思想是可以進行歸納推理的。