Sentinel實戰(三)、流控規則之流控效果及流控小結

spring cloud Alibaba-Sentinel實戰（三）、流控效果+流控小結

一、流控規則：流控效果
- 一）、流控效果：預熱
- - 1、概念含義
  - 2、案例
  - - 流控規則設置
    - 測試結果
- 二）、流控效果：排隊等待
- - 1、概念含義
  - 2、案例
  - - 流控規則設置
    - 測試及結果
二、流控規則實際使用總結
- 一）、閾值類型、流控模式、流控效果組合及適用場景
- - 1、閾值為QPS 、流控模式為直接、快速失敗[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
  - 2、閾值為QPS 、流控模式為關聯、快速失敗[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
  - 3、閾值為QPS 、流控模式為鏈路、快速失敗[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
  - 4、閾值為QPS 、流控模式為直接、Warm Up[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
  - 5、閾值為QPS 、流控模式為直接、排隊[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
  - 6、閾值為線程數、流控模式為直接、快速失敗[的流控效果]
  - - 1）規則適用的業務特點
    - 2）適用場景
    - 3）配置時要注意的事項
- 二）、配置注意事項總結
- - 1、閾值評估
  - 2、規則要動態調整
  - 3、監控與報警
  - 4、規則持久化
  - 5、測試及驗證
- 小結：

一、流控規則：流控效果

流控效果有當前支持三種：直接失敗、預熱（warm up）、排隊等待。
直接失敗沒什么可說的，下面主要圍繞預熱和排隊等待展開。

一）、流控效果：預熱

主要針對開啟活動之前，系統流量是比較低的，比如秒殺活動即將開始后，系統訪問量突增，可能把系統壓垮，增加預熱流控規則，是個比較好的方案。

1、概念含義

預熱就是下圖流控效果里，Warm Up ；即預熱/冷啟動方式；這種方式用于系統長期處于低流量的情況，當流量突然激增，由于流量的突然激增可能瞬間會把系統壓垮。通過這種“冷啟動”的方式，讓通過的流量緩慢增加，在一定時間內逐漸增加到閾值上限，給系統一個緩沖的時間，通過這種冷啟動的方式避免系統被壓垮。
預熱公式為單機閾值/coldFactor（預熱因子，默認為3），經過預熱時間后，才會達到閾值。
在這里插入圖片描述
設置參數后的具體含義通過案例闡述。

2、案例

這種預熱流控的設置，通常的場景類如秒殺，主要是為了防止瞬間激增的流量打垮系統。關于設置秒殺的代碼及配置如下：

端口9101服務，秒殺接口代碼段：

   /*** 秒殺活動，設置預熱的流控規則*/@GetMapping("/secKill")public String secKill() throws InterruptedException {log.info("---secKill---流控模式為 預熱");Thread.sleep(200);return "ok";}

yaml文件配置內容如下：

server:port: 9101
spring:application:name: nacos-consumercloud:nacos:discovery:server-addr: 192.168.0.101:80sentinel:transport:dashboard: localhost:8080   port: 8720   web-context-unify: falsemanagement:endpoint:web:exposure:include:'*'
service-url:nacos-user-service: http://nacos-provider

主啟動類添加服務發現注解：


import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.client.discovery.EnableDiscoveryClient;
import org.springframework.cloud.client.loadbalancer.LoadBalanced;
import org.springframework.context.annotation.Bean;
import org.springframework.web.client.RestTemplate;@EnableDiscoveryClient
@SpringBootApplication
public class NacosConsumer9101Application {public static void main(String[] args) {SpringApplication.run(NacosConsumer9101Application.class, args);}}

啟動服務訪問，初始化sentinel的簇點鏈路，訪問鏈接：http://localhost:9101/secKill

在資源 /secKill添加流控規則。

流控規則設置

該流控規則設置含義：當單機 QPS達到10，預熱時長是5秒。
在這 5s內流量有個流量突增的過程，預熱因子默認是3，根據預熱公式，當QPS超過單機閾值的三分之一，即超過3時，就開始限流，隨著5s的推移，第一秒可能是3，第二秒是4，第5s是10。這個預熱的流控效果，其實指的就是系統處理流量突增的過程。

在這里插入圖片描述

測試結果

流控規則設置完之后，并發線程數設置為10，持續2min，開始進行壓測【工具jmeter】：
在這里插入圖片描述
觀察資源流量的實時監控情況，可看出QPS超過10 之后，拒絕QPS那列有了數值，說明被限流了。再看下壓測接口響應失敗jmeter的顯示內容，提示被限流了：

二）、流控效果：排隊等待

1、概念含義

勻速排隊的方式，可以嚴格控制請求通過的時間間隔，就是讓請求勻速通過，對應算法為漏桶算法。
這種方式主要用來處理間隔性突發流量，類似消息隊列，在某一秒大量請求襲來，而后處于空閑狀態，可以讓空閑時間處理先前這大批量的請求，而不是第一時間拒絕多余的請求。
類似一個勻速器，在固定時間間隔讓請求通過：

若當前請求距離上個通過的請求通過的時間間隔大于預設值，則請求通過。
否則，若當前請求的預期時間<規則預設的超時時間，那當前請求就要等待直到大于預設值則請求通過。
若預期的通過時間超過最大排隊時長，則直接拒絕這個請求。

Sentinel的勻速排隊等待流控效果，是基于漏桶算法結合虛擬隊列等待機制實現的。
注意??：勻速排隊模式暫時不支持QPS超過1000的場景。

2、案例

比如這個例子：QPS單機閾值超過5，則進行排隊等待，在15s內，1s處理5個，超過15s 還沒處理完的其他請求，則視為超時。

流控規則設置

在這里插入圖片描述

測試及結果

壓測并發量10，持續2min，訪問鏈接：http://localhost:9101/waiting
觀察Sentinel流量監控平臺的變化以及指標統計情況：

前半段超時時間設置的15s ，可以看到沒有被限流的請求。
后半段藍色折線圖，流控規則排隊等待的超時時間調整為1s，觀察圖表可以看到超過1s的請求視為超時，還沒處理的請求都被限流了：
在這里插入圖片描述

查看響應失敗的接口響應信息展示：
在這里插入圖片描述

二、流控規則實際使用總結

關于流控規則，主要圍繞：閾值類型，流控模式，流控效果這三個維度，做的測試以及釋義，當然最主要還是實際應用場景，下面是具體闡述這三個維度組合起來，分別適合哪些特點的場景，以及實際對應的業務場景案例，還有配置時注意事項。

一）、閾值類型、流控模式、流控效果組合及適用場景

其實在上一篇和本文都已陸續說過，但比較零散，還是需要單獨梳理一下，算是鞏固加強印象了，希望能對讀者在工作中有幫助；組合使用大致梳理出6個點。

1、閾值為QPS 、流控模式為直接、快速失敗[的流控效果]

1）規則適用的業務特點

直接限制單個資源每秒請求量，超出的請求會被立即拒絕。這種規則可快速響應流量突發狀況，能有效保護資源不被過度請求。

2）適用場景

驗證碼發送，防止惡意刷驗證碼的行為，可設置QPS閾值，同樣超出閾值則直接拒絕。

3）配置時要注意的事項

具體設置的值要參考日常流量以及歷史高峰流量倍數作壓測指標，進行摸底壓測，大促期間可以此摸底性能為閾值上限，進行設置，注意??，絕不能高于摸底上限，否則無法起到保護作用，也不能太低，否則會影響正常業務。

2、閾值為QPS 、流控模式為關聯、快速失敗[的流控效果]

1）規則適用的業務特點

根據關聯資源的QPS閾值，來控制當前資源的訪問。當關聯資源達到閾值，則對當前資源進行限流，通過關聯關系間接保護關聯資源不被壓垮。

2）適用場景

創單和支付，創單之后，會調用支付接口，可以創建流控規則，關聯資源為支付，設置關聯資源閾值，當支付達到該閾值，則對創單接口進行限流。
訂單系統中，創單和扣減庫存也是一樣的道理，避免賣超的方案之一，可以將扣減庫存設為關聯資源，當其QPS過高，超過閾值，依然要對創單接口進行限流。
支付系統中，支付接口和用戶的資金賬戶同理，可將用戶的資金賬戶設為關聯資源，當QPS過高，超過其實際承載流量的閾值，這時支付的性能會受到影響，此時可對支付接口進行流控。

3）配置時要注意的事項

要準確識別到關聯資源，確保關聯的合理性，另外還要注意的點是，關聯資源的閾值設置要考慮兩個資源之間的業務邏輯關系。

一般作為關聯資源的，可以是公共服務等設置為關聯資源或者特點是業務鏈路的后置服務，如果該資源實際性能較差且不在核心鏈路上，可以設置為關聯資源，以此來保護該資源不被壓垮。
如果該資源在核心鏈路上，除了讓其成為關聯資源，還要進行優化，優化性能指標至少要跟核心鏈路起始資源性能對齊，如果內部涉及到第三方接口調用，無法提升性能，則要考慮技術方案的調整，比如看哪些業務數據可以前置操作，串行調用調整為并發編程，同步改為異步方式實現。具體還是要結合實際業務作技術方案調整的決策。
而且，被設置為關聯的資源，通常是該資源容易遇到性能瓶頸，就是性能不足與當前系統流量高峰或歷史高峰時的需求相匹配，所以要設置為關聯資源以此來保護其功能保持在正常水平。

3、閾值為QPS 、流控模式為鏈路、快速失敗[的流控效果]

1）規則適用的業務特點

只對指定鏈路的資源請求進行QPS限制，即當鏈路入口資源達到閾值，則對其進行限流。能精確控制特定調用鏈路流量，有效避免因該鏈路流量過大影響系統性能。

2）適用場景

微服務架構中，某個服務可能涉及多個調用鏈路，若其中一條調用鏈路過大，可對該鏈路進行流控。場景比如商品詳情服務調用加車服務，再調用結算服務這條調用鏈路，可以設置鏈路QPS閾值，超過則拒絕請求。
某個接口有不同的調用來源，可對該特定來源的調用鏈路進行流控，比如結算創單資源接口，可以是普通商品調用鏈路的一個節點，也可以是促銷如秒殺調用鏈路的一個節點，為了保護系統資源能正常服務，可以對秒殺等其他大流量的調用鏈路做鏈路流控配置。