高并發系統之降級特技

2019獨角獸企業重金招聘Python工程師標準>>> hot3.png

高并發系統之降級特技 博客分類: 架構

在開發高并發系統時有三把利器用來保護系統:緩存、降級和限流。之前已經有一些文章介紹過緩存和限流了。本文將詳細聊聊降級。當訪問量劇增、服務出現問題(如響應時間慢或不響應)或非核心服務影響到核心流程的性能時,仍然需要保證服務還是可用的,即使是有損服務。系統可以根據一些關鍵數據進行自動降級,也可以配置開關實現人工降級。本文將介紹一些筆者在實際工作中遇到的或見到過的一些降級方案供大家參考。

?

降級的最終目的是保證核心服務可用,即使是有損的。而且有些服務是無法降級的(如加入購物車、結算)。

?

降級預案

在進行降級之前要對系統進行梳理,看看系統是不是可以丟卒保帥;從而梳理出哪些必須誓死保護,哪些可降級;比如可以參考日志級別設置預案:

一般:比如有些服務偶爾因為網絡抖動或者服務正在上線而超時,可以自動降級;

警告:有些服務在一段時間內成功率有波動(如在95~100%之間),可以自動降級或人工降級,并發送告警;

錯誤:比如可用率低于90%,或者數據庫連接池被打爆了,或者訪問量突然猛增到系統能承受的最大閥值,此時可以根據情況自動降級或者人工降級;

嚴重錯誤:比如因為特殊原因數據錯誤了,此時需要緊急人工降級。

?

降級按照是否自動化可分為:自動開關降級和人工開關降級。

降級按照功能可分為:讀服務降級、寫服務降級。

降級按照處于的系統層次可分為:多級降級。

?

降級的功能點主要從服務端鏈路考慮,即根據用戶訪問的服務調用鏈路來梳理哪里需要降級:

頁面降級:在大促或者某些特殊情況下,某些頁面占用了一些稀缺服務資源,在緊急情況下可以對其整個降級,以達到丟卒保帥;

頁面片段降級:比如商品詳情頁中的商家部分因為數據錯誤了,此時需要對其進行降級;

頁面異步請求降級:比如商品詳情頁上有推薦信息/配送至等異步加載的請求,如果這些信息響應慢或者后端服務有問題,可以進行降級;

服務功能降級:比如渲染商品詳情頁時需要調用一些不太重要的服務:相關分類、熱銷榜等,而這些服務在異常情況下直接不獲取,即降級即可;

讀降級:比如多級緩存模式,如果后端服務有問題,可以降級為只讀緩存,這種方式適用于對讀一致性要求不高的場景;

寫降級:比如秒殺搶購,我們可以只進行Cache的更新,然后異步同步扣減庫存到DB,保證最終一致性即可,此時可以將DB降級為Cache

爬蟲降級:在大促活動時,可以將爬蟲流量導向靜態頁或者返回空數據從而降級保護后端稀缺資源。

?

自動開關降級

自動降級是根據系統負載、資源使用情況、SLA等指標進行降級。

超時降級

當訪問的數據庫/http服務/遠程調用響應慢或者長時間響應慢,且該服務不是核心服務的話可以在超時后自動降級;比如商品詳情頁上有推薦內容/評價,但是推薦內容/評價暫時不展示對用戶購物流程不會產生很大的影響;對于這種服務是可以超時降級的。如果是調用別人的遠程服務,和對方定義一個服務響應最大時間,如果超時了則自動降級。

?

之前總結過一些的文章《使用httpclient必須知道的參數設置及代碼寫法、存在的風險》和《dbcp配置及jdbc超時設置總結》。在實際場景用一定主要配置好超時時間和超時重試次數和機制。

?

統計失敗次數降級

有時候依賴一些不穩定的API,比如調用外部機票服務,當失敗調用次數達到一定閥值自動降級;然后通過異步線程去探測服務是否恢復了,則取消降級。

?

故障降級

比如要調用的遠程服務掛掉了(網絡故障、DNS故障、http服務返回錯誤的狀態碼、rpc服務拋出異常),則可以直接降級。降級后的處理方案有:默認值(比如庫存服務掛了,返回默認現貨)、兜底數據(比如廣告掛了,返回提前準備好的一些靜態頁面)、緩存(之前暫存的一些緩存數據)。

?

限流降級

當我們去秒殺或者搶購一些限購商品時,此時可能會因為訪問量太大而導致系統崩潰,此時開發者會使用限流來進行限制訪問量,當達到限流閥值,后續請求會被降級;降級后的處理方案可以是:排隊頁面(將用戶導流到排隊頁面等一會重試)、無貨(直接告知用戶沒貨了)、錯誤頁(如活動太火爆了,稍后重試)。

?

人工開關降級

在大促期間通過監控發現線上的一些服務存在問題,這個時候需要暫時將這些服務摘掉;還有有時候通過任務系統調用一些服務,但是服務依賴的數據庫可能存在:網卡被打滿了、掛掉了或者很多慢查詢,此時需要暫停下任務系統讓服務方進行處理;還有發現突然調用量太大,可能需要改變處理方式(比如同步轉換為異步);此時就可以使用開關來完成降級。開關可以存放到配置文件、存放到數據庫、存放到Redis/ZooKeeper;如果不是存放在本地,可以定期同步開關數據(比如1秒同步一次)。然后通過判斷某個KEY的值來決定是否降級。

?

另外對于新開發的服務想上線進行灰度測試;但是不太確定該服務的邏輯是否正確,此時就需要設置開關,當新服務有問題可以通過開關切換回老服務。還有多機房服務,如果某個機房掛掉了,此時需要將一個機房的服務切到另一個機房,此時也可以通過開關完成切換。

?

還有一些是因為功能問題需要暫時屏蔽掉某些功能,比如商品規格參數數據有問題,數據問題不能用回滾解決,此時需要開關控制降級。

?

讀服務降級

對于讀服務降級一般采用的策略有:暫時切換讀(降級到讀緩存、降級到走靜態化)、暫時屏蔽讀(屏蔽讀入口、屏蔽某個讀服務)。在《應用多級緩存模式支撐海量讀服務》中曾經介紹過讀服務,即接入層緩存-->應用層本地緩存-->分布式緩存-->RPC服務/DB,我們會在接入層、應用層設置開關,當分布式緩存、RPC服務/DB有問題自動降級為不調用。當然這種情況適用于對讀一致性要求不高的場景。

?

頁面降級、頁面片段降級、頁面異步請求降級都是讀服務降級,目的是丟卒保帥(比如因為這些服務也要使用核心資源、或者占了帶寬影響到核心服務)或者因數據問題暫時屏蔽。

?

還有一種是頁面靜態化場景:

動態化降級為靜態化:比如平時網站可以走動態化渲染商品詳情頁,但是到了大促來臨之際可以將其切換為靜態化來減少對核心資源的占用,而且可以提升性能;其他還有如列表頁、首頁、頻道頁都可以這么玩;可以通過一個程序定期的推送靜態頁到緩存或者生成到磁盤,出問題時直接切過去;

靜態化降級為動態化:比如當使用靜態化來實現商品詳情頁架構時,平時使用靜態化來提供服務,但是因為特殊原因靜態化頁面有問題了,需要暫時切換回動態化來保證服務正確性。

?

以上都保證出問題了有預案,用戶還是可以使用網站,不影響用戶購物。

?

寫服務降級

寫服務在大多數場景下是不可降級的,不過可以通過一些迂回戰術來解決問題。比如將同步操作轉換為異步操作,或者限制寫的量/比例。

比如扣減庫存一般這樣操作:

?

方案1

1、扣減DB庫存,2、扣減成功后更新Redis中的庫存;

方案2

1、扣減Redis庫存,2、同步扣減DB庫存,如果扣減失敗則回滾Redis庫存;

前兩種方案非常依賴DB,假設此時DB性能跟不上則扣減庫存就會遇到問題;因此我們可以想到方案3

1、扣減Redis庫存,2、正常同步扣減DB庫存,性能扛不住時降級為發送一條扣減DB庫存的消息,然后異步進行DB庫存扣減實現最終一致即可;

這種方式發送扣減DB庫存消息也可能成為瓶頸;這種情況我們可以考慮方案4

1、扣減Redis庫存,2正常同步扣減DB庫存,性能扛不住時降級為寫扣減DB庫存消息到本機,然后本機通過異步進行DB庫存扣減來實現最終一致性。

?

也就是說正常情況可以同步扣減庫存,在性能扛不住時降級為異步;另外如果是秒殺場景可以直接降級為異步,從而保護系統。還有如下單操作可以在大促時暫時降級將下單數據寫入Redis,然后等峰值過去了再同步回DB,當然也有更好的解決方案,但是更復雜,不是本文的重點。

?

還有如用戶評價,如果評價量太大,也可以把評價從同步寫降級為異步寫。當然也可以對評價按鈕進行按比例開放(比如一些人的看不到評價操作按鈕)。比如評價成功后會發一些獎勵,在必要的時候降級同步到異步。

?

多級降級

緩存是離用戶最近越高效;而降級是離用戶越近越能對系統保護的好。因為業務的復雜性導致越到后端QPS/TPS越低。

?

頁面JS降級開關:主要控制頁面功能的降級,在頁面中通過JS腳本部署功能降級開關,在適當時機開啟/關閉開關;

接入層降級開關:主要控制請求入口的降級,請求進入后會首先進入接入層,在接入層可以配置功能降級開關,可以根據實際情況進行自動/人工降級;這個可以參考《京東商品詳情頁服務閉環實踐》,尤其在后端應用服務出問題時,通過接入層降級從而給應用服務有足夠的時間恢復服務;

應用層降級開關:主要控制業務的降級,在應用中配置相應的功能開關,根據實際業務情況進行自動/人工降級。

?

http://jinnianshilongnian.iteye.com/blog/2306477

?

轉載于:https://my.oschina.net/xiaominmin/blog/1599198

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/453187.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/453187.shtml
英文地址,請注明出處:http://en.pswp.cn/news/453187.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

處理機的三級調度

在有的操作系統中僅采用一級凋度,而有的操作系統則將凋度分為不同的層次,一個用戶作業從進入系統成為后備作業開始,直到運行結退出系統為止,一般最多經歷三級調度,即處理器調度可以分為以下3個層次。 1.高級調度(High …

進行代碼復審訓練

20180320作業2:進行代碼復審訓練任務說明: 一、結對,找到一個伙伴進行結對;(在作業中標注自己的伙伴博客鏈接) 王小梅: http://www.cnblogs.com/CURRY-30/p/8570290.html 二、各自對自己的伙伴上…

freeradius 3.0 時間限制_創意營銷3.0新模式下,易企秀要成為中國的Adobe

近幾年,隨著大數據和人工智能技術的發展,智能化、程序化營銷在國內獲得高速發展。從以創意內容、提升效率的工具到現在驅動企業數字化轉型的智能營銷,營銷云在國內的熱度與成熟度不斷提升。營銷云起源于“Enterprise Marketing Software Suit…

用計算機三級處理文件,【題目】計算機三級題目,獻給為計算機三級掙扎的同學們...

該樓層疑似違規已被系統折疊 隱藏此樓查看此樓(165)Internet的郵件傳輸協議標準為_______。A)SNMP B)SMTP C)FTP D)TELNET答 案:B知識點:瀏覽器、電了郵件及Web服務器的安全特性評 析:SNMP即簡單網絡管理協議;SMTP即簡單郵件傳輸協…

匈牙利命名法的優缺點

匈牙利約定優點匈牙利約定與其它命名約定一樣,擁有由命名約定所帶來的一切共同優點。由于有這樣多的標準名稱,因此在任何一個單個子程序或程序中要特殊記憶的名字是非常少的。匈牙利約定完全可以在不同項目中采用。匈牙利約定可以使得在命名中容易產生定…

搶占式和非搶占式的進程調度

非搶占式(Nonpreemptive) 讓進程運行直到結束或阻塞的調度方式 容易實現 適合專用系統,不適合通用系統 搶占式(Preemptive) 允許將邏輯上可繼續運行的在運行過程暫停的調度方式 可防止單一進程長時間獨占…

圖形學基礎知識

本篇主要給大家介紹圖形學基礎知識,了解Unity圖像渲染機制,以及圖像渲染管線流程。 主要是因為伴隨著VR/AR的飛速發展,為了滿足VR高清高幀率的極限渲染,著色器編程(Shader)也成為了Unity程序開發人員的必備…

12種排序算法

https://blog.csdn.net/love_gaohz/article/details/46673907 轉載于:https://www.cnblogs.com/kongk/p/8641077.html

計算機應用基礎精品課程申報表,《計算機應用基礎》精品課程申報書(修改意見)...

4-3教學條件(含教材使用與建設;促進學生主動學習的擴充性資料使用情況;配套實驗教材的教學效果;實踐性教學環境;網絡教學環境(網絡平臺,網絡課件))突出的地方用紅色表示。1.教材建設本課程目前使用的教材是…

用博客見證自己的成長

感謝CSDN博客,給我提供了一個學習交流的平臺,自從開通博客以來,感覺自己的生活一下充實了很多。通過寫博客來積累知識的同時,也給生活帶來的很多的喜悅。 第一次發表博客;第一次有訪客;第一次得到博客勛章&…

調度隊列模型

調度隊列模型及準則 1 僅有進程調度的調度隊列模型: 每個進程在執行時都可能出現以下三種情況: (1) 任務在給定的時間片內已經完成,該進程便在釋放處理機后進入完成狀態 (2) 任務在本次分得的時間片內尚未完成,OS便將該任務再放入…

linux基礎命令(-)

最近在學linux,老師課堂上講的估計下課就忘了,現整理下來以備不時之需。 PS1x //修改終端提示符su root //切換用戶ssh root192.168.116.129 //加密遠程連接 yum -y install sl //小火車yum -y install oneko //鼠標兔子date //查看日期cal 11 19…

數據庫相關整理

一、MySQL 1、mysql如何做分頁 mysql數據庫做分頁用limit關鍵字,它后面跟兩個參數startIndex和pageSize 2、mysql引擎有哪些,各自的特點是什么? http://www.cnblogs.com/ctztake/p/8453990.html 3、數據庫怎么建立索引 create index account_…

api接口怎么對接_系統對接項目管理方面怎么做?從一次項目接口對接說起

故事:最近業務方有一個新的業務合作模式,需要與第三方公司進行系統的對接,原本預期2周可以完成的項目,最后要用到3周時間才能完成,出現的現象其實還挺典型的,也不是沒遇到過,因為自己這邊的進度…

周轉時間 平均周轉時間 帶權周轉時間 平均帶權周轉時間

1.周轉時間 2.平均周轉時間 平均周轉時間是對n個而言的 3.帶權周轉時間 真正的運行時間指的是進程占有處理機的時間 4.平均帶權周轉時間 即n個平均的帶權周轉時間

程序員第一定律:關于技能與收入

在軟件這個行業里有些規則是很有殺傷力的,比如很有名的摩爾定律。 總結出這些規則的意義在于可以大致的照明方向,免得努力來努力去卻走到了陰溝里。 現實中種種利益紛爭、觀點之爭看似紛繁,但在大時間尺度下來看卻都是規則的實現手段。 這就好…

快速高效 | iOS身份證識別

一:簡介 demo新增身份證國徽面識別,可識別出簽發機關和有效期。 快捷支付涉及到方方面面,同時安全問題既是用戶所關心的,也是制作者不容忽視的重要部分。 比如涉及到支付和金錢的app,商戶端app等等,都需要進…

用計算機怎樣給文章分解,計算機試卷6分解..pdf

計算機試卷 6一、單選題1. 第三代計算機采用 ______ 作為主要的電子器件。A. 電子管B. 晶體管C.大規模集成電路D.小規模集成電路答案: D2. 數據是信息的載體,包括數值、文字、語言、圖形和 ______等不同形式。A. 多媒體B.表達式C. 圖像D. 函數答案&#…

unity應用開發實戰案例_「簡歷」STAR法則的實戰應用,附手把手教學案例

關注應屆生求職網,了解更多求職信息本文共2072字,預計閱讀需3分鐘本期分享導師-Anna_青云導師51Job職場導師知乎職場千贊答主多年獵頭及多行業人力資源管理經歷職業生涯規劃師、職業生涯咨詢師、心理咨詢師終身學習踐行者、斜杠青年、職場教練在簡歷優化…