混沌工程介紹

概念

混沌工程是通過實驗探究系統穩定性的實踐過程,其作戰武器是風險因子,即在系統中引入風險變量來驗證系統對風險的抵抗能力,它的作用是推動系統容錯能力建設、驗證監控告警及時性、提升研發問題排查能力。

混沌工程的工作內容

  1. 推動基礎設施建設:DevOps系統建設、監控告警系統建設、日志系統建設。
  2. 推動系統容錯能力建設:業務系統需要針對特定故障做好必要的保障措施,比如數據庫連不上時如何保障業務操作能夠繼續而不被終止。
  3. 提升研發的事故處理能力:系統預案建設、系統事故快速響應建設。
  4. 實施混沌實驗:實驗中引入風險變量驗證以上建設是否有效,比如kill實例進程后實例是否能夠自動重啟以保障繼續提供服務。

混沌實驗與測試的區別

它與測試方法不同的是專注點不同,其它測試方法關注的是功能正確性,混沌實驗關注的是系統穩定性。

混沌實驗實施條件

混沌實驗以破壞系統運行環境來探究系統穩定性,因此,如果系統本身沒有應對異常的基本能力,就沒有必要實施混沌實驗。團隊中要實施混沌實驗,則必須具備一下連個條件:

  1. 完善的監控體系:接口監控、實例監控、服務器監控等
  2. 系統具備對異常的處理能力

如何降低實驗帶來的風險?

團隊為系統穩定性安全性做了很多保障性措施,那如何驗證這些措施的有效性呢,如果直接實施混沌工程,可能會引發系統宕機、業務數據不一致等生產事故,而如果不進行混沌實驗,就沒法驗證這些保障性措施是否可靠,這就像埋了一顆定時炸彈在身邊,混沌實驗就好比拆解炸彈,在拆解炸彈的過程中隨時都可能發生爆炸。
既然存在炸彈,就必須得進行拆除,那如何降低拆除時炸彈爆炸帶來的風險?這里就要引入混沌實驗的實施原則——把影響范圍控制在最小爆炸半徑內,即

  1. 最短時間: 故障發生能夠短時間內恢復。
  2. 最小流量: 受影響的請求盡量最少,比如流量低峰期在集群中某個實例上實施混沌實驗。
  3. 最小上下游系統: 盡量使事故只影響上游或下游系統。
  4. 最小實驗環境: 可以先在測試環境實施混沌實驗,最后才在生產環境實施實驗。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/37638.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/37638.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/37638.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RFID固定資產管理系統在企業中的應用與優勢

隨著企業資產規模的不斷擴大和管理復雜性的增加,傳統的資產管理方式已無法滿足企業高效管理的需求。RFID固定資產管理系統憑借其高效、準確、實時的特點,成為企業固定資產管理的新寵。 一、什么是RFID固定資產管理系統 RFID(無線射頻識別&…

磁盤分區工具(fdisk 和 parted)區別及操作筆記

fdisk 和 parted 都是 Linux 系統中用于磁盤分區的工具。 兩者主要區別: 支持的分區表類型: fdisk 主要支持 MBR分區表,MBR分區表支持的硬盤單個分區最大容量為2TB,最多可以有4個主分區。parted 支持 MBR分區表 和 GPT分區表&…

使用AI工具 Baidu Comate 輔助編碼 快速定位修改Bug

一、Baidu Comate 概述 Baidu Comate(百度智能編碼助手)是一款基于文心大模型的新一代編碼輔助工具。它結合了百度多年積累的編程現場大數據和外部優秀開源數據,旨在為用戶提供高質量的編程代碼生成和優化服務。Comate的主要目標是提升編碼效…

人力資源敏捷管理

SБ_Итоговая аттестация_Управление человеческими ресурсами и их развитием в совр. организаци 你好,Вэйдун。當你提交此表單后,擁有者將會看到你的姓名和電子…

幫助某服務業公司制定發展戰略與未來規劃

在集團公司高速發展、業務范圍不斷擴大時,組織往往對公司未來的發展方向感到迷茫,不知道如何進行更好的規劃,找到合適的發展戰略,為企業提供更長遠的發展空間,帶來更多是利益。面對這個問題,華恒智信認為企…

【Hive SQL】時間戳格式化、時間字符串轉換格式化、時區切換(Mysql\Hive SQL\Athena)

文章目錄 一、日期格式化1、時間戳格式化2、日期字符串格式化3、時區切換4、時區列表 一、日期格式化 本文主要記錄 [Mysql\ Hive SQL\ Athena] 時間戳轉換、日期格式化、時區轉換各種數據數據操作 1、時間戳格式化 1、毫秒值轉 yyyy-MM-dd HH:mm:ss Mysql select FROM_UN…

AXI接口簡介

AXI接口,全稱為Advanced eXtensible Interface,是ARM公司推出的一種高性能、低成本、可擴展的高速總線接口。AXI接口是ARM公司提出的AMBA(Advanced Microcontroller Bus Architecture)高級微控制器總線架構的一部分。2003年發布了…

股票回購(Share Repurchase)是什么?中英雙語介紹

股票回購 中文版 股票回購是指一家金融公司使用其現金儲備從公開市場上回購自身股票的行為。這一操作通常有以下幾個原因: 提升股價:當公司認為其股票被市場低估時,通過減少市場上的流通股數量,可以提升每股的市場價值。優化資…

RK3568平臺(USB篇)UVC驅動分析

一.UVC簡介 攝像頭分為兩類: 1.CAMER接口的攝像頭; 2.USB接口接口的攝像頭; 這里主要介紹usb攝像頭的設備驅動程序。 UVC全稱為USB Video Class,即:USB視頻類,是一種為USB視頻捕獲設備定義的協議標準。…

詳解ApplicationRunner和CommandLineRunner

一、前言 springBoot框架項目,有時候有預加載數據需求——提前加載到緩存中或類的屬性中,并且希望執行操作的時間是在容器啟動末尾時間執行操作。比如筆者工作中遇到了一個預加載redis中的緩存數據,加載為java對象。針對這種場景&#xff0c…

調試解析直播彈幕消息protobuf內容,一步一步教你debug查看PushFrame和Response解碼在哪里

我們知道直播間的彈幕消息是通過websocket傳輸的,而且傳輸的并不是明文數據,而是protobuf消息,至于為什么使用這個protobuf消息,因為它是二進制傳輸,更快更穩,相對于直播這種實時性比較高的要求&#xff0c…

spring-boot-starter-data-redis是否支持reactive響應式編程

開源項目SDK:https://github.com/mingyang66/spring-parent 個人文檔:https://mingyang66.github.io/raccoon-docs/#/ spring-boot-starter-data-redis: 使用傳統的基于阻塞的I/O編程模型,這意味著當你調用Redis操作時&#xff0…

【24考研·交通】我的考研經歷

文章目錄 一、考前準備二、政治備考三、英語一備考四、數學一備考五、運籌學備考六、復試/調劑七、結語 距離24考研上考場過去快半年了,距離我擬錄取也兩個月多了,現在回想起來,最大的感受是:好像做了一場大夢。 其實這篇文章在考…

PLL輸出頻率之間為什么會相互影響

這個問題觸及了PLL(鎖相環)設計的核心挑戰之一。讓我們逐步分析這個問題: PLL的基本結構: PLL通常包含一個壓控振蕩器(VCO)、分頻器、鑒相器和環路濾波器。VCO產生一個高頻時鐘,然后通過不同的分…

Java異常處理詳解【高級篇】

Java異常處理詳解【高級篇】 Java異常處理詳解【高級篇】1. 自定義異常類2. 異常處理最佳實踐3. 異常鏈與異常傳播4. 異常處理與并發編程5. 資源管理與異常6. 異常處理框架Java異常處理詳解【高級篇】 異常處理在Java編程中扮演著至關重要的角色,特別是在大型應用程序或系統開…

SQL-DDL操作

數據庫操作 登錄MySQL PS D:\WorkSpace\MachineLearning\DL_learning> mysql -u root -p Enter password: ****** Welcome to the MySQL monitor. Commands end with ; or \g. Your MySQL connection id is 12 Server version: 8.0.37 MySQL Community Server - GPLCopy…

61、Flink 的 Histogram 累加器代碼示例

1、概述 Histogram 是 key-value 累加器。 2、代碼示例 import org.apache.flink.api.common.JobExecutionResult; import org.apache.flink.api.common.accumulators.Histogram; import org.apache.flink.configuration.Configuration; import org.apache.flink.streaming.…

Profibus協議轉profinet協議網關模塊連接電機保護器與PLC通訊

一、背景 工業通訊中常見的協議有:Modbus協議,ModbusTCP協議,Profinet協議,Profibus協議,Profibus DP協議,EtherCAT協議,EtherNET協議等在現代工業控制系統中具有重要的角色。而Profibus協議轉…

Horror病毒原理和解析【附靶場+網安學習視頻】

Windows XP Horror Edition:這是一種偽裝成Windows XP更新的應用程序,實際上會安裝惡意軟件。一旦運行,它會顯示一個假更新,完成后屏幕會顯示各種恐怖效果和文字。這個程序會更改桌面背景、圖標和系統設置,甚至嘗試重寫…

不能創建第三個變量,實現兩個數的交換

目錄 常規實現兩個數的交換(如:交換變量a和變量b) 方法一:加減法 方法二:異或操作符 常規實現兩個數的交換(如:交換變量a和變量b) 創建一個臨時變量tmp,先將其中一個…