AIOps在線評測基準首階段建設完成,面向社區發布真實運維數據!

本文根據必示科技算法研究員、產品總監聶曉輝博士在2024 CCF國際AIOps挑戰賽線下宣講會上的演講整理成文。


2024年1月份OpenAIOps社區成立,隨著越來越多的社區成員加入,各項工作在有條不紊的推進中。在線評測基準系統(AIOps Live Benchmark)是今年社區工作中的重點之一。

歷屆AIOps挑戰賽都是一次評測。比如2018年的賽題是指標異常檢測、 2022年的賽題是微服務架構下電商系統的故障識別與分類。大賽組委會根據賽題搭建真實的運維評測系統去產生真實的數據,然后把真實的故障注入到該系統中,最后由參賽選手提供各種思路的解決方案參賽評選。

但是,賽事結束之后評測系統也會隨之關閉,如果選手們后續有了更好的改進方案也無法繼續評測。OpenAIOps社區著手推進在線評測基準工作,目標之一也是希望把每屆挑戰賽的成果都沉淀下來。

在線評測基準簡介

在這里插入圖片描述

在線評測基準系統包含了幾個重要模塊。首先是運維的IT系統,這部分系統是可以擴展的;還部署了混沌工程相關的工具,模擬出真實的運維場景;同時部署了一些可觀測性的工具來獲取運維數據,像開源的Promethues、Jeager等。數據收集好后通過具體的AIOps應用或者評測方法,提供一個實時在線評審榜單。在線評測基準系統的最終目標是提供真實系統、真實數據、真實評測,讓大家共同探討研究AIOps技術。

在線評測基準系統(AIOps Live Benchmark)建設架構

在這里插入圖片描述

上圖是在線評測基準系統的整體架構,分為基礎設施、 IT系統、平臺工具和AIOps應用。整個架構相當于一個小型企業的 IT運維平臺,麻雀雖小五臟俱全。圖片中綠色部分是邀請社區專家和企業界的同仁一起已完成系統模塊。目前實現了注入故障模擬、采集各種各樣的運維數據功能,并且部署了業界開源和專業可觀測性工具,最后把數據統一匯總,對上提供服務,也成功部署了像異常檢測、告警分析等應用工具。

1、微服務系統——Online Boutique

在這里插入圖片描述

Online Boutique是谷歌的一個開源的電商系統,能夠模擬一些常見的IT系統使用環境。它還是微服務的架構,支持多種語言的開發,對于可觀測性工具,包括運維場景,具備一些典型的代表性。

同時系統是開源的,可以根據不同的運維場景對系統進行改造升級,目前實現了支持信創數據庫TiDB、支持OpenTelemetry數據采集、模擬變更場景等功能。歡迎大家把自己的開源服務部署到社區中來,構建典型的運維場景。

2、混沌工程工具

在這里插入圖片描述

架構中部署了混沌工程的開源工具并做了集成,其中典型的是ChaosMesh。圖片中右邊部分是一個具體的例子,在容器中注入一個CPU使用率負載高的故障,然后觀察在上面部署的這些應用能否檢測到對應異常。

3、可觀測性工具

在這里插入圖片描述

目前已經部署Jaeger、Promethues等開源的工具。Jeager是開源的分布式跟蹤系統,用于采集電商系統的trace數據;Promethues是開源的監控數據采集和告警工具,用于采集電商系統的指標數據。

在這里插入圖片描述

同時我們也邀請了云杉網絡、樂維、基調聽云、藍鯨等企業,針對上文提到的微服務系統Online Boutique做了全面的數據采集。

4、開源數據集

在這里插入圖片描述

完成數據采集后,平臺構建了一個數據的指標體系,按照規則把數據清洗分類,并定時在系統上發布。大家可以在OpenAIOps社區網站(https://www.aiops.cn)上獲取這些數據,希望提供的這些真實數據可以推動AIOps的技術研究和工業落地。

5、AIOps應用

在這里插入圖片描述

系統上也部署了AIOps的應用,圖片中展示的是必示科技提供的兩款標準化的產品。

(1) 智能業務指標異常檢測。通過具體指標數據,不需要人工設置就能夠識別出閾值,圖中展示的是真實的效果。這款應用好處是無需人工配置閾值,同時自動學習哪些指標能夠做監控,擴大監控范圍,減少人工運維成本。

(2) 智能告警管理,提供基礎的告警管理功能,在告警智能化分析上,主要解決告警風暴檢測和分析問題,當告警量突增,系統自動檢測并生成分析報告,輔助運維人員快速處置異常。

網站正式發布對外開放,歡迎大家學習交流。

網址:https://www.aiops.cn/aiops-live-benchmark/

在線評測基準系統(AIOps Live Benchmark)建設情況

在這里插入圖片描述

在線評測基準系統(AIOps Live Benchmark)工作自3月份開始推進,我們快速搭建了整套的系統和具體的可觀測性工具。5月份,第一批數據清洗出來并成功發布,同時開始準備指標異常檢測的評測基準工作。

來自社區的專家成員積極參與,貢獻力量。目前基準專家組已經有59個成員,來自高校研究所、科技公司、銀行、證券等各行各業。工程師團隊超過40+,來自中科院、南開大學、必示科技、云杉網絡、樂維、聽云、藍鯨等單位。

未來展望

在這里插入圖片描述

目前在線評測系統可以提供真實的IT應用場景,可以學習前沿的AIOps技術,發布對應的權威數據集,推動行業發展。

在線評測系統搭建完之后,我們未來重點工作為應用評測,例如業務指標的異常檢測、機器指標的異常檢測、調研鏈的異常檢測和定位等。在做評測應用的同時,進一步的完善系統的可觀測性和混沌工程能力。


關于CCF 國際AIOps挑戰賽

CCF國際AIOps挑戰賽(China Computer Federation International AIOps Challenge)由清華大學聯合中國計算機學會(CCF)自2018年共同發起。旨在借助社區力量,運用人工智能算法解決各類運維難題。迄今為止已經成功舉辦六屆,吸引了大量AIOps從業者和關注者,隨著賽事規模和影響力的不斷擴大,形成了運維行業著名的專業賽事品牌,并逐漸發展為智能運維領域最具影響力的專業賽事。

2024 (第七屆)CCF國際AIOps挑戰賽由中國計算機學會(CCF)主辦,中國計算機學會互聯網專委會、清華大學、中國科學院計算機網絡信息中心承辦,中興通訊、北京智譜華章科技有限公司、中南大學計算機學院、清華大學計算機科學與技術系、北京必示科技有限公司協辦。同時,本屆AIOps挑戰賽也是OpenAIOps社區成立之后第一屆重要年度賽事。

更多賽事相關信息將在社區“智能運維前沿”公眾號發布,同時OpenAIOps社區群將提供賽事通知、技術答疑,有意者可掃碼添加官方微信號(OpenAIOps社區小助手)入群。

在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/19347.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/19347.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/19347.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

積鼎CFDPro水文水動力模型,專為中小流域洪水“四預”研發的流體仿真技術

水動力模型與水文模型是水利工程與水文學研究中不可或缺的兩大工具。水動力模型著重于流體運動的動力學機制,通過一系列方程組捕捉水流的時空變化,而概念性水文模型則側重于流域尺度的水文循環過程,利用物理概念與經驗關系進行近似模擬。兩者…

Windows系統部署YOLOv5 v6.1版本的訓練與推理環境保姆級教程

文章目錄 一 概述二 依賴環境(prerequisites)2.1 硬件環境2.2 軟件環境 三 環境安裝3.1 創建并激活虛擬環境3.2 安裝Pytorch與torchvision3.3 校驗Pytorch安裝3.4 下載 YOLOv5 v6.1 源碼3.5 安裝 YOLOv5 依賴3.6 下載預訓練模型3.7 安裝其他依賴3.8 測試環境安裝3.9 測試訓練流…

jupyter notebook更改位置

1.找到jupyer的配置文件 一般在c盤用戶的.jupter文件夾下 2. 用記事本打開這個配置文件,定位到c.NotebookApp.notebook_dir /path_to_your_directory 替換你的位置 3.找到jupyer圖標的位置,打開屬性 添加要存放的位置在目標文件的末尾,重新…

python | spacy,一個神奇的 Python 庫!

本文來源公眾號“python”,僅用于學術分享,侵權刪,干貨滿滿。 原文鏈接:spacy,一個神奇的 Python 庫! 大家好,今天為大家分享一個神奇的 Python 庫 - spacy。 Github地址:https:/…

一個全面了解Xilinx FPGA IP核的窗口:《Xilinx系列FPGA芯片IP核詳解》(可下載)

隨著摩爾定律的逐漸放緩,傳統的芯片設計方法面臨著越來越多的挑戰。而FPGA以其并行處理能力和可編程性,為解決復雜問題提供了新的途徑。它允許設計者在同一個芯片上實現多種不同的功能模塊,極大地提高了資源的利用率和系統的綜合性能。 FPGA…

領域數據模型建設步驟

領域數據模型建設步驟 以某音樂app為例: 1.數據調研和業務調研,識別業務過程,實體,關鍵指標 業務過程:播放,收藏,下載,點擊,購買,支付 實體:音樂&#xff0c…

HCIA-ARP

ARP的由來 ARP這一種協議它會是在我們HCIA中第一個需要完全掌握的一個協議,不然對于數據通訊來說大家都會一直覺得很繞圈 協議棧,網線,網卡,它們組成了我們最小的數據通信的小脈絡注:可以了解ARP攻擊(冒充訪…

使用Java和MyBatis獲取表頭與數據

使用Java和MyBatis獲取表頭與數據 在數據處理與展示中,經常需要將數據庫查詢結果中的表頭(列名)與實際數據提取出來。本文將介紹如何通過Java的JDBC和MyBatis來實現這一需求。 1. 使用JDBC獲取表頭與數據 在JDBC中,可以使用Res…

文獻解讀-群體基因組第二期|《中國人群中PAX2新生突變的檢測及表型分析:一項單中心研究》

關鍵詞:應用遺傳流行病學;群體測序;群體基因組;基因組變異檢測; 文獻簡介 標題(英文):Detection of De Novo PAX2 Variants and Phenotypes in Chinese Population: A Single-Cente…

new CCDIKSolver( OOI.kira, iks ); // 創建逆運動學求解器

demo案例 new CCDIKSolver(OOI.kira, iks); 在使用某個特定的庫或框架來創建一個逆運動學(Inverse Kinematics, IK)求解器實例。逆運動學在機器人學、動畫和計算機圖形學等領域中非常重要,它用于根據期望的末端執行器(如機器人的…

Compose第四彈 Compose項目

目標: 1.可供學習的Compose項目 一、官方提供項目 谷歌官方提供的Compose項目: GitHub - android/compose-samples: Official Jetpack Compose samples. 項目及主要頁面展現 1.1 Reply項目 1.首頁底部TAB欄 2.側邊欄菜單:拖動滑出和收起…

建設現代智能工業-智能化、數字化、自動化節能減排

建設現代智能工業-智能化節能減排 遵循“一體化”能源管理(Integrated Energy Management)的設計宗旨,集成城市各領域(如工業.交通、建筑等)的能源生產和消費信息,面向城市政府、企業、公眾三類實體,提供“一體化”的綜合能源管理…

uniapp h5項目切換導航欄及動態渲染按鈕顏色

1.效果圖 2.html,動態渲染按鈕樣式---三元判斷 <!-- 切換欄 --><view class"statusList"><block v-for"(item,index) in list" :key"index"><view class"swiper-tab-list" :class"current item.id?activ…

CEEMDAN +組合預測模型(CNN-Transfromer + XGBoost)

注意&#xff1a;本模型繼續加入 組合預測模型全家桶 中&#xff0c;之前購買的同學請及時更新下載! 往期精彩內容&#xff1a; 時序預測&#xff1a;LSTM、ARIMA、Holt-Winters、SARIMA模型的分析與比較-CSDN博客 VMD CEEMDAN 二次分解&#xff0c;Transformer-BiGRU預測模…

靜態加速和動態加速是啥區別

以下是兩者之間的主要區別&#xff1a; 加速對象與內容&#xff1a; 靜態加速&#xff1a;主要針對網頁中的靜態資源&#xff0c;如HTML文件、CSS文件、JavaScript文件、圖片、Flash動畫等。這些資源的特點是更新頻率較低&#xff0c;適合通過緩存技術加速。 動態加速&#xf…

網絡學習(11) |深入解析客戶端緩存與服務器緩存:HTTP緩存控制頭字段及優化實踐

文章目錄 客戶端緩存與服務器緩存的區別客戶端緩存瀏覽器緩存應用程序緩存優點缺點 服務器緩存優點缺點 HTTP緩存控制頭字段Cache-ControlExpiresLast-ModifiedETag 緩存策略的優化與實踐經驗分享1. 使用合適的緩存頭字段2. 結合使用Last-Modified和ETag3. 利用CDN進行緩存4. 實…

【JAVA WEB實用與優化技巧】如何自己封裝一個自定義UI的Swagger組件,包含Swagger如何處理JWT無狀態鑒權自動TOKEN獲取

目錄 一、Swagger 簡介1. 什么是 Swagger&#xff1f;2. 如何使用 Swagger3. Springboot 中swagger的使用示例1. maven 引入安裝2. java配置 二、Swagger UI存在的缺點1.不夠方便直觀2.請求的參數沒有緩存3.不夠美觀4.如果是JWT 無狀態登錄&#xff0c;Swagger使用起來就沒有那…

STL-stack的使用及其模擬實現

在C標準庫中&#xff0c;stack是一種容器適配器&#xff0c;它以后進先出的方式組織數據&#xff0c;其刪除只能從容器的棧頂進行元素的插入與取出操作。 stack的使用 stack的構造函數 stack的成員函數 empty&#xff1a;判斷棧是否為空back&#xff1a;返回當前棧中元素的數量…

docker之自制django鏡像

一&#xff0c;安裝docker&#xff08;本作者往期文章有docker安裝 &#xff0c;或者更詳細的有關docker安裝&#xff09; 二&#xff0c;拉取centos7鏡像 docker pull centos:7 三&#xff0c;創建容器 docker run -id -v /root/docker/soft:/soft -p 8000:8000 --name djang…

Redis實踐記錄與總結

最近生產環境緩存數據庫數據過大&#xff08;如何搭建單服務redis緩存數據庫&#xff1f;以及可視化工具Another Redis Desktop Manager使用&#xff09;&#xff0c;導致在對數據庫做rdb快照備份時消耗內存過大&#xff0c;緩存數據庫宕機一小時。基礎運維通過增加虛擬機內存暫…