APO 1.5.0版本全新推出的智能體工作流功能,讓運維經驗不再零散!只需將日常的運維操作和故障排查經驗轉化為標準化流程,就能一鍵復用,效率翻倍,從此告別重復勞動,把時間留給更有價值的創新工作。更貼心的是,APO無需改造現有監控系統,輕松對接即可使用,真正實現“開箱即用”。
下面帶大家快速上手這一功能,先從官方內置的實用工作流開始體驗!
「開箱即用」的工作流
我們精心打磨了兩款告警處理神器:告警有效性分析和告警根因分析。它們就像24小時在線的智能助手,幫你自動處理告警,讓運維工作事半功倍!
1. 告警有效性分析:告別「無效告警轟炸」
面對海量告警信息,這個工作流能快速識別哪些告警需要緊急處理,哪些可以暫緩。有了它,你既能從容應對關鍵問題,又能放心設置更靈敏的告警規則,在故障發生時自動收集完整上下文,為后續排查打下堅實基礎。
2. 根因分析:5分鐘定位問題源頭
觸發告警后,這個工作流會立即行動:自動關聯主機、服務或Pod的上下文數據,分析指標異常,并通過「北極星指標」進行多維度根因排查。無論是服務延遲激增還是資源異常波動,它都能幫你快速鎖定問題根源,讓故障修復效率提升80%!
后續我們會詳細解析這些工作流的設計邏輯和實戰效果。所有內置流程都支持按需調整,靈活適配你的業務場景,打造專屬智能運維助手!
手把手教你搭建專屬工作流
第一步:進入工作流平臺
登錄APO后,點擊左側菜單欄的「工作流」進入編輯頁面。
(若未找到入口,請確認版本≥1.5.0,并檢查管理員是否在「系統管理」-「菜單」中開啟了該功能)
在這里呈現了很多內置的工作流,可以根據需求直接修改這些工作流,也可以從零開始根據專家經驗構建屬于自己的流程。
第二步:創建工作流
這里我們從零開始創建一個工作流。點擊“創建空白應用”,在彈出的頁面中輸入應用名稱,點擊“創建”進入工作流編輯頁面。
第三步:拖拽節點,連接流程
編輯界面左側為功能節點庫,通過鼠標拖拽即可自由組合流程,就像搭積木一樣簡單!將畫布上的節點連接起來,就完成了工作流的創建。
在構建工作流時需要注意以下幾點:
- 填寫每個節點的輸入參數;
- 使用大模型節點前,需在設置中配置API權限;
- 通過「檢查列表」實時排查流程邏輯問題;
- 階段性點擊「運行」測試流程是否符合預期。
APO 工作流平臺基于開源項目 Dify 開發,平臺本身的使用在 Dify 官網有詳盡的文檔,這里重點介紹APO專為可觀測性場景深度優化的功能:數據查詢節點、異常檢測節點和數據驗證圖表。
數據查詢節點:一鍵調取全維度數據
可觀測性平臺的基礎能力是展示數據并分析問題,因此數據查詢是工作流最基本的能力。APO將各類豐富的數據查詢工具集成到了工作流編排平臺中,方便用戶快速將需要查看的數據放入工作流中。
通過搜索可以快速找到你需要的數據,同時可以輸入查詢參數來檢查當前數據:
異常檢測節點:智能識別潛在風險
使用APO內置的異常檢測工具,可以在查詢數據后判斷數據是否存在異常,針對異常數據能夠進一步執行工作流分析。目前內置的異常檢測工具包括閾值判斷、趨勢判斷、分位數檢測等,未來還需進一步豐富異常檢測工具。
除了使用內置的異常檢測節點,你還可以將數據輸入大模型,讓AI輔助判斷異常類型,也有不錯的效果!
數據驗證圖表:結果可視化,一目了然
回溯工作流的執行結果有助于我們理解執行過程。 APO采用圖表的方式展示可觀測性數據,大大增強了結果的可解釋性。APO為每一類數據都設計了對應的圖表,方便檢查數據內容:指標數據用折線圖展示趨勢,鏈路數據用拓撲圖呈現依賴關系。每一步分析結果清晰可見,輕松回溯排查邏輯。
通過智能體工作流,APO讓運維從「救火式響應」進階為「自動化治理」。現在就動手搭建你的第一個工作流,體驗高效運維的樂趣吧!下一篇文章,我們將手把手展示如何構建「告警診斷」工作流,敬請期待!