數據中心運維管理:從人工到智能需要走幾步?

一切的變化來自于數據中心規模、復雜度、設備多樣性的挑戰,將運維平臺的重要性推向歷史高點。

此外,基于業務連續性方面的考慮,分布式數據中心成為越來越多客戶的選擇。

一、數據中心面臨的挑戰

運維管理分散,缺乏統一的管理

IT 建設“各自為政”,缺乏統一的管理規劃,服務器、存儲、網絡等 IT 資源與虛擬化平臺等信息分散,系統無法集中統一管理,無法實現全棧軟硬件集中管理和自動維護,運維管理成本高。

告警管理效率低

管理對象和監控指標覆蓋不全,告警信息無法統一管理,重要告警易遺漏,告警處理效率低下,系統風險與日俱增。

缺乏全局視圖

各設備管理界面分散,缺乏全景視圖,難以挖掘優化點,無法有效支撐數據中心運營分析。

故障定位困難

隨著數據中心和業務規模擴大,網絡復雜度不斷增加,一旦出現業務故障,端到端拓撲梳理耗時長,故障定位困難,影響業務系統可用性。

二、數據中心全棧運維功能需求

1、全棧監控

數據中心軟硬監控一體化,實現故障快速定界定位。由于不同組織共用底層基礎設施, 支持多租實現資源隔離。

2、日常運維

可視化大屏、報表的訴求,日常運維、上層匯報展示、參觀展示均為主要使用場景。

日常運維 TOP 需求包括:虛擬機間流量監控、報表大屏、流程平臺對接、自動根因分析、故障快速恢復、資源動態調整。

統一監管

數據中心 IT 資源種類繁多,從服務器、集中式存儲、分布式存儲、 IP 交換機、交換機等硬件基礎設施,到虛擬化、容器等資源服務,再到 SDN 等高階特性,數據中心運維平臺需具備軟硬件全棧的統一納管能力,實現全棧資源的統一納管、統一門戶、統一運維、統一運營。

運維可視

數據中心的各種運維數據存儲在不同的 IT 系統中,為滿足日常運維的一屏統攬、客戶或上級的參觀展示以及數據中心的運營分析需求,需要將分散的運維數據集中展示,釋放數據價值。數據中心運維平臺需支持對設備性能指標、告警事件、資產配置等數據的融合關聯,通過大屏或報表進行全方位的展示。大屏及報表需預制多種模板,方便運維人員的一鍵式導出;同時還需支持個性化定制,幫助運維人員隨需掌握數據中心狀態信息。

智能運維

對于日常運維,傳統的運維方式多為被動等待問題出現后定位解決,而結合智能容量預測、智能風險檢測等功能,可以提前發現問題風險并將風險消減于萌芽之中。對于故障定位,傳統的運維方式需要卷入多設備的運維人員,人工梳理排查網絡拓撲,在當下越發龐大和復雜的數據中心中顯得效率尤為低下,通過運維平臺提供的智能關聯分析和智能拓撲梳理,可以快速且自動化地定位到問題關鍵點,故障定位時間縮短到分鐘級。

資源高效發放

數據中心基礎設施的計算、存儲、網絡等資源被不同的部門或用戶使用,面對不同用戶發起的資源申請需求,運維人員需頻繁按照需求為用戶發放資源,此時如若運維平臺的資源發放過程效率低下、依賴于大量手工步驟,那么對于運維人員的日常工作必然造成困擾。以一個典型的 IOE 架構下的虛擬機發放過程為例,虛擬機的發放需要分別接入存儲、網絡、虛擬化平臺的管理界面執行十數個步驟的手工操作,步驟繁雜且容易出錯。

因此,數據中心運維平臺需要支持資源的高效發放,從人工執行轉變為自動化執行,從十數個步驟轉變為一鍵式自動編排,從而滿足日常的業務發放需要。

結合上述關鍵功能需求,面向全場景的數據中心全棧管理平臺需具備融合、智能、開放三大能力:

融合

數據中心全棧軟硬件管理:統一監控管理分支 - 中心多 DC 內的服務器、交換機、存儲設備、虛擬化等資源, IT 人員通過一個“界面”完成日常運維管理工作,統一體驗,提升效率。

統一告警:軟硬件告警統一實時監控與通知,幫助運維人員及時發現問題。

智能

智能風險預警:通過 AI 實現智能風險預測,故障提前預知,問題一鍵閉環。

智能性能關聯分析:對虛擬機、虛擬網卡、虛擬磁盤、數據存儲等的性能問題智能關聯分析,快速定界性能瓶頸。

智能拓撲分析:智能拓撲梳理,圖形化輔助根因分析,問題定界定位小時級縮短到分鐘級。

開放

開放生態:南北向廣泛兼容,北向支持對接三方云管,南向支持多廠商設備管理、異構資源池納管。

自定義報表:掌控全網資產、資源、業務運行狀況,幫助運維決策、定期匯報。

自定義大屏:預置大屏和自定義能力滿足日常參觀、重點業務監控保障等訴求。

LinkSLA智能運維管家--更好的運維幫手
統一的、全棧的、智能的數據中心運維管理體系已成為當今用戶數據中心運維的普遍需求。LinkSLA智能運維管家在全棧統一管理的基礎上,結合業務高效發放以及 AI 技術賦予的智能故障定位、提前風險預知等能力,相信數據中心運維平臺將快速從人工走向自動,最終走向全場景“自治”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/163572.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/163572.shtml
英文地址,請注明出處:http://en.pswp.cn/news/163572.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Win11和NewBing瀏覽器100%開啟Copilot的方法

嚴格按以下步驟來,100%開啟免費的AI: 1.系統升級到Win11最新版(不要用家庭版,推薦專業版) 升級完成之后的系統信息(時間截至2023.11.22) 版本號:23H2 操作系統版本:226…

MySQL數據庫_01

Web后端開發_02 數據庫介紹 什么是數據庫? 數據庫:DataBase(DB),是存儲和管理數據的倉庫 數據庫管理系統:DataBase Management System (DBMS),操縱和管理數據庫的大型軟件。SQL:St…

自定義注解+AOP

自定義注解與AOP(面向切面編程)的結合常常用于在應用程序中劃定切面,以便在特定的方法或類上應用橫切關注點。以下是一個簡單的示例,演示了如何創建自定義注解,并使用Spring AOP來在被注解的方法上應用通知。 如何創建…

java學習part08權限

1.權限表格 外部類都是公有和缺省,因為其他兩種對于外部類沒有意義 一些內部成分都各種權限都可以 2.如何體現java封裝性 答,通過權限控制,保證哪些可以給人看到,哪些不能

手持式無線通信頻譜分析儀 MS2713E

MS2713E 手持式無線通信頻譜分析儀 安立手持式無線通信頻譜分析儀 MS2713E 旨在處理最惡劣的現場條件,使您能夠監控、定位、識別和分析各種蜂窩、2G/3G/4G、陸地移動無線電、Wi-Fi 和廣播信號。多功能 Spectrum Master 在定位和識別寬頻率范圍內的信號時&#xff0…

rust內存優化

背景 在 Rust 中,repr 是一個屬性(attribute),用于指定數據類型在內存中的布局和表現形式 repr 屬性可以用于枚舉、結構體和聯合體的定義,以控制它們的內部表示方式 repr 屬性有多個選項,每個選項對應于一種不同的布局方式 常見的選項包括: C 將類型按照 C 語言的規則…

3D人臉掃描設備助力企業家數字人復刻,打破商業邊界

京都薇薇推出數字人VN,以京都薇薇董事長為原型制作,賦能品牌直播、短片宣傳、線上面診等活動,進一步增強消費者對品牌的交互體驗,把元宇宙與品牌相融合,推動品牌線上服務與線下服務實現數字一體化,打造一個…

「X」Embedding in NLP|一文讀懂 2023 年最流行的 20 個 NLP 模型

在上一篇文章中,我們已經科普了什么是自然語言處理(NLP)、常見用例及其與向量數據庫的結合。今天,依然是「X」Embedding in NLP 系列專題,本文為初階第二篇,我們將深入介紹在 2023 年爆火的大語言模型 NLP …

小白也看的懂的爬取視頻操作

1.獲取一段視頻 可以直接從抖音下,也可以從b站上爬取(注意法律謝謝) 保護原創 b站的視頻 直接復制網址鏈接到嗶哩嗶哩(bilibili)視頻解析下載 - 保存B站視頻到手機、電腦 去就好了,

Docker的入門

Docker的入門 防火墻Docker的命令鏡像相關的命令運行容器容器相關的命令 Docker作為一個軟件集裝箱化平臺,可以讓開發者構建應用程序時,將它與其依賴環境一起打包到一個容器中,然后很容易地發布和應用到任意平臺中。 docker有3大核心&#xf…

如何弱化市場大環境帶來的影響?私域電商和裂變營銷引來新趨勢!

弱化市場大環境帶來的影響需要從多個方面入手,包括深入了解市場和行業、建立品牌優勢、多元化經營、優化供應鏈管理、加強客戶關系管理、靈活應對市場變化等。同時需要注意不同領域和行業的市場變化和政策調整,及時調整經營策略和業務結構,保…

WPF實戰項目十七(客戶端):數據等待加載彈框動畫

1、在Common文件夾下新建文件夾Events,新建擴展類UpdateLoadingEvent public class UpdateModel {public bool IsOpen { get; set; }}internal class UpdateLoadingEvent : PubSubEvent<UpdateModel>{} 2、新建一個靜態擴展類DialogExtensions來編寫注冊和推送等待消息…

獲取ip屬地(ip2region本地離線包-超簡單)

背景 最近有涉及要顯示ip屬地&#xff0c;但我想白嫖&#xff0c;結果就是白嫖的api接口太慢了&#xff0c;要延遲3到4秒左右&#xff0c;很影響體驗&#xff0c;而且不一定穩定。 結果突然看到了這個【ip2region】開源項目&#xff0c;離線識別ip屬地&#xff0c;精度自己測…

Public Key Retrieval is not allowed

出現這個錯誤的原因可能是 MySQL 連接配置中的某些設置限制了公鑰的檢索。要解決這個問題&#xff0c;可以嘗試以下方法&#xff1a; 設置參數&#xff1a;在 MySQL 連接 URL 或連接配置中添加參數 ?allowPublicKeyRetrievaltrue?。 更新 MySQL 驅動程序&#xff1a;如果您使…

編譯安裝報錯:configure: error: cannot guess build type; you must specify one

1、編譯安裝報錯 configure: error: cannot guess build type; you must specify one 該報錯信息翻過過來的意思是&#xff1a;無法猜測編譯 操作系統類型,請指定一個 2、解決方法 在原本的編譯安裝語句后面加上一句&#xff1a; “--buildarm-linux ” &#xff0c;這句話…

詳解開源數據庫審計平臺Yearning

基本概念 數據庫審計&#xff08;簡稱DBAudit&#xff09;能夠實時記錄網絡上的數據庫活動&#xff0c;對數據庫操作進行細粒度審計的合規性管理&#xff0c;對數據庫遭受到的風險行為進行告警&#xff0c;對攻擊行為進行阻斷。它通過對用戶訪問數據庫行為的記錄、分析和匯報&…

無人智能貨柜:提升購物體驗

無人智能貨柜&#xff1a;提升購物體驗 隨著移動支付的普及&#xff0c;人們日常生活中的主要場景已經滲透了這一支付方式。同時&#xff0c;無人智能貨柜作為購物的重要渠道&#xff0c;正在嶄露頭角。通過人工智能、圖像識別和物聯網技術的應用&#xff0c;無人智能貨柜將使購…

什么是復費率電表?

隨著科技的不斷進步和人們對能源管理的日益重視&#xff0c;復費率電表逐漸成為我國電力系統中不可或缺的一員。復費率電表是一種能夠實現電能計量、峰谷電價劃分以及負荷控制等多功能的智能電表&#xff0c;它采用先進的通信技術和計算機算法&#xff0c;對用戶的用電行為進行…

nginx.conf 配置文件 詳細解釋

文章目錄 nginx.conf 是 Nginx 的主要配置文件&#xff0c;其中可以配置許多模塊來定義服務器行為。以下是一些常見的 Nginx 模塊以及它們的作用&#xff1a;1. **http 模塊**&#xff1a;2. **server 模塊**&#xff1a;3. **location 模塊**&#xff1a;4. **events 模塊**&a…

軟件系統測試有哪些測試流程?系統測試報告編寫注意事項

在軟件開發的過程中&#xff0c;系統測試是至關重要的一環&#xff0c;它的目的是驗證和評估軟件產品是否符合預期的質量標準&#xff0c;以確保系統的穩定性、可靠性和安全性。 一、軟件系統測試的測試流程 1、需求分析與測試計劃制定&#xff1a;根據需求分析確定測試目標、…