服務臺需要跟蹤的3個重要指標MTBF+MTTF+MTTR

衡量標準是IT服務管理的核心,可提供有關運營的見解,并幫助確定需要持續改進的領域。通常的服務臺指標有助于展示內部運營效率。例如,衡量在規定時間內解決問題的工單數量的 SLA 是展示服務臺效率的關鍵因素。另一方面,故障指標可幫助團隊找出 IT 基礎設施中的薄弱環節,并幫助評估對故障事件的響應。這有助于 IT 團隊最大限度地減少故障可能對關鍵系統造成的連帶影響。

IT服務管理

需要跟蹤的關鍵失敗指標是什么?在本文中,我們將看到探討以下三個關鍵績效指標:

1、平均無故障工作時間(MTBF)

當 IT 基礎設施資產(無論是網絡、服務器還是工作站等)頻繁發生故障時,會對 IT 和業務服務的可用性產生連帶影響。這些中斷會導致收入和聲譽的損失。如果某項 IT 資產經常出現故障,通常需要進行維修或更換。在此之前,調查并了解資產經常宕機的原因,以及是在什么情況下宕機,有助于制定資產維護計劃,提高系統可用性。

平均無故障工作時間(MTBF)是幫助確定宕機原因的指標,有助于減少宕機時間或制定快速恢復計劃,提高 IT 系統的可用性。如果某項 IT 資產的 MTBF 很低,就意味著該資產會經常停機,導致 IT 和業務中斷。

MTBF 示例

在一家企業中,每當應用新的 Windows 固件更新時,存儲驅動器的新更新總是失敗。這種情況發生了幾次,平均無故障工作時間變得越來越短。在對問題進行分析后,團隊確定是第三方驅動程序導致執行更新所需的 API 無法實施或存在故障。當計劃進行新的更新時,如果第三方驅動程序沒有實施必要的 API,有兩種可能的解決方案可供探索。比如將 API 與 SATA 和 NVMe 存儲協議的 Windows 替代方案進行交換,或從原始設備制造商處獲取新的、更好支持的驅動程序版本,都有助于實施更新、修復漏洞并堵塞安全漏洞。監控和跟蹤驅動程序升級以及停機時間都有助于提高存儲驅動器的可用性。

如何提高 MTBF

實施觀察資產健康狀況的流程,以跟蹤和監控故障,有助于找出故障原因。

分析問題的根本原因,以提高認識、解決長期原因并提高資產性能。

制定快速反應戰略,有效解決并減少影響運營的停機時間。目標是減少停機次數,延長停機時間。

2、平均失效前時間(MTTF)

資產經常出現故障會中斷企業的 IT 運營,導致 IT 基礎設施性能下降。MTTF 指標有助于確定資產、設備或組件的使用壽命。對于 MTTF 較低的 IT 資產和組件,通常更換 IT 組件比修復組件更省時,并能最大限度地降低運營影響和成本。

這尤其適用于與基礎設施關鍵運行元素(如大型機服務器堆棧或網絡接入點)相關聯的 IT 組件。如果資產的 MTTF 不理想且經常出現故障,則表明 IT 資產不可靠,需要頻繁更換,以免影響 IT 運營。

MTTF 示例

在一家 IT 軟件開發公司,當數據和網絡服務器堆棧中的交換機連接或斷開電纜時,網絡電纜就會松動、斷開或損壞。由于數據傳輸中斷,導致文件損壞。網絡團隊的進一步分析表明,CAT6 RJ45 跳線上的無卡塑料蓋不斷斷裂。這是因為電纜是從使用廉價材料的制造商那里采購的。隨后,IT 團隊用質量更好的電纜替換了舊電纜,以確保今后移動電纜時不會出現數據丟失或損壞等問題。這是一個典型的例子,但定期跟蹤電纜的 MTTF 有助于 IT 團隊了解關鍵資產(如組件)的影響,從而就維修和更換做出明智的決策。

如何提高 MTTF

通過采購高質量的資產和停用低質量、低成本的資產來延長資產的使用壽命。

通過定期檢查與關鍵資產相關的組件,防止大規模中斷業務運營。

實施及時庫存流程,估算資產的運行時間,從而降低資產存儲的間接成本。

3、平均修復時間 (MTTR)

當關鍵 IT 系統發生故障時,IT 團隊必須盡快恢復系統運行。延遲恢復 IT 系統會導致收入損失并影響關鍵業務運營。一個組織良好的恢復和響應系統可以幫助 IT 團隊應對計劃外停機,并有效地恢復運行。MTTR 衡量的是修復資產或排除故障并使其恢復運行能力所需的平均時間。

停機成本隨著 MTTR 的增加而增加。MTTR 高說明恢復和響應操作不夠迅速有效。系統故障是不可避免的,但 MTTR 能讓團隊對資產故障做出及時和戰略性的反應。

MTTR 示例

一家軟件公司正在開發的一款視頻游戲因代碼漏洞而遭到零時差攻擊。這次攻擊破壞了 Wi-Fi 和監控系統等操作。這導致攻擊者訪問了組織的網絡域和機密業務文件。網絡安全團隊告知員工有關零日攻擊的信息,以及他們可以在哪里報告這些攻擊。該組織的所有 IT 資產都配備了下一代殺毒軟件 (NGAV)。這次攻擊導致局域網和員工自助服務門戶癱瘓,使組織的運營陷入癱瘓。在攻擊發生后一小時內,網絡安全團隊得到了 NGAV 的通知和幫助,NGAV 利用威脅分析和用戶行為模式,識別出了可疑活動。網絡安全團隊立即運行補丁管理腳本,修正了代碼中的漏洞,并鎖定了內部網絡,以避免進一步影響運營和數據竊取。

如何降低 MTTR

通過識別瓶頸、指定資產維修或更換,實行高效的資產管理戰略,有助于推動更好的決策,還能夠可以節省資金和存儲空間。

明確技術人員的責任和角色,簡化事故檢測和解決流程。

為技術人員提供詳細的標準操作程序,以減少停機期間的誤傳和混亂。

使用集中管理資產維護和監控信息的企業資產管理解決方案來衡量 MTTR。這還有助于優化資產利用率、收集資產數據和預測可能的停機時間。

結語

這些指標可幫助團隊識別運營中的瓶頸及其對事件的響應能力,它們通過準確定位持續性事件的根本原因,幫助 IT 團隊實現更高的運營效率。IT 團隊可以清楚地了解 IT 運營受到影響的領域,從而改進其事件響應策略。企業可以將這些指標作為關鍵績效指標而不僅僅是績效目標來實施。這些指標指出了流程簡化和運營改進的領域,而不僅僅是要達到的目標。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166831.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166831.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166831.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

阿里云服務器(vgn7i-vws) anaconda(py39)+pytorch1.12.0(cu113)

安裝anaconda 2022 10 py3.9 wget https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh sha256sum Anaconda3-2022.10-Linux-x86_64.sh #校驗數據完整性 chmod ux Anaconda3-2022.10-Linux-x86_64.sh #添加執行權限 bash Anaconda3-2022.10-Linux-x86_…

ate測試原理及ate測試系統(軟件)知識科普 -納米軟件

ATE(Automatic Test Equipment)測試也叫自動化測試,通過計算機控制測試儀器對被測對象進行測試。以計算機編程代替人工測試,基于測試程序控制儀器并對待測品進行輸入和輸出信號檢測分析,從而判斷待測品的性能是否符合要求。 ATE測試需要根據測…

linux進程調度(一)-進程概述

一、什么是進程 進程是指計算機已運行的程序。程序本身只是指令、數據及其組織形式的描述。進程就是一個程序的執行實例,也就是正在執行的程序。在linux操作系統的中,進程就是一個擔當分配系統資源CPU時間、內存的實體。進程控制的主要功能是對系統中的所…

Kafka報錯under-replicated partitions

1 under-replicated partitions異常原因 Kafka報錯under replicated partitions意味著某些分區的副本數量未達到預期的復制因子。 主要有兩種原因, Broker故障 如果某個Kafka Broker發生故障,導致其中一些分區的副本不再可用,那么這些分區就…

2023年微軟開源八個人工智能項目

自2001年軟件巨頭微軟前首席執行官史蒂夫鮑爾默對開源(尤其是Linux)發表尖刻言論以來,微軟正在開源方面取得了長足的進步。繼ChatGPT于去年年底發布了后,微軟的整個2023年,大多數技術都是面向開發人員和研究人員公開發…

Towhee介紹

官方網站:Towhee | Home - Towhee Towhee 是一個尖端框架,旨在通過使用基于大型語言模型 (LLM) 的管道編排來簡化非結構化數據的處理。它具有獨特的優勢,可以從各種非結構化數據類型(包括冗長的文本、圖像…

淺談進程與線程

文章目錄 一. 進程🍎什么是程序?什么是進程?🍋程序的并發性和并行性🍉進程誕生的原因🍑PCB 二. 線程🍥什么是線程?🍦為什么引入線程? 三. 進程與線程的區別與…

HarmonyOS 設備管理開發:USB 服務開發指導

基本概念 USB 服務是應用訪問底層的一種設備抽象概念。開發者根據提供的 USB API,可以獲取設備列表、控制設備訪問權限、以及與連接的設備進行數據傳輸、控制命令傳輸等。 運作機制 USB 服務系統包含 USB API、USB Service、USB HAL。 圖 1 USB 服務運作機制 ●…

【SpringBoot3+Vue3】五【完】【實戰篇】-前端(配合后端)

目錄 一、環境準備 1、創建Vue工程 2、安裝依賴 2.1 安裝項目所需要的vue依賴 2.2 安裝element-plus依賴 2.2.1 安裝 2.2.2 項目導入element-plus 2.3 安裝axios依賴 2.4 安裝sass依賴 3、目錄調整 3.1 刪除部分默認目錄下文件 3.1.1 src/components下自動生成的…

JeecgBoot3.5漏洞升級—快速文檔

近幾年來,黑客攻擊行為呈現出日益復雜和隱蔽的趨勢,對個人和組織的安全造成了嚴重威脅。黑客們不斷尋找新的漏洞和安全漏洞,利用各種手段進行網絡攻擊,包括惡意軟件、網絡釣魚、勒索軟件等。因此,我們每個人都需要關注…

Windows系統下載并安裝 Windows PowerShell

PowerShell下載地址 一 windows7 版本 **若要確定您正在使用的 Microsoft PowerShelll 版本,請在 Windows 7 或 Windows Server 2008R2 或 Windows Server 2012 計算機上執行以下操作: 單擊“開始”,單擊“所有程序”,單擊“附件”,單擊“Windows PowerShell”,然后單擊…

渲染農場渲染一分鐘動畫需要多少錢?需要渲染多少時間?

現在很公司都開始使用渲染農場渲染動畫,但是還是有很多人不知道渲染農場渲染動畫需要多少錢,需要渲染多少時間。在這篇文章中我們將為你一一解答,為你提供一個清晰的參考。 渲染農場的收費通常是按照渲染的使用時間收費,渲染十分…

華大基因助力烏茲別克斯坦精準醫學發展,共筑健康絲綢之路

今年上半年,中國與中亞五國元首齊聚陜西西安,舉辦中國-中亞峰會。過去的20年里,中國已經成為中亞國家的主要投資來源國,總投資額接近400億美元。烏茲別克斯坦是中國-中亞合作機制的重要參與者,烏…

elasticsearch命令大全

1、查詢全部索引 GET /_cat/indices?v2、要按文檔數對所有索引進行降序排序 GET /_cat/indices?v&hindex,docs.count&sdocs.count:descv:參數用于顯示列標題 h:參數用于指定要顯示的列 s:參數用于指定按哪一列進行排序 desc&…

CAD隨機多面體_圓柱試件3D插件

插件介紹 CAD隨機多面體_圓柱試件3D插件可用于在AutoCAD軟件內生成隨機三維多面體及外側圓柱體試件。插件可確保多面體之間不發生干涉,且多面體與外側圓柱體試件之間保持適配關系,確保生成的模型導入有限元軟件后幾何合理有效。本插件主要可應用于三維混…

講概念談愿景AI Agent名不副實?看實在智能RPA Agent智能體如何落地!

OpenAI在首屆開發者大會上推出了GPTs和Assitant API,不僅改寫了AI Agent的構建范式,也把AI智能體的應用推向一個新高潮。GPTs和GPT商店,使得用戶無需編碼通過自然語言就能創建并擁有多個專屬私人助理,且可以如在蘋果應用商店一樣在…

開發教育APP的意義

開發教育APP的意義有以下幾點: 促進教育資源發揮效果:通過教育APP軟件開發,可以讓現代教育資源有效合理的進行利用,并且能夠更進一步的提升發揮功能,促進教育資源全面發揮其具體作用和效果,從而提升教育行…

3.3.1詳解linux內核鏈表list_head及其接口應用

文章目錄 1 list定義2 list接口2.1 list初始化方法1:定義并初始化鏈表方法2:先定義再初始化鏈表2.2 list_add2.3 list_del2.4 list_replace2.5 list_move2.6 list_splice3 list遍歷3.1 list_entry3.2 list_first_entry3.3 list_last_entry3.4 list_first_entry_or_null3.5 li…

Y-MODEM協議定制上位機

最近在使用N32G031和STM32F10X系列單片機進行IAP,使用的是Ymodem協議。單片機上的軟件已經完成了,一般是使用secureCRT這樣的工具作為上位機來進行測試,后來想做一個定制化的簡單的上位機。在網上找了下資料,以下這篇文章寫的使用…

淺談安科瑞無線測溫設備在挪威某項目的應用

摘要:安科瑞無線溫度設備裝置通過無線溫度收發器和各無線溫度傳感器直接進行溫度值的傳輸,并采用液晶顯示各無線溫度傳感器所測溫度。 Absrtact:Acre wireless temperature device directly transmits the temperature value through the wireless temp…