運行維護服務指的是采用信息技術手段及方法,依據客戶提出的服務要求,為其在使用信息系統過程中提出的需求提供的綜合服務是信息技術服務中的一種主要類型。運行維護服務對象是指信息系統工程建設項目交付的內容,包括機房基礎設施,物理資源,虛擬資源,平臺資源,應用和數據等。
?
運維能力模型
運行維護能力體系(MCS)是組織依據運行維護服務方針和目標,策劃并制定運行維護服務能力方案,確保組織交付運行維護內容符合SLA規定,并滿足質量要求,對運行維護服務交付過程,結果以及運行維護服務能力體系進行監督,測量,分析,評審,實現運行維護服務能力的持續提升。
實現運維能力持續性的螺旋式上升管理目標。
運維能力策劃是組織開展運維能力建設中運維能力管理第一項活動。
實施階段是策劃成果的具體執行,實施,協調和跟進,實施活動需要與策劃階段制定的方法,內容和目標等保持一致。組織和客戶之間建立的協調機制是非常重要的。
運維能力檢查是能力管理中必要的監督與反饋環節對策劃輸出的實施效果進行總結和評價,驗證能力管理實施過程的執行效果是否達到了既定質量目標。
運維能力改進是對檢查結果進行總結,對實施過程中存在的問題和不足進行分析,提出有針對性的持續改進目標和計劃,實施改進活動,使組織運維能力持續提升。
運維人員管理
在任何組織中,人力資源都是核心競爭力之一。人員管理在運維服務能力建設方面是重點考慮要素。目的是:選人做事。
崗位結構是整個管理系統的框架。
運維人員分為管理崗,主要負責運維組織管理包括服務總監,服務項目經理,質量經理等。
技術支持崗,主要負責運維技術建設及運維活動中的技術決策包括主機工程師,網絡工程師,數據庫工程師,應用系統工程師等。
操作崗,主要負責運維活動執行包括呼叫中心熱線工程師,系統監控工程師,機房值守人員等。
運維過程又稱流程為達到特定價值目標而由不同人分別共同完成的一系列活動。
運維過程管理的重點是把人員技術和資源要素以過程為主線串接在一起,指導運維服務人員按約定方式和方法正確地做事。
運維過程主要包括:
1,服務級別管理,對運維服務的級別定義,記錄和管理。通過服務級別協議(SLA),服務績效監控和報告的不斷循環,持續維護和改進服務質量,觸發采取行動消除較差服務從而滿足客戶服務需求。具體目標細化如下圖
?
?SLA主要內容包括,有效期和SLA的變更控制機制,授權細節,對溝通描述(服務報告),一些緊急行動中被預先授權相關聯系人的詳細信息,服務時間(正常服務時間,休息日,業務高峰時間),雙方協定好的計劃內停機(次數,時段,時長等),客戶6責任與義務,組織義務和職責,緊急情況下回復優先級順序和業務降級策略,事件上報和通知過程,投訴程序,服務目標,工作量限制,財務管理細節,術語表,第三方服務提供商和其他相關方提供的服務情況說明,任何SLA指定項以外內容等。樣例如下:
?
?
2,服務報告管理,過程負責及時,準確,完整,可靠的傳達服務管理的信息,為供需方管理層高效溝通與有效決策提供報告具體目標細化為:
統一收集服務衡量相關信息,統一計算服務衡量指標。提供對內運行服務能力衡量運維分析報告與對外服務客戶報告,并提供服務質量數據支撐關系。
3,事件管理,主要目的有效管理事件,實現快速解決事件,事件解決評估是提高組織效能的有效手段,組織需要建立相關機制,規劃,并確保有效實施。
?
4,問題管理,核心是找到根源,減少事件發生達到優化運維成本,提高運維能效的目的。
?
5,配置管理,主要包含配置管理數據庫(CMDB)的建立以及配置管理數據庫準確性維護,以支持運維對象的正常運行。可用于故障定位,問題分析,變更影像度分析,故障分析等,配置管理數據庫與真實環境的匹配度詳細都非常重要。
?
6,變更管理,主動變更常用于提供業務收益,包括降低成本改進服務及提高服務便捷性和有效性,被凍變更常用于解決故障,錯誤和適應不斷變化的環境,如隨系統增加相應需要增加系統服務能力等。
變更管理是從提出,審議,批準,實施,完成整個過程的管理。目標具體包括
7,發布管理,由許多問題修復和IT運維服務質量改進組成不僅包括軟件,硬件變更,還包括運維服務管理體系變更,具體目標如下,
?
8,可用性和連續性管理,可用性指IT服務或其他配置項在需要時執行某約定功能能力。
平均故障間隔時間(MTBF)度量服務發生故障頻率
平均恢復服務時間(MTRS)度量故障后服務恢復速度
連續性指災難或破壞性事件發生后服務提供者可接受預定義級別繼續服務運營能力。
恢復時間目標(RTO)服務中斷最長時間
恢復點目標(RPO)必須恢復的信息所指向的點。可容許數據損失時間段
9,系統容量與運維安全管理,可為組織業務和技術負責人進行統一的IT資源規劃提供有利依據幫助決策確保基礎設施容量以最劃算,適時的方式符合不斷發展的業務需求。
?安全管理
?
?
?
?
?