【項目001】運維工程師項目實踐:高可用性云基礎設施部署與升級項目

目錄

項目名稱

項目背景

項目目標

項目成果

我的角色與職責

我主要完成的工作內容

本次項目涉及的技術

本次項目遇到的問題與解決方法

本次項目中可能被面試官問到的問題

1、什么是ELK?

2、什么是Elasticsearch、Logstash 和Kibana?

3、ELK 三個組件 如何協同工作?

4、你們公司采用的虛擬化平臺是哪一個?

5、你們本次項目共多少人?

6、你們本次項目共使用了多少臺虛擬機,配置分別是什么樣的?

經驗教訓與自我提升

展望未來


項目名稱

項目簡稱或代號:CUO(這個可以自己隨便編一個,每個公司的每個項目簡稱或代號都是內部任意起名的,顯得專業一點,一般是項目關鍵詞的首拼,比如這個CUO是:comprehensive upgrade and optimization)

項目全名:高可用性云基礎設施部署與升級項目

項目背景

隨著公司業務的迅速擴張,對數據中心的可靠性和性能要求越來越高。為了應對這一挑戰,公司決定對現有的IT基礎設施進行升級,構建一個基于云計算的高可用性平臺。作為運維團隊的一員,我深度參與了這一項目的規劃、實施和優化工作。

項目目標

  1. 構建一個穩定、可靠、可擴展的云計算平臺,支持公司業務的快速增長。

  2. 實現自動化部署和監控,提高運維效率。(比如日志監控采用ELK,服務器性能及網絡流量等監控采用Prometheus+grafana監控,對于這兩個監控平臺的部署和相面試官考察時候只需要能大概說一下這兩個監控平臺的原理、功能就可以了)

  3. 優化系統性能,確保關鍵業務應用的穩定運行。

項目成果

  1. 成功構建了一個基于云計算的高可用性平臺,為公司業務的快速增長提供了有力支持。

  2. 實現了自動化部署和監控,提高了運維效率,降低了人力成本。

  3. 通過對系統性能的優化,確保了關鍵業務應用的穩定運行,提高了客戶滿意度。

我的角色與職責

  1. 需求分析:與業務團隊緊密合作,了解業務需求和技術要求,為云平臺的規劃和設計提供有力支持。

  2. 架構設計:參與云平臺的整體架構設計,包括網絡、存儲、計算和安全等方面的規劃。

  3. 系統部署:負責云平臺的搭建和部署工作,包括虛擬化環境的配置、操作系統的安裝、應用軟件的部署等。

  4. 自動化腳本編寫:編寫自動化腳本,實現服務器的批量部署、配置和更新,提高運維效率。

  5. 監控與告警:配置和管理監控系統,實時監控云平臺的運行狀態,及時發現并處理潛在問題。同時,設置告警機制,確保關鍵業務應用的穩定運行。

  6. 性能優化:分析系統性能瓶頸,制定優化方案并實施,提高系統的整體性能。

  7. 文檔編寫:編寫運維手冊、操作指南等文檔,為團隊成員提供技術支持和參考。

我主要完成的工作內容

  1. 需求分析與文檔編寫

    • 與業務團隊和開發團隊進行深入溝通,明確業務需求和技術要求。

    • 編寫項目需求文檔,明確項目目標、范圍、時間表和關鍵里程碑。

  2. 云平臺架構設計

    • 根據業務需求和技術要求,設計云平臺的整體架構,包括網絡、存儲、計算和安全等方面的規劃。

    • 制定詳細的架構圖和設計文檔,為后續的部署和運維提供指導。

  3. 系統部署與配置

    • 負責云平臺的服務器、網絡設備和存儲設備的部署和配置工作。

    • 安裝和配置虛擬化環境,包括虛擬機管理器和虛擬機模板的創建。

    • 部署操作系統和應用軟件,并進行必要的配置和優化。

  4. 自動化腳本編寫

    • 編寫自動化腳本,實現服務器的批量部署、配置和更新。

    • 開發自動化監控和告警腳本,確保系統穩定運行。

  5. 性能監控與優化

    • 配置和管理監控系統,實時監控云平臺的運行狀態和性能指標。

    • 分析系統性能瓶頸,制定優化方案并實施,如調整系統參數、優化數據庫查詢等。

  6. 文檔編寫與技術支持

    • 編寫運維手冊、操作指南等文檔,為團隊成員提供技術支持和參考。

    • 參與內部培訓和知識分享活動,提升團隊整體技能水平。

本次項目涉及的技術

  1. 虛擬化技術:使用VMware或KVM等虛擬化技術搭建和管理虛擬機環境。

  2. 自動化工具:利用Ansible、Shell腳本等實現自動化部署、配置和監控。

  3. 監控工具:使用Zabbix、Prometheus等監控工具實時監控系統的運行狀態和性能指標。

  4. 存儲技術:涉及NFS、SAN、NAS等存儲技術的配置和管理。

  5. 網絡技術:包括VLAN、VPN、負載均衡等網絡技術的配置和優化。

(關于這些技術知識點,只需要網上搜索各個技術點的基本原理等就可以了。面試官提問時候能回答上個一二三基本就差不多了,面試官也不會深入提問的,如果有些技術被提問了你不會回答,就說這一部分工作內容是另一個同事做的)

本次項目遇到的問題與解決方法

  1. 問題

    :虛擬機性能不足,影響業務應用運行。

    • 解決方法:調整虛擬機資源配置,如增加CPU、內存和存儲資源。同時,對虛擬機進行優化,如關閉不必要的服務和應用,減少資源消耗。

  2. 問題

    :監控系統告警頻繁,導致誤報率較高。

    • 解決方法:對監控系統的閾值進行調整和優化,減少誤報率。同時,對告警進行分類和優先級劃分,確保重要告警能夠及時得到處理。

  3. 問題

    :自動化腳本執行失敗,導致部署和配置失敗。

    • 解決方法:對自動化腳本進行調試和修改,確保腳本的正確性和健壯性。同時,對執行環境進行排查和修復,確保腳本能夠正常運行。

  4. 問題

    :網絡延遲較高,影響業務應用性能。

    • 解決方法:對網絡設備和配置進行排查和優化,如調整路由策略、優化網絡帶寬等。同時,與網絡團隊緊密合作,確保網絡環境的穩定性和可靠性。

  5. 問題

    :存儲資源不足,無法滿足業務需求。

    • 解決方法:擴展存儲資源,如增加存儲設備、優化存儲架構等。同時,對存儲資源進行合理規劃和分配,確保資源的充分利用和高效運行。

本次項目中可能被面試官問到的問題

1、什么是ELK?

答:ELK 是三個開源項目的首字母縮寫:Elasticsearch、Logstash 和 Kibana。這些項目通常一起使用來構建一個集中的日志管理和分析系統

2、什么是Elasticsearch、Logstash 和Kibana?

答:

  1. Elasticsearch

    • Elasticsearch 是一個基于 Lucene 的搜索和分析引擎。它提供了全文搜索、結構化搜索、分析以及實時分析的能力。

    • Elasticsearch 是一個分布式系統,設計用于處理大規模數據,支持水平擴展和容錯。

    • 它通常用于存儲、搜索和分析日志、監控數據、時間序列數據等。

  2. Logstash

    • Logstash 是一個數據收集、處理和轉發的管道。它可以接收來自各種來源的數據(如文件、數據庫、網絡等),然后對其進行處理(如解析、轉換、過濾等),最后將處理后的數據發送到其他系統(如 Elasticsearch)。

    • Logstash 使用靈活的配置文件來定義數據流,可以輕松地修改和擴展以處理各種數據格式和場景。

    • Logstash 也可以與 Elasticsearch 和 Kibana 一起使用,形成一個完整的日志管理解決方案。

  3. Kibana

    • Kibana 是一個數據可視化和分析平臺,專門為 Elasticsearch 設計。它提供了一個用戶友好的界面,用于瀏覽、搜索、分析和可視化存儲在 Elasticsearch 中的數據。

    • Kibana 提供了各種可視化選項,如圖表、表格、地圖等,可以幫助用戶更好地理解數據。

    • Kibana 還支持自定義儀表板,允許用戶根據自己的需求創建和保存復雜的可視化布局。

3、ELK 三個組件 如何協同工作?

  • Logstash 負責從各種來源收集日志數據,并進行必要的處理和轉換。

  • 處理后的數據被發送到 Elasticsearch 進行存儲和索引。

  • Kibana 從 Elasticsearch 中檢索數據,并提供用戶友好的界面進行搜索、分析和可視化。

通過這種方式,ELK Stack 提供了一個完整的日志管理解決方案,可以幫助組織更好地理解和利用他們的日志數據。

4、你們公司采用的虛擬化平臺是哪一個?

答:VMware ESXI虛擬化平臺,部署簡單、可視化界面對虛擬機管理方便。

流程:購買物理服務器,然后下載VMware ESXI的iso鏡像包,找VMware官方購買授權證書。通過U盤將VMware ESX鏡像刻一個啟動盤,用U盤給服務器裝VMware ESXI虛擬化系統,然后在配置ip地址。這樣就可以通過筆記本上下載個VMware ESXI客戶端連接上這臺服務器,在這臺服務器上安裝多個虛擬機。

5、你們本次項目共多少人?

答:共5人

一個項目經理、1個業務開發工程師、1個測試工程師、2個運維工程師

6、你們本次項目共使用了多少臺虛擬機,配置分別是什么樣的?

答:共44臺虛擬機

23臺虛擬機:用來部署公司業務服務的。公司的服務是分布式部署的(就是一個軟件由多個組件組成,然后每個組件都是拆開單獨部署在一臺虛擬機上,然后通過ip端口或其他策略來實現把這些組件都串起來組成完整的服務,大概就是這么個意思),公司有兩個服務,一個是C開發的服務共10個組件,分別部署在10臺虛擬機上,每臺服務器2核心4G配置。還有一個是JAVA開發的服務共13個組件,分別部署在13臺虛擬機上,因為JAVA服務比較吃內存,所以每臺虛擬機為2核8G配置。

8臺mysql虛擬機:用來存儲數據、公司服務數據一共存儲在4個庫中,每臺mysql中創建了一個庫。每個庫中有幾十上百張表。每個數據庫都做了主備架構,分別為8核16G

3臺redis虛擬機:用來做mysql的中間件,進行數據緩存的,以減輕mysql壓力分別為8核16G

2臺LB負載均衡虛擬機,用來負責流量分發分別為8核心16G

2臺nginx虛擬機:用來搭建web頁面,代理后端業務虛擬機。分別為4核8G

3臺ELK虛擬機:Elasticsearch 消耗兩臺,因為Elasticsearch 主要用來存儲數據,LK兩個服務部署在同一臺機器上分別為2核4G

1臺性能監控虛擬機:用來部署Prometheus和grafana服務.4核心8G。

7、本次升級項目中你們你們數據備份是通過什么命令實現的?

mysql數據是通過mysqldump命令進行數據備份的

Elasticsearch 是通過elasticdump命令進行數據備份的

8、你們數據量有多大?是怎么遷移的?

總數據量大概有10TB左右,用linux命令進行遷移太過耗時,可能得好幾天。所以是用的第三方工具。

經驗教訓與自我提升

  1. 在項目過程中,我深刻體會到了團隊協作的重要性。與業務團隊、開發團隊等成員的緊密合作是項目成功的關鍵。

  2. 不斷學習和掌握新技術是運維工程師的必修課。通過參與這個項目,我深入了解了云計算、自動化運維等前沿技術,并不斷提升自己的技能水平。

  3. 在遇到問題時,保持冷靜和耐心是解決問題的關鍵。同時,及時總結和分享經驗教訓也是提高團隊整體能力的重要途徑。

展望未來

隨著云計算、大數據等技術的不斷發展,運維工程師的角色和職責也在不斷變化。未來,我將繼續學習和掌握新技術,提高自己的專業技能和綜合素質,為公司的發展貢獻更多力量。同時,我也期待與更多優秀的團隊成員一起合作,共同推動公司IT基礎設施的升級和優化工作。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/11269.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/11269.shtml
英文地址,請注明出處:http://en.pswp.cn/web/11269.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

echarts樹圖 改文本顯示的地方的樣式

樹圖改文本顯示的時候的樣式 雖然有點越改越丑 其中有一些失敗的嘗試 forammter 無法識別html元素 所以對于tooptips有用的html元素定義獲取返回在這里寫的話是不生效的 rich配置項里面的backgroundColor官方說支持 html元素和canvas元素 已經圖片url 沒有詳細試驗 官網地址 h…

【chisel】如何用chisel寫一個上升沿檢測程序

自定義上升沿檢測 class RisingEdgeDetector extends Module {val io IO(new Bundle {val inSig Input(Bool())val outSig Output(Bool())val clock Input(Clock())})// 定義 risingedge 函數def risingedge(x: Bool): Bool x && !RegNext(x)// 使用 risingedge …

代碼簽名證書的重要作用及申請途徑

代碼簽名技術是一種確保軟件完整性和來源可信度的安全措施。它通過數字證書和加密算法為軟件代碼或可執行文件加上一個“簽名”,以此驗證軟件未被篡改,并確認其來源于可信賴的開發者。 一、代碼簽名證書的重要作用 1、提高下載率和安裝率:用…

Linux提權--Rsync(未授權訪問) Docker 組掛載

免責聲明:本文僅做技術學習與交流... 目錄 Rsync(未授權訪問) 介紹: 靶場及過程: 提權過程: Docker 組掛載 原理: 復現: 利用: 具體操作: 1-確定是否有docker服務 2-查看用戶是否在docker組里面 3-執行命…

包管理工具npm、cnpm、yarn、NVM

文章目錄 npmnpm基本使用npm搜索包生產環境與開發環境開發依賴與生產依賴全局安裝環境變量Path安裝包依賴安裝指定版本的包、刪除依賴配置命令別名 cnpm安裝操作命令:配置 yarnyarn安裝及常用命令yarn 配置淘寶鏡像 NVM使用常用命令 擴展內容npm和yarn的選擇npm發布…

USB轉串口芯片CH341、CH372、CH374、CH375等的電路及 PCB 設計的重要注意事項

前言 USB芯片的電路和PCB設計參考及注意事項,含CH34X、CH37X等系列芯片的電路設計說明。涉及工作穩定性和抗干擾以及USB-HOST帶電熱插拔。基于 USB 芯片的電路及 PCB 設計的重要注意事項 版本:2E 1、摘要 本文主要針對以下因電路及 PCB 設計不佳而引起…

文檔解析與向量化技術加速多模態大模型訓練與應用

前言 隨著人工智能技術的不斷發展,多模態大模型作為一種新型的機器學習技術,逐漸成為人工智能領域的熱點話題。多模態大模型能夠處理多種媒體數據,如文本、圖像、音頻和視頻等,并通過學習不同模態之間的關聯,實現更加…

Q1咖啡機行業線上市場(京東天貓淘寶)銷售數據分析

回顧疫情那幾年,咖啡機市場可能是大環境帶動下爆發飛速的品類之一。在整體廚房小家電大盤銷售不佳的情況下, 咖啡機市場的表現是亮眼的。而今年Q1季度,在廚衛小電市場整體低迷的狀態下,咖啡機市場依然保持著穩中向好的趨勢。 根據…

Windows 命令修改時間

Windows 命令修改時間 運行w32tm /resync, 顯示“此計算機沒有重新同步,因為沒有可用的時間數據”, 運行w32tm /query /source , 顯示“Local CMOS Clock”,表示正在使用的是主板上的時間,沒有使用外部…

樹莓派|連接CSI接口攝像頭+opencv

CSI(Camera Serial Interface)接口攝像頭是一種常見的嵌入式系統或移動設備中使用的攝像頭接口。它通常用于與處理器或圖像傳感器進行直接連接,實現高速的圖像數據傳輸。 CSI接口攝像頭具有以下特點: 高速傳輸:CSI接口…

Spring MVC(五) 文件上傳

1 單文件上傳 在程序開發中,有時候需要上傳一些文件。我們在學習Servlet的時候,也做過文件上傳的操作,只不過基于Servlet的文件上傳操作起來過于復雜,因此所有的MVC框架都提供了自己的文件上傳操作,基本上都是基于File…

UE5 FARFilter篩選器使用方法

UE5 查找資源時可以用FARFilter進行篩選,之前可以用ClassNames進行篩選,但是5.1之后就棄用這個屬性改成ClassPaths屬性 構造一個FTopLevelAssetPath對象需要兩個FName參數,但是沒找到應該傳什么 查找官方文檔,明顯是錯誤的&#x…

AAAI: Generalized Singular Value Thresholding論文閱讀

1 Abstract 這篇論文研究了與非凸函數g相關的廣義奇異值閾值(Generalized Singular Value Thresholding, GSVT)算子Proxσ g (),定義為 P r o x g σ ( B ) arg ? min ? X ∑ i 1 m g ( σ i ( X ) ) 1 2 ∥ X ? B ∥ F 2 , \mathbf{Prox}_{g}^{\sigma}(\mat…

Python學習-Numpy-1

學習參考鏈接: Numpy的介紹和安裝和性能對比_嗶哩嗶哩_bilibili Numpy相對List的優勢和特點 1、Numpy的數據結構是array數組 2、相較List的性能更好,并且包含大量的便捷的函數,以及數組中元數據的信息 3、array的數據類型必須一致&#xff0c…

實驗名稱:TCP 連接管理

目錄 實驗目的: 實驗原理: 實驗步驟: 1) 啟動WireShark,設置抓包狀態 2) 訪問指定服務器 ,通過Wireshark抓取通信數據報文 3) 分析TCP連接建立的三次握手和連接釋放的四次握手過程 原始數據記錄: 實…

微信小程序生命周期揭秘:從啟動到消亡的全過程剖析【附代碼】

微信小程序生命周期揭秘:從啟動到消亡的全過程剖析 一、小程序生命周期概覽核心生命周期函數 二、深入理解生命周期回調2.1 onLoad: 首次亮相的準備2.2 onShow: 重登舞臺的瞬間2.3 onReady: 舞臺就緒,靜待表演2.4 onHide & onUnload: 謹慎離場&#…

【數據結構陳越版筆記】第1章 概述【習題】

1. 碎碎念 我這答案做的可能不對,如果不對,歡迎大家指出錯誤 2. 答案 1.1 判斷正誤 (1) N ( log N ) 2 N(\text{log}N)^{2} N(logN)2是 O ( N 2 ) O(N^{2}) O(N2)的。 (2) N 2 ( log N ) 2 N^{2}(\text…

藍橋杯備戰12.階乘

P5739 【深基7.例7】計算階乘 - 洛谷 | 計算機科學教育新生態 (luogu.com.cn) 遞歸 #include<bits/stdc.h> #define endl \n #define int long long using namespace std; const int N 2e710,M 1e310; double a[N]; int jie(int n) {if(n1)return 1;else return n*ji…

HTML/CSS3

1.CSS CSS的作用在于在HTML的基礎上(決定網頁的內容和結構)對網頁進行排版布局 對網頁中的元素提供樣式 使得網頁顯得更加精美CSS全稱是cascading style sheets 即層疊樣式表CSS樣式的書寫格式&#xff1a;樣式名: 樣式值 例如&#xff1a;color: red建議:之后進行空格 CSS樣式…

AXI Interconnect IP核的連接模式簡介

AXI Interconnect IP核內部包含一個 Crossbar IP核&#xff0c;用于在 Slave Interfaces&#xff08;SI&#xff09;和 Master Interfaces&#xff08;MI&#xff09;之間路由傳輸。在連接 SI 或 MI 到 Crossbar 的每條路徑上&#xff0c;可以選擇性地添加一系列 AXI Infrastru…