? ? ? ? 隨著云計算的普及與云原生的廣泛應用,越來越多的從業者、決策者清晰地認識到“云原生化將成為企業技術創新的關鍵要素,也是完成企業數字化轉型的最短路徑”。因此,具有前瞻思維的互聯網企業從應用誕生之初就扎根于云端,謹慎穩重的新零售、政府、金融、醫療等領域的企業與機構也逐漸將業務應用遷移上云,深度使用云原生技術與云原生架構。面對架構設計、開發方式到部署運維等不同業務場景,基于云原生架構的應用通常針對云的技術特性進行技術生命周期設計,最大限度利用云平臺的彈性、分布式、自助、按需等產品優勢。
? ? ? ? 名詞解釋:
????????OTA:全稱為Online Travel Agency,中文譯為“在線旅行社”即在線酒店、旅游、票務等預訂系統平臺統稱。目前的線上酒店行業平臺主要分為三個陣營:攜程系、美團系、飛豬系。
????????MAU(Monthly Active User)是一個用戶數量統計名詞,用于反映網站、互聯網應用或網絡游戲的運營情況的統計指標。月活躍用戶數量通常統計一個月(統計月)之內,登錄或使用了某個產品的用戶數(去除重復登錄的用戶)。? ? ? ??
1.背景與挑戰?
? ? ? ? ? 業務量的增長讓某旅行的技術團隊感到欣喜,但另一方面這也意味著團隊需要直面高流量帶來的新挑戰,云原生改造成了解決問題的關鍵。
? ? ? ? 某旅行公司主要面臨兩個問題。首先,由于剛和某網完成公司主體合并不久,兩個前身公司各自存在著不同技術體系的構建、發布等系統,這些系統隨著公司業務的逐步整合,也必須在技術層面做進一步的收斂,以達到平臺統一的目的。同時,在線旅行業務具有較明顯的業務波動特性,在基督、節假日、每日時段上都有比較突出的波峰波谷特性。這樣的業務特性對技術資源的整體利用率波動影響較大。所以此次云原生改造也面臨了不小的挑戰。????????
2.基于云原生架構的解決方案
圖1?某旅行公司云原生平臺架構圖?
3.應用效益?
? ? ? ? ?通過第一階段改造,訂單業務從原先獨享機器集群切換到了共享機器集群,僅使用之前獨享機器集群40%的機器就完成了對全線服務業務的支撐,同時由于調度算法加入了自研的服務畫像技術作為默認調度屬性,資源調度的穩定性不降反升。并且同程旅行已實現納入到該平臺部分單機資源利用率提升了20|%,并通過云原生化的舊應用改造,下掉了當時集群內一半的服務器和相應的機房水電資源。
? ? ? ? 通過第二階段改造,原本用來應對季節性流量高峰期而采購的機器資源開始減少。通過判斷服務當前冗余度來縮容線上服務的實例數,平臺可以用最小的實例數量提供線上服務,而節省下來的資源可以提供給離線業務混合部署使用。并且在不額外新增機器的情況下額外獲得的算力,成功支持了屢次創紀錄的峰值流量。同時Service?Balance系統可以在服務性能受損時自動嘗試修復該節點性能,使得平臺能夠以較低的成本穩定運行。并借用彈性計算成功撐住爆款應用帶來的日常流量300%的峰值流量,也頂住了2021年上半年的屢次刷新公司峰值流量,為公司同類業務場景提供了堅實的技術支撐。