大型分布式網站架構技術總結

  本文是學習大型分布式網站架構的技術總結。對架構一個高性能,高可用,可伸縮,可擴展的分布式網站進行了概要性描述,并給出一個架構參考。一部分為讀書筆記,一部分是個人經驗總結。對大型分布式網站架構有很好的參考價值。?

  本次分享大綱如下

    1. 大型網站的特點
    2. 大型網站架構目標
    3. 大型網站架構模式
    4. 高性能架構
    5. 高可用架構
    6. 可伸縮架構
    7. 可擴展架構
    8. 安全架構
    9. 敏捷架構
    10. 大型架構舉例?

一、大型網站的特點

    • 用戶多,分布廣泛
    • 大流量,高并發
    • 海量數據,服務高可用
    • 安全環境惡劣,易受網絡攻擊
    • 功能多,變更快,頻繁發布
    • 從小到大,漸進發展
    • 以用戶為中心
    • 免費服務,付費體驗?

二、大型網站架構目標

    • 高性能:提供快速的訪問體驗。
    • 高可用:網站服務一直可以正常訪問。
    • 可伸縮:通過硬件增加/減少,提高/降低處理能力。
    • 安全性:提供網站安全訪問和數據加密,安全存儲等策略。
    • 擴展性:方便的通過新增/移除方式,增加/減少新的功能/模塊。
    • 敏捷性:隨需應變,快速響應;

??

三、大型網站架構模式

?

    • 分層:一般可分為,應用層,服務層,數據層,管理層,分析層;
    • 分割:一般按照業務/模塊/功能特點進行劃分,比如應用層分為首頁,用戶中心。
    • 分布式:將應用分開部署(比如多臺物理機),通過遠程調用協同工作。
    • 集群:一個應用/模塊/功能部署多份(如:多臺物理機),通過負載均衡共同提供對外訪問。
    • 緩存:將數據放在距離應用或用戶最近的位置,加快訪問速度。
    • 異步:將同步的操作異步化。客戶端發出請求,不等待服務端響應,等服務端處理完畢后,使用通知或輪詢的方式告知請求方。一般指:請求——響應——通知 模式。
    • 冗余:增加副本,提高可用性,安全性,性能。
    • 安全:對已知問題有有效的解決方案,對未知/潛在問題建立發現和防御機制。
    • 自動化:將重復的,不需要人工參與的事情,通過工具的方式,使用機器完成。
    • 敏捷性:積極接受需求變更,快速響應業務發展需求。?

四、高性能架構

以用戶為中心,提供快速的網頁訪問體驗。主要參數有較短的響應時間,較大的并發處理能力,較高的吞吐量,穩定的性能參數。

可分為前端優化,應用層優化,代碼層優化,存儲層優化。

前端優化:網站業務邏輯之前的部分;

瀏覽器優化:減少Http請求數,使用瀏覽器緩存,啟用壓縮,Css Js位置,Js異步,減少Cookie傳輸;

CDN加速,反向代理;

應用層優化:處理網站業務的服務器。使用緩存,異步,集群

代碼優化:合理的架構,多線程,資源復用(對象池,線程池等),良好的數據結構,JVM調優,單例,Cache等;

存儲優化:緩存,固態硬盤,光纖傳輸,優化讀寫,磁盤冗余,分布式存儲(HDFS),NOSQL等;?

五、高可用架構

大型網站應該在任何時候都可以正常訪問。正常提供對外服務。因為大型網站的復雜性,分布式,廉價服務器,開源數據庫,操作系統等特點。要保證高可用是很困難的,也就是說網站的故障是不可避免的。

如何提高可用性,就是需要迫切解決的問題。首先,需要從架構級別,在規劃的時候,就考慮可用性。行業內一般用幾個9表示可用性指標。比如四個9(99.99),一年內允許的不可用時間是53分鐘。

不同層級使用的策略不同,一般采用冗余備份和失效轉移解決高可用問題。

應用層:一般設計為無狀態的,對于每次請求,使用哪一臺服務器處理是沒有影響的。一般使用負載均衡技術(需要解決Session同步問題),實現高可用。

服務層:負載均衡,分級管理,快速失敗(超時設置),異步調用,服務降級,冪等設計等。

數據層:冗余備份(冷,熱備[同步,異步],溫備),失效轉移(確認,轉移,恢復)。數據高可用方面著名的理論基礎是CAP理論(持久性,可用性,數據一致性[強一致,用戶一致,最終一致])??

六、可伸縮架構

伸縮性是指在不改變原有架構設計的基礎上,通過添加/減少硬件(服務器)的方式,提高/降低系統的處理能力。

應用層:對應用進行垂直或水平切分。然后針對單一功能進行負載均衡(DNS,HTTP[反向代理],IP,鏈路層)。

服務層:與應用層類似;

數據層:分庫,分表,NOSQL等;常用算法Hash,一致性Hash。?

七、可擴展架構

可以方便的進行功能模塊的新增/移除,提供代碼/模塊級別良好的可擴展性。

模塊化,組件化:高內聚,內耦合,提高復用性,擴展性。

穩定接口:定義穩定的接口,在接口不變的情況下,內部結構可以“隨意”變化。

設計模式:應用面向對象思想,原則,使用設計模式,進行代碼層面的設計。

消息隊列:模塊化的系統,通過消息隊列進行交互,使模塊之間的依賴解耦。

分布式服務:公用模塊服務化,提供其他系統使用,提高可重用性,擴展性。?

八、安全架構

對已知問題有有效的解決方案,對未知/潛在問題建立發現和防御機制。對于安全問題,首先要提高安全意識,建立一個安全的有效機制,從政策層面,組織層面進行保障。比如服務器密碼不能泄露,密碼每月更新,并且三次內不能重復;每周安全掃描等。以制度化的方式,加強安全體系的建設。同時,需要注意與安全有關的各個環節。安全問題不容忽視。包括基礎設施安全,應用系統安全,數據保密安全等。

基礎設施安全:硬件采購,操作系統,網絡環境方面的安全。一般采用,正規渠道購買高質量的產品,選擇安全的操作系統,及時修補漏洞,安裝殺毒軟件防火墻。防范病毒,后門。設置防火墻策略,建立DDOS防御系統,使用攻擊檢測系統,進行???????? 子網隔離等手段。

???????? 應用系統安全:在程序開發時,對已知常用問題,使用正確的方式,在代碼層面解決掉。防止跨站腳本攻擊(XSS),注入攻擊,跨站請求偽造(CSRF),錯誤信息,HTML注釋,文件上傳,路徑遍歷等。還可以使用Web應用防火墻(比如:ModSecurity),進行安全漏洞掃描等措施,加強應用級別的安全。

???????? 數據保密安全:存儲安全(存在在可靠的設備,實時,定時備份),保存安全(重要的信息加密保存,選擇合適的人員復雜保存和檢測等),傳輸安全(防止數據竊取和數據篡改);

???????? 常用的加解密算法(單項散列加密[MD5,SHA],對稱加密[DES,3DES,RC]),非對稱加密[RSA]等。?

九、敏捷性

網站的架構設計,運維管理要適應變化,提供高伸縮性,高擴展性。方便的應對快速的業務發展,突增高流量訪問等要求。

除上面介紹的架構要素外,還需要引入敏捷管理,敏捷開發的思想。使業務,產品,技術,運維統一起來,隨需應變,快速響應。?

十、大型架構舉例

?

以上采用七層邏輯架構,第一層客戶層,第二層前端優化層,第三層應用層,第四層服務層,第五層數據存儲層,第六層大數據存儲層,第七層大數據處理層。

客戶層:支持PC瀏覽器和手機APP。差別是手機APP可以直接訪問通過IP訪問,反向代理服務器。

前端層:使用DNS負載均衡,CDN本地加速以及反向代理服務;

應用層:網站應用集群;按照業務進行垂直拆分,比如商品應用,會員中心等;

服務層:提供公用服務,比如用戶服務,訂單服務,支付服務等;

數據層:支持關系型數據庫集群(支持讀寫分離),NOSQL集群,分布式文件系統集群;以及分布式Cache;

大數據存儲層:支持應用層和服務層的日志數據收集,關系數據庫和NOSQL數據庫的結構化和半結構化數據收集;

大數據處理層:通過Mapreduce進行離線數據分析或Storm實時數據分析,并將處理后的數據存入關系型數據庫。(實際使用中,離線數據和實時數據會按照業務要求進行分類處理,并存入不同的數據庫中,供應用層或服務層使用)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/286643.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/286643.shtml
英文地址,請注明出處:http://en.pswp.cn/news/286643.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python 數據分析找到老外最喜歡的中國美食【完整代碼】

一、環境及依賴 語言:python3.8 抓取:selenium 代理:ipide **注:**想要完整代碼的在末尾,注意新手建議慢慢看完。在此提示一下本篇文章的編寫步驟:1.獲取數據、2.翻譯、3.數據清洗、4.切詞詞權重、5.詞云 …

Android之檢查跳轉的Activity是否存在

1、需求 android我們知道經常會跳各種設置頁面,比如設置默認瀏覽器頁面、設置添加快捷方式權限頁面,我們會根據機型進行適配,但是有時候如果找到也找個頁面不try catch操作程序會奔潰 2、檢查跳轉的Activity是否存在代碼實現 public static boolean hasActivity(Context co…

hihoCoder 1257 Snake Carpet(很簡單的構造方法)

2015 ACM / ICPC 北京現場賽 I 題 構造 注意一個小坑&#xff0c;每條蛇的輸出是要從頭到尾輸出的。 還要注意的是&#xff0c;不能開數組去模擬構造過程&#xff0c;然后輸出&#xff0c;那樣會TLE的。 #include <cstdio> #include <cstring> #include <cmath&…

西北師范大學地理與環境科學學院考研真題匯總(高等數學)持續更新。。。

西北師范大學地理與環境學科學院研究生入學考試的所有專業(地圖學與地理信息系統、自然地理學、人文地理學、環境科學、環境工程)的數學均為自主命題,復習參考教材為同濟大學第五版。

操作系統與多核處理器

這篇文章解答了我心中的疑問&#xff0c;那就是操作系統會自動調度cpu資源來處理多進程&#xff0c;多線程的并發。早在上世紀90年代末&#xff0c;就有眾多業界人士呼吁用CMP(單芯片多處理器)技術來替代復雜性較高的單線程CPU。IBM、惠普、Sun等高端服務器廠商&#xff0c;更是…

Java網絡編程二:Socket詳解

Socket又稱套接字&#xff0c;是連接運行在網絡上兩個程序間的雙向通訊的端點。 一、使用Socket進行網絡通信的過程 服務端&#xff1a;服務器程序將一個套接字綁定到一個特定的端口&#xff0c;并通過此套接字等待和監聽客戶端的連接請求。 客戶端&#xff1a;客戶端程序根據你…

Android之提示Could not find com.android.support:appcompat-v7:25.3.1.

1 問題 編譯第三方項目&#xff0c;錯誤提示如下 Could not find com.android.support:appcompat-v7:25.3.1. Required by:project :sampleproject :sample > com.yanzhenjie:permission:1.0.7project :sample > com.yanzhenjie.alertdialog:alertdialog:1.0.1 Search …

在 .NET 中使用 FixedTimeEquals 應對計時攻擊

計時攻擊 在計算機安全中&#xff0c;計時攻擊&#xff08;Timing attack&#xff09;是旁道攻擊 &#xff08;Side-channel attack&#xff09; 的一種&#xff0c;而旁道攻擊是根據計算機處理過程發出的信息進行分析&#xff0c;包括耗時&#xff0c;聲音&#xff0c;功耗等…

解讀大型網站系統架構的演化

解讀大型網站系統架構的演化 大型網站的架構是根據業務需求不斷完善的&#xff0c;根據不同的業務特征會做特定的設計和考慮&#xff0c;本文只是講述一個常規大型網站會涉及的一些技術和手段。作者&#xff1a;李平來源&#xff1a;LEE的博客前言 一個成熟的大型網站&#xff…

【ArcGIS風暴】西北地區氣象臺站年均NDVI與年均氣溫和降水的相關性分析

在研究植被動態變化與氣候的關系時,通常通過計算植被NDVI值與氣溫和降水的相關系數來描述相關性的大小。如下圖所示,計算了西北地區分布的氣象臺站與氣溫和降水的相關性并作圖可視化。 下面詳細說明整個實現過程。 一、計算相關系數 1. 原理分析 通過計算年均N…

python 全解坦克大戰 輔助類 附完整代碼【雛形】

我正在博客之星評選&#xff0c;歡迎投票給我 會從投票人中抽獎機械鍵盤書&#xff0c;中了會私聊地址 投票連接是&#xff1a;https://bbs.csdn.net/topics/603955346 投票連接是&#xff1a;https://bbs.csdn.net/topics/603955346 投票連接是&#xff1a;https://bbs.csdn.…

vc++ mfc中拖動效果的實現 借助于CImageList

拖動是界面編程頻繁使用的一個效果&#xff0c;在windows系統下可謂大行其道。縱觀時下的應用軟件幾乎各個都支持各種各樣拖動的效果&#xff0c;windows7更是把拖動做到了極致。其實說起來拖動的實現也很簡單&#xff0c;對于有句柄的對象都可以通過MoveWindow或SetWindowPos實…

從瀏覽器地址欄輸入url到顯示頁面的步驟

從瀏覽器地址欄輸入url到顯示頁面的步驟(以HTTP為例)- 在瀏覽器地址欄輸入URL- 瀏覽器查看緩存&#xff0c;如果請求資源在緩存中并且新鮮&#xff0c;跳轉到轉碼步驟 - 如果資源未緩存&#xff0c;發起新請求 - 如果已緩存&#xff0c;檢驗是否足夠新鮮&#xff0c;足夠…

有序的Map集合--LinkedHashMap

提出問題&#xff1a; 在寫一個dao的時候&#xff0c;我的需求是這個dao是一個萬能的&#xff0c;目前的方法只有一個查詢出實體類對應的表中所有的數據&#xff0c;通過傳入的對象&#xff0c;利用反射獲取實體類中的屬性名&#xff0c;屬性類型&#xff0c;利用字符串拼接獲取…

Leetcode之僅僅反轉字母

1 題目 給定一個字符串 S,返回 “反轉后的” 字符串,其中不是字母的字符都保留在原地,而所有字母的位置發生反轉。 示例 1:輸入:"ab-cd" 輸出:"dc-ba" 示例 2:輸入:"a-bC-dEf-ghIj" 輸出:"j-Ih-gfE-dCba" 示例 3:輸入:&qu…

【SignalR全套系列】之在.Net Core 中實現長輪詢

微信公眾號&#xff1a;趣編程ACE關注可了解更多的.NET日常實戰開發技巧&#xff0c;如需源碼 請后臺留言 源碼;前文回顧【SignalR全套系列】之在.Net Core 中實現Server-Send Events消息推送【SignalR全套系列】之在.NetCore中實現WebSocket雙工通信【SignalR全套系列】之在.N…

完美解決ArcGIS10.2和Erdas9.2軟件沖突的方法:共存!

用過ArcGIS和Erdas軟件的都知道&#xff0c;二者存在著服務的沖突&#xff0c;為了解決共存的問題&#xff0c;筆者曾多次重裝系統&#xff0c;但未能如愿以償。其實不需要相互關閉服務如此麻煩。那如何在安裝有arcgis的電腦安裝erdas并解決沖突呢&#xff1f;直接上視頻教程。…

架構師之路16年精選50篇

2016精選索引&#xff0c;點擊標題閱讀相關文章。【方法論】《秒殺系統架構優化思路》《分布式ID生成器》《互聯網架構&#xff0c;如何進行容量設計》《線程數究竟設多少合理》《單點系統架構的可用性與性能優化》《關于負載均衡的一切》《異構服務器負載均衡及過載保護》《LV…

yii 前后臺分離及登陸驗證

2019獨角獸企業重金招聘Python工程師標準>>> 比較合理的做法其實是分成兩個框架來布署&#xff1b;然而這樣說法也太絕對。 事實上是針對不同系統&#xff0c;應采用不同的方法。如為CMS系統&#xff0c;則不需很復雜的權限管理&#xff0c;但如果有管理員與會員之分…

雙谷人才財務管理(序)

IT是一個迅速發展的行業&#xff0c;教育是一個良心的行業&#xff0c;兩者交集——IT培訓&#xff0c;在整個市場中占有一個不可或缺的地位。好多大學生&#xff0c;抱怨找不到工作&#xff1b;好多企業找不到合適的程序員&#xff0c;這幾年這個問題越來越嚴重。。。。于是IT…