騰訊云存儲原理

我們來詳細展開你提到的兩個核心結構概念:


一、“基于分布式文件系統 + 對象存儲技術” 是什么?

1. 分布式文件系統(DFS)基礎

分布式文件系統是一種支持將數據分布在多個存儲節點上、并對上層用戶透明的文件系統。騰訊云COS雖然是“對象存儲”,但其底層很多機制和思路來源于DFS。代表系統包括:Google GFS、HDFS、CephFS等。

核心機制包括:

  • 統一命名空間:通過邏輯路徑組織文件(COS通過Bucket/Object Key模擬這種結構)

  • 數據分片+分布式存儲:文件被分片(Chunk)后,分布在不同的節點上

  • 元數據集中管理:如文件路徑、大小、分片位置等由專門的服務節點(如 Master)管理

  • 冗余機制:副本或糾刪碼保障數據容錯

2. 對象存儲技術基礎

與傳統文件系統不同,對象存儲強調**“面向對象”而非面向文件**,每個對象 = 數據本體 + 元數據 + 唯一標識。

主要特點:

  • 對象無層級路徑限制(扁平結構,通過 Key 唯一定位)

  • 元數據豐富(支持自定義)

  • 支持大規模存儲(數據量可達 EB 級)

  • 通過RESTful API 訪問,而非 POSIX 接口

3. 騰訊云COS的融合做法

騰訊云COS實際上將兩者優點結合:

功能分布式文件系統特性對象存儲特性
數據分片存儲
支持海量文件
統一命名空間是(模擬)是(通過Key)
豐富元數據
RESTful接口
文件操作語義支持部分(如range讀)支持部分

總結:

騰訊云COS本質上是構建在分布式存儲之上的對象抽象層,它從DFS中借鑒了數據分片、高可用、多副本等底層架構,并在上層構建了面向對象的API層元數據服務


二、對象存儲模型 + 分片冗余 + 元數據強一致 + 多副本容災

這個是騰訊云COS的底層關鍵機制,下面我們逐個拆解:


1. 對象存儲模型

COS 中的對象存儲模型包括以下三個核心要素:

  • 對象(Object):用戶實際存儲的內容,如圖片、日志、視頻等

  • 元數據(Metadata):描述對象的屬性,如對象大小、類型、訪問權限、自定義標簽等

  • 鍵值命名(Key-Value):每個對象通過Bucket + Object Key唯一標識

對象本身在上傳時會被切割成多個數據塊,但對用戶來說是透明的整體對象視圖


2. 分片冗余(Sharding + Redundancy)

上傳過程:
  • 大對象會被分片(Chunking),比如128MB一個分片

  • 每個分片單獨進行加密/壓縮/校驗

  • 分片后通過內部分布式調度系統,將其分布寫入多個存儲節點

冗余方式:
  • 三副本機制(Replication):每個分片保留3個副本,分別存儲在不同節點/數據中心

  • 糾刪碼機制(Erasure Coding):

    • 將數據分為 kk 份,生成 mm 份冗余(如 RS(10, 4)),可容忍任意4個塊丟失

    • 存儲空間更節省(副本是3x,EC只需1.4x左右)

騰訊云的COS同時支持這兩種機制,對熱數據使用三副本,對冷數據使用糾刪碼優化成本。


3. 元數據強一致(Metadata Consistency)

元數據包括:

  • Bucket、Object 的結構信息

  • 所有分片的索引(偏移、節點位置等)

  • ACL權限、版本、生命周期規則

強一致性機制:

  • COS不像AWS S3那樣使用 eventual consistency(最終一致),而是讀寫強一致

  • 元數據服務基于分布式一致性協議(如 Paxos/Raft):

    • 所有寫入需要在多個元數據節點之間達成一致后才確認

    • 保證在上傳成功后,立即可見、可讀

實現機制:
  • 多副本 + WAL(日志)機制保障元數據不丟失

  • 使用分布式事務(如兩階段提交+冪等操作)保證一致性

  • 元數據系統可擴展,如通過分區(Sharding)對Bucket劃分管理


4. 多副本容災(Replication + Disaster Recovery)

COS的數據副本不僅僅在一臺機器或一個機房中保存,而是跨多個**AZ(可用區)/Region(地域)**部署:

容災策略:
  • 數據副本寫入分布在多個AZ,至少兩個數據中心

  • 任意一個AZ不可用,仍能提供完整數據讀寫服務

  • 具備跨地域容災選項(如北京主站 + 廣州備份)

自動修復:
  • 發現數據塊異常或缺失時,會自動從其他副本重構缺失數據

  • 每個存儲節點運行定期的健康檢查 + 重構調度器


總結結構圖(概念性):

          +--------------------+|   用戶API請求      |+--------------------+↓+-------------------------------+|   前端網關 / API接入層        |+-------------------------------+↓+---------------------+|   元數據服務(Meta)  |<----一致性協議保證強一致+---------------------+↓+-----------------------------+|   分片調度器 / 數據索引     |+-----------------------------+↓              ↓            ↓+------------+  +------------+  +------------+| 存儲節點A  |  | 存儲節點B  |  | 存儲節點C  |+------------+  +------------+  +------------+(數據副本/EC塊分布在多個節點)

這兩個問題非常關鍵,下面我們逐一講清楚:


三、對象存儲模型 有什么用?

1. 定義:

對象存儲模型是將數據視為**“對象”**進行存儲,而不是傳統的文件或塊。每個對象 = 數據內容(Body) + 元數據(Metadata)+ 唯一ID(Key)


2. 有什么用?(也即為什么業界大規模采用對象模型)

? 扁平結構,方便擴展
  • 不再使用傳統目錄樹結構,而是以 Key 直接索引

  • 幾百億甚至萬億文件時不產生性能瓶頸(文件系統的 inode 容易成瓶頸)

? 面向互聯網訪問設計
  • 對象通過 REST API(PUT/GET)訪問,天然適配 Web、APP、IoT 場景

  • 無需掛載、無需 POSIX 文件接口,更適合云環境

? 自帶元數據支持
  • 每個對象都可以攜帶自定義元數據(如作者、標簽、業務標識)

  • 元數據與對象數據一起管理,方便搜索、歸檔、權限控制

? 易于彈性擴展
  • 對象是獨立單元,便于分布式系統橫向擴容(新增節點即可)

  • 結合負載均衡系統可以高效調度存取

? 自動容錯 + 生命周期管理
  • 支持生命周期規則(如過期刪除、歸檔)

  • 與副本或糾刪碼結合,自動保證數據高可用

? 更適合非結構化數據(大對象)存儲
  • 視頻、圖片、日志、模型文件、備份數據都能高效存放


總結一句話:
對象存儲模型讓數據變得“可尋址、可管理、可擴展、易云化”,是支撐現代大規模數據系統的基礎。


四、為什么 RS(10, 4) 能容忍任意4個塊丟失?是門限共享嗎?

簡單回答:是“門限糾刪碼”思想(類似門限共享),但它不是加密而是編碼方式。


1. 什么是 RS(10,4) 糾刪碼?

  • 這是 Reed-Solomon 編碼的一種表示:將一個數據對象分成 10 個“數據塊”,再生成 4 個“校驗塊”。

  • 總共 14 個塊(10+4)

  • 只要任意 10 個塊不丟失,就能還原原始數據


2. 為什么是“任意”4個塊都能丟?

因為 Reed-Solomon 是 MDS(Maximum Distance Separable)碼

  • 在數學上它能達到理論上的最強糾錯性能

  • 只要收到了 原始 k = 10 個塊中的任意組合(可以是 6 個數據塊 + 4 個校驗塊,也可以是 10 個數據塊),就能完整恢復

  • 其背后是線性代數中的Vandermonde矩陣編碼/解碼

這和**Shamir 門限加密(門限共享)**思想非常類似:

特性RS糾刪碼Shamir門限共享
數據恢復條件任意 kk 塊即可恢復任意 kk 份即可恢復原始密鑰
本質線性編碼(編碼/解碼)多項式插值
用途容錯、節省存儲安全保密、密鑰恢復

所以你問得非常精準 —— 它不是加密意義上的門限共享,但其數學原理類似門限恢復機制,這正是RS碼能提供強糾錯能力的關鍵。


3. 舉個例子:

假設我們用 RS(10,4) 編碼了一個 1GB 文件:

  • 被切成 10 個數據塊,每塊 100MB

  • 再生成 4 個校驗塊,每塊也是 100MB

如果其中 4 個塊(無論是哪4個)在網絡/硬盤/節點中丟失,只要剩下任意10個塊,我們都可以通過解碼算法完整還原1GB原始文件。


總結

  • 對象存儲模型提供了對大規模非結構化數據的彈性、高效、云原生的管理方式;

  • RS糾刪碼是類似門限共享的一種編碼機制,能從任意 kk 個塊恢復原始數據,原因在于它是最大距離可分碼(MDS)的一種實現


如你有興趣,我也可以畫一張糾刪碼塊的分布示意圖,或者帶你寫一個簡化的 Python 示例(基于 zfecpyreedsolomon) 來演示其工作原理。是否需要?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81699.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81699.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81699.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python fastapi + react, 寫一個圖片 app

1. 起因&#xff0c; 目的: 上廁所的時候&#xff0c;想用手機查看電腦上的圖片&#xff0c;但是又不想點擊下載。此app 應運而生。 2. 先看效果 單擊圖片&#xff0c;能放大圖片 3. 過程: 過程很枯燥。有時候&#xff0c; 有一堆新的想法。 但是做起來太麻煩&#xff0c;…

Kubernetes控制平面組件:Kubelet詳解(五):切換docker運行時為containerd

云原生學習路線導航頁&#xff08;持續更新中&#xff09; kubernetes學習系列快捷鏈接 Kubernetes架構原則和對象設計&#xff08;一&#xff09;Kubernetes架構原則和對象設計&#xff08;二&#xff09;Kubernetes架構原則和對象設計&#xff08;三&#xff09;Kubernetes控…

QT6 源(111):閱讀與注釋菜單欄 QMenuBar,進行屬性與成員函數測試,信號與槽函數測試,并給出源碼

&#xff08;1&#xff09; &#xff08;2&#xff09; &#xff08;3&#xff09; &#xff08;4&#xff09; &#xff08;5&#xff09; &#xff08;6&#xff09; &#xff08;7&#xff09;以下源代碼來自于頭文件 qmenubar . h &#xff1a; #ifndef QMENUBAR_H #defi…

Leetcode 3552. Grid Teleportation Traversal

Leetcode 3552. Grid Teleportation Traversal 1. 解題思路2. 代碼實現 題目鏈接&#xff1a;3552. Grid Teleportation Traversal 1. 解題思路 這一題的話核心就是一個廣度優先遍歷&#xff0c;我們只需要從原點開始&#xff0c;一點點考察其所能到達的位置&#xff0c;直至…

2023CCPC河南省賽暨河南邀請賽個人補題ABEFGHK

Dashboard - 2023 CCPC Henan Provincial Collegiate Programming Contest - Codeforces 過題難度&#xff1a;A H F G B K E 銅獎&#xff1a; 2 339 銀獎&#xff1a; 3 318 金獎&#xff1a; 5 523 A: 直接模擬 // Code Start Here int t;cin >> t;while(t-…

如何用Python批量解壓ZIP文件?快速解決方案

如何用Python批量解壓ZIP文件&#xff1f;快速解決方案 文章目錄 **如何用Python批量解壓ZIP文件&#xff1f;快速解決方案**代碼結果詳細解釋 話不多說&#xff0c;先上干貨&#xff01;&#xff01;&#xff01; 代碼 import os import zipfiledef unzip_file(dir_path: str…

Spring Boot 的高級特性與經典的設計模式應用

目錄 1. 設計模式在 Spring Boot 中的應用 1.1 單例模式&#xff1a;Bean 管理與全局實例 1.1.1 Spring 中的單例 Bean 1.1.2 自定義單例實現 1.1.3 單例模式的優勢 1.2 工廠模式&#xff1a;動態創建 Bean 1.2.1 Spring 的工廠方法 1.2.2 自定義工廠類 1.2.3 工廠模式…

在Excel中使用函數公式時,常見錯誤對應不同的典型問題

在Excel中使用函數公式時&#xff0c;常見錯誤對應不同的典型問題 1. #DIV/0!&#xff08;除以零錯誤&#xff09;2. #N/A&#xff08;值不可用&#xff09;3. #NAME?&#xff08;名稱錯誤&#xff09;4. #NULL!&#xff08;空交集錯誤&#xff09;5. #NUM!&#xff08;數值錯…

【cursor疑惑】cursor續杯后使用agent對話時,提示“需要pro或商業訂閱的用戶才能使用“

背景 cursor的pro會員體驗過期了&#xff0c;想再次體驗deepseek、Claude等agent對話提示:“免費版本不可以使用agent對話功能(英文忘記截圖了&#xff0c;大意是這樣)”。 處理方法 Step-1&#xff1a;再次續杯cursor的pro會員14天體驗 詳情&#xff0c;見&#xff1a;【c…

解決qt.network.ssl: QSslSocket::connectToHostEncrypted: TLS initialization failed

可以參考&#xff1a;解決qt.network.ssl: QSslSocket::connectToHostEncrypted: TLS initialization failed-CSDN博客 講的是程序執行目錄下可能缺少了&#xff1a; libssl-1_1-x64.dll 和 libcrypto-1_1-x64.dll 庫文件&#xff0c;將其復制到可執行文件exe的同級目錄下即可…

白楊SEO:不到7天,白楊SEO博客網站百度搜索顯示和排名恢復正常!順帶說說上海線下GEO聚會分享和播客紅利

大家好&#xff0c;我是白楊SEO&#xff0c;專注SEO十年以上&#xff0c;全網SEO流量實戰派&#xff0c;AI搜索優化研究者。 5月開始&#xff0c;明顯就忙起來了&#xff0c;不管是個人陪跑還是企業顧問&#xff0c;不管是需要傳統SEO還是新媒體流量&#xff0c;還是當下這個A…

FART 自動化脫殼框架簡介與脫殼點的選擇

版權歸作者所有&#xff0c;如有轉發&#xff0c;請注明文章出處&#xff1a;https://cyrus-studio.github.io/blog/ FART簡介 ART 環境下基于主動調用的自動化脫殼方案&#xff0c;可以解決函數抽取殼。 關于函數抽取殼的實現原理可以參考&#xff1a;基于 art 下的類加載機…

卷積神經網絡進階:轉置卷積與棋盤效應詳解

【內容摘要】 本文深入解析卷積神經網絡中的轉置卷積&#xff08;反卷積&#xff09;技術&#xff0c;重點闡述標準卷積與轉置卷積的計算過程、轉置卷積的上采樣作用&#xff0c;以及其常見問題——棋盤效應的產生原因與解決方法&#xff0c;為圖像分割、超分辨率等任務提供理論…

Redis進階知識

Redis 1.事務2. 主從復制2.1 如何啟動多個Redis服務器2.2 監控主從節點的狀態2.3 斷開主從復制關系2.4 額外注意2.5拓撲結構2.6 復制過程2.6.1 數據同步 3.哨兵選舉原理注意事項 4.集群4.1 數據分片算法4.2 故障檢測 5. 緩存5.1 緩存問題 6. 分布式鎖 1.事務 Redis的事務只能保…

SDC命令詳解:使用get_libs命令進行查詢

相關閱讀 SDC命令詳解https://blog.csdn.net/weixin_45791458/category_12931432.html?spm1001.2014.3001.5482 get_libs命令用于創建一個庫對象集合&#xff0c;關于設計對象和集合的更詳細介紹&#xff0c;可以參考下面的博客。需要注意的是&#xff0c;在有些工具中還存在…

idea2024 不知道安裝了什么插件,界面都是中文的了,不習慣,怎么修改各個選項改回英文

如果你的 IntelliJ IDEA 2024 突然變成中文界面&#xff0c;很可能是安裝了中文語言包插件&#xff08;如 “Chinese (Simplified) Language Pack”&#xff09;。以下是 徹底恢復英文界面 的方法&#xff1a; 方法 1&#xff1a;直接卸載中文插件&#xff08;推薦&#xff09;…

物流項目第二期(用戶端登錄與雙token三驗證)

第一期內容&#xff1a; 物流項目第一期&#xff08;登錄業務&#xff09;-CSDN博客 用戶端登錄 實現分析 登錄功能 Data public class UserLoginRequestVO {ApiModelProperty("登錄臨時憑證")private String code;ApiModelProperty("手機號臨時憑證"…

精準掌控張力動態,重構卷對卷工藝設計

一、MapleSim Web Handling Library仿真和虛擬調試解決方案 在柔性材料加工領域&#xff0c;卷對卷&#xff08;Roll-to-Roll&#xff09;工藝的效率與質量直接決定了產品競爭力。如何在高動態生產場景中實現張力穩定、減少斷裂風險、優化加工速度&#xff0c;是行業長期面臨的…

Voxblox算法

文章目錄 1. 算法簡介2. 由 TSDF 構建 ESDF 的方法2.1. 論文解讀2.2. 偽代碼實現 1. 算法簡介 Voxblox 算法出現于文獻《Voxblox: Incremental 3D Euclidean Signed Distance Fields for On-Board MAV Planning》&#xff0c;PDF 鏈接&#xff1a;https://arxiv.org/pdf/1611.…

計算機圖形學基礎--Games101筆記(一)數學基礎與光柵化

文章目錄 數學基礎向量插值三角形插值雙線性插值 平面定義法線-點表示 第一部分&#xff1a;光柵化坐標變換二維變換3D變換視圖變換&#xff08;MVP&#xff09;投影變換 光柵化采樣抗鋸齒&#xff08;反走樣&#xff09;可見性&#xff08;遮擋&#xff09; 著色與紋理Blinn-P…