Ceph數據副本機制詳解

Ceph數據副本機制詳解

pingmian/2025/8/15 4:05:20/文章來源:https://blog.csdn.net/runbat/article/details/149899405

Ceph 數據副本機制詳解

Ceph 的數據副本機制是其保證數據可靠性和高可用性的核心設計，主要通過多副本（Replication） 和 糾刪碼（Erasure Coding，EC） 兩種方式實現。以下是對 Ceph 數據副本機制的全面解析：

一、副本（Replication）模式

1. 核心概念

副本數（size）：數據對象的副本數量（默認為 3）。
最小可用副本數（min_size）：允許 I/O 操作的最小副本數（默認為 2）。

2. 數據寫入流程

客戶端向主 OSD（Primary OSD）發送寫請求。
主 OSD負責將數據同步到副本 OSD（Secondary OSDs）。
所有副本寫入成功后，主 OSD 向客戶端返回確認。

# 創建一個 3 副本的存儲池
ceph osd pool create mypool 128 128 replicated
ceph osd pool set mypool size 3

3. 副本分布規則

通過 CRUSH Map 的 rule 定義副本分布策略：

rule replicated_rule {id 0type replicatedstep take defaultstep chooseleaf firstn 0 type host  # 確保副本分布在不同主機step emit
}

firstn 0：動態選擇與存儲池 size 相同數量的 OSD。
chooseleaf：自動選擇 host 并取其下的一個 OSD。

4. 故障恢復

OSD 宕機：Monitor 檢測到 OSD down 后，啟動恢復流程。
數據修復：通過其他副本重新同步數據到新 OSD。

二、糾刪碼（Erasure Coding）模式

1. 核心概念

數據塊（k）：原始數據分片數量。
校驗塊（m）：冗余校驗數據數量。
恢復能力：允許最多丟失 m 個塊（空間效率高于副本）。

2. 典型配置

# 創建 EC 池（k=4, m=2，允許 2 個塊丟失）
ceph osd pool create ecpool 128 128 erasure
ceph osd pool set ecpool erasure_code_profile k=4 m=2

3. EC 規則示例

rule ec_rule {id 1type erasurestep take defaultstep choose indep 3 type rack  # 確保數據塊跨機柜分布step emit
}

4. 讀寫特性

寫入：數據被分割為 k 個數據塊，計算 m 個校驗塊。
讀取：只需讀取任意 k 個塊即可恢復數據。

三、副本 vs 糾刪碼對比

特性	副本（Replication）	糾刪碼（Erasure Coding）
空間利用率	低（3 副本需 3x 空間）	高（如 k=4,m=2 僅需 1.5x）
恢復速度	快（直接拷貝副本）	慢（需計算重建）
隨機讀寫性能	優	較差（尤其對小文件）
適用場景	高性能、低延遲業務	冷數據、歸檔存儲

四、高級特性

1. 部分寫（Partial Write）

問題：副本未全部寫入時可能產生數據不一致。
解決：通過 min_size 控制最小可用副本數。
```
ceph osd pool set mypool min_size 2
```

2. 一致性模型

強一致性：主 OSD 確保所有副本寫入成功后才返回確認。
最終一致性：故障時可能短暫不一致，通過 Peering 機制恢復。

3. 快照與克隆

副本池支持快照，EC 池需配合 overwrites 啟用：
```
ceph osd pool set ecpool allow_ec_overwrites true
```

五、監控與調優

1. 關鍵監控指標

# 檢查副本狀態
ceph pg dump | grep ^[0-9] | awk '{print $1,$2,$15}'# 查看恢復進度
ceph -s | grep recovery

2. 性能調優

osd_recovery_max_active：控制恢復并發數。
osd_client_message_cap：限制客戶端消息隊列深度。

六、最佳實踐

生產環境推薦：
- 熱數據：3 副本 + host 級故障域隔離。
- 冷數據：EC（如 k=8,m=4）+ rack 級隔離。
混合存儲：
- 使用 cache tiering 將熱數據自動遷移到副本池。
硬件規劃：
- 每個 host 的 OSD 數量均衡，避免權重傾斜。

通過合理配置副本策略，Ceph 可以在保證數據可靠性的同時，滿足不同業務場景的性能和成本需求。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/92975.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/92975.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/92975.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【八股】Mysql中小廠八股

【八股】Mysql中小廠八股

MySQL 基礎數據庫三大范式（中） 第一范式: 要求數據庫表的每一列都是不可分割的原子數據項如詳細地址可以分割為省市區等. 第二范式: 非主鍵屬性必須完全依賴于主鍵, 不能部分依賴第二范式要確保數據庫表中的每一列都和主鍵相關, 而不能只與主鍵的某一…

閱讀更多...

怎么使用python查看網頁源代碼

怎么使用python查看網頁源代碼

使用python查看網頁源代碼的方法：1、使用“import”命令導入requests包import requests2、使用該包的get()方法，將要查看的網頁鏈接傳遞進去，結果賦給變量xx requests.get(urlhttp://www.hao123.com)3、用“print (x.text)”語句把網頁的內容…

閱讀更多...

C# 多線程：并發編程的原理與實踐

C# 多線程：并發編程的原理與實踐

深入探討 C# 多線程：并發編程的原理與實踐引言在現代應用開發中，性能和響應速度往往決定了用戶體驗的優劣。尤其在計算密集型或者IO密集型任務中，傳統的單線程模型可能無法有效利用多核CPU的優勢。因此，多線程技術成為了解決這些問…

閱讀更多...

react 常用組件庫

react 常用組件庫

1. Ant Design（螞蟻設計）特點：國內最流行的企業級 UI 組件庫之一，基于「中后臺設計體系」，組件豐富（表單、表格、彈窗、導航等）、設計規范統一，支持主題定制和國際化。適用場景&…

閱讀更多...

Python 爬蟲獲取淘寶商品信息、價格及主圖的實戰指南

Python 爬蟲獲取淘寶商品信息、價格及主圖的實戰指南

在電商數據分析、競品調研或商品信息采集等場景中，獲取淘寶商品的詳細信息（如價格、主圖等）是常見的需求。雖然淘寶開放平臺提供了官方的 API 接口，但使用這些接口需要一定的開發和配置工作。本文將通過 Python 爬蟲的方式&#x…

閱讀更多...

Ruby面向對象編程中類與方法的基礎學習例子解析

Ruby面向對象編程中類與方法的基礎學習例子解析

代碼示例： Ruby面向對象編程中類與方法的基礎學習詳細例子 1. 引言在面向對象編程（OOP）中，類是定義對象結構和行為的藍圖。Ruby是一種純面向對象的編程語言，它將一切視為對象，包括基本數據類型。本文將…

閱讀更多...

[ Mybatis 多表關聯查詢 ] resultMap

[ Mybatis 多表關聯查詢 ] resultMap

目錄一. resultMap 1. 使用場景: 2. 查詢映射: (1)單表查詢映射: (2)多表查詢映射: a. 在學生表里查專業 b. 在專業表里查學生二. 其他注意事項 1. 插件下載 2. #{ } 和 ${ }的區別一. resultMap 1. 使用場景: (1)當數據庫列名和java類中的屬性名不同時,可? r…

閱讀更多...

Rust 性能提升“最后一公里”：詳解 Profiling 瓶頸定位與優化｜得物技術

Rust 性能提升“最后一公里”：詳解 Profiling 瓶頸定位與優化｜得物技術

一、Profiling：揭示性能瓶頸的“照妖鏡”在過去的一年里，我們團隊完成了一項壯舉：將近萬核的 Java 服務成功遷移到 Rust，并收獲了令人矚目的性能提升。我們的實踐經驗已在《RUST練習生如何在生產環境構建萬億流量》一文中與大家分…

閱讀更多...

STM32H5 的 PB14 引腳被意外拉低的問題解析 LAT1542

STM32H5 的 PB14 引腳被意外拉低的問題解析 LAT1542

關鍵字：STM32H5， GPIO 1. 問題現象客戶反饋，使用 STM32H523RET6 應用中配置了兩個 IO 口，PC9 為輸出模式，內部下拉；PB14 為輸入模式，內部上拉。在程序中將 PC9 引腳輸出高電平，結…

閱讀更多...

【辦公自動化】如何使用Python讓Word文檔處理自動化？

【辦公自動化】如何使用Python讓Word文檔處理自動化？

在日常辦公中，Word文檔是最常用的文本處理工具之一。通過Python自動化Word文檔操作，可以大幅提高工作效率，減少重復勞動，特別適合批量生成報告、合同、簡歷等標準化文檔。本文將介紹幾種常用的Python操作Word文檔的方法&#xff0…

閱讀更多...

順序表的總結及模擬實現

順序表的總結及模擬實現

目錄一.線性表二.順序表 1.概念 2.結構 3.要實現的接口函數三.模擬實現順序表 1.定義出順序表的基本結構 2.實現檢查擴容功能 3.實現尾插 4.實現尾刪 5.實現頭插和頭刪 6.查找 7.修改 8.遍歷 9.在指定位置插入和刪除四.順序表的優缺點及思考 a.順序表的弊端 …

閱讀更多...

Vue3 vs Vue2：全面對比與面試寶典

Vue3 vs Vue2：全面對比與面試寶典

文章目錄Vue3 vs Vue2：全面對比與面試寶典引言：Vue框架的進化之路一、核心架構對比二、響應式系統的革命Vue2的響應式：像老式監控攝像頭Vue3的響應式：像智能AI監控系統三、API風格的進化Vue2的Options API：像填表格Vue…

閱讀更多...

Java Web開發：Session與Cookie詳細入門指南

Java Web開發：Session與Cookie詳細入門指南

在Web開發中，狀態管理是核心需求之一。本文將深入講解Java中Session和Cookie的使用方法，幫助你掌握用戶狀態管理的核心技術。一、Session與Cookie基礎概念特性SessionCookie存儲位置服務器內存/持久化存儲客戶端瀏覽器安全性較高（敏感數據…

閱讀更多...

HTTPS與CA證書：安全通信全解析

HTTPS與CA證書：安全通信全解析

CA（Certificate Authority）：證書頒發機構，負責簽發和管理數字證書，驗證證書持有者的身份。HTTPS：基于 SSL/TLS 協議的 HTTP，通過證書實現客戶端與服務器的身份驗證和數據加密。HTTPSHTTPSSL/TLS…

閱讀更多...

AI生成代碼時代的商業模式重構：從“軟件即產品”到“價值即服務”

AI生成代碼時代的商業模式重構：從“軟件即產品”到“價值即服務”

2025年，全球AI代碼生成市場規模突破63億元（數據來源：《中國AI代碼生成行業發展報告》），開發者效率提升40%以上，軟件開發成本下降30%。這一技術浪潮正在顛覆傳統軟件行業的商業邏輯——當代碼生成變得像文字編輯一樣簡單時，企業如何構建可持續的商業模式？本文將從硬件…

閱讀更多...

C#特性與反射知識梳理

C#特性與反射知識梳理

C#中的**特性（Attributes）和反射（Reflection）**是兩個非常重要的概念，它們通常用于代碼的元編程，允許你在運行時獲取類型信息并對其進行操作。下面對這兩個概念進行詳細梳理：一、C#中的特性&…

閱讀更多...

SQL 語法詳解

SQL 語法詳解

SQL 語法詳解引言 SQL（Structured Query Language）是一種用于數據庫管理的標準語言，它允許用戶進行數據的查詢、更新、插入和刪除等操作。SQL語法是數據庫管理和編程的基礎，本篇文章將詳細介紹SQL的基本語法和常用操作&#xff0…

閱讀更多...

為什么 sim(3) 中的尺度 s 與旋轉 R 相乘，而不是平移 t？

為什么 sim(3) 中的尺度 s 與旋轉 R 相乘，而不是平移 t？

文章目錄為什么 sim(3) 中的尺度 s 與旋轉 R 相乘，而不是平移 t？1?? sim(3) vs SE(3)：結構對比與核心差異2?? 為什么尺度 s 不乘在 t 上？🚫 數學破壞：🧭 幾何解釋：3?? t 是“相…

閱讀更多...

如何為你的 Docker 容器設置代理網絡

如何為你的 Docker 容器設置代理網絡

一文搞定！如何為你的 Docker 容器設置代理網絡（及一個最常見的“坑”）你是否遇到過這樣的窘境：在你的服務器上，代理工具（比如 Clash, V2Ray）運行得好好的，瀏覽器也能科學上網，但一旦把應用放進 Docker 容器，它就瞬間“失聯”，無法訪問外部世界？別擔心，這是每個…

閱讀更多...

LeetCode Day3 -- 哈希表

LeetCode Day3 -- 哈希表

目錄 1. 啥是哈希表？ 2. 啥時候用哈希表？ 2.1 存在性檢查 → 集合Set 2.2 鍵值映射 → 字典Dict 2.3 頻率統計 → Dict or Counter 3. LeetCode 3.1 集合 （1）2215 找出兩數組的不同 （2）1207 獨一無…

閱讀更多...

最新文章