Ceph(1):分布式存儲技術簡介

1?分布式存儲技術簡介

1.1 分布式存儲系統的特性

(1)可擴展

分布式存儲系統可以擴展到幾百臺甚至幾千臺的集群規模,而且隨著集群規模的增長,系統整體性能表現為線性增長。分布式存儲的水平擴展有以下幾個特性:

  • 節點擴展后,舊數據會自動遷移到新節點,實現負載均衡,避免單點過熱的情況出現;
  • 水平擴展只需要將新節點和原有集群連接到同一網絡,整個過程不會對業務造成影響;
  • 當節點被添加到集群,集群系統的整體容量和性能也隨之線性擴展,此后新節點的資源就會被管理平臺接管,被用于分配或者回收。

(2)低成本

分布式存儲系統的自動容錯、自動負載均衡機制使其可以構建在普通的PC機之上。另外,線性擴展能力也使得增加、減少機器非常方便,可以實現自動運維。

(3)高性能

無論是針對整個集群還是單臺服務器,都要求分布式存儲系統具備高性能。

(4)易用

分布式存儲系統需要能夠提供易用的對外接口,另外,也要求具備完善的監控、運維工具,并能夠與其他系統集成。

(5)易管理

可通過一個簡單的WEB界面就可以對整個系統進行配置管理,運維簡便,極低的管理成本。

分布式存儲系統的挑戰主要在于數據、狀態信息的持久化,要求在自動遷移、自動容錯、并發讀寫的過程中保證數據的一致性。分布式存儲涉及的技術主要來自兩個領域:分布式系統以及數據庫。

1.2 存儲分類

(1)本地存儲

本地存儲本地的文件系統,不能在網絡上用。

  • ext3
  • ext4
  • xfs
  • ntfs? ? ??

(2)網絡存儲??

網絡存儲---網絡文件系統,共享的都是文件系統。

  • nfs:網絡文件系統
  • hdfs:分布式網絡文件系統
  • glusterfs:分布式網絡文件系統??????

(3)共享的是裸設備 ?

  • 塊存儲 cinder ?ceph(塊存儲 ?對象存儲 ?網絡文件系統-分布式)
  • SAN(存儲區域網)? ? ? ??

(4)分布式

  • 集群

2 分布式存儲分類介紹

2.1 Hadoop HDFS(大數據分布式文件系統)

HDFS(Hadoop Distributed File System)是一個分布式文件系統,是hadoop生態系統的一個重要組成部分,是hadoop中的的存儲組件.HDFS是一個高度容錯性的系統,HDFS能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。

HDFS的優點:

(1)高容錯性

????????????數據自動保存多個副本

????????????副本丟失后,自動恢復

(2)良好的數據訪問機制

????????????一次寫入、多次讀取,保證數據一致性

(3)適合大數據文件的存儲

????????????TB、 甚至PB級數據

????????????擴展能力很強

HDFS的缺點:

(1)低延遲數據訪問

???????????難以應付毫秒級以下的應用

(2) 海量小文件存取

????????????占用NameNode大量內存

(3)一個文件只能有一個寫入者

???????????僅支持append(追加)

2.2 OpenStack的對象存儲Swift

OpenStack Object Storage(Swift)是OpenStack開源云計算項目的子項目之一。Swift的目的是使用普通硬件來構建冗余的、可擴展的分布式對象存儲集群,存儲容量可達PB級。Swift的是用Python開發

其主要特點為:

  • 各個存儲的節點完全對等,是對稱的系統架構。
  • 開發者通過一個RESTful HTTP API與對象存儲系統相互作用。
  • 無單點故障:Swift的元數據存儲是完全均勻隨機分布的,并且與對象文件存儲一樣,元數據也會存儲多份。整個Swift集群中,也沒有一個角色是單點的。
  • 在不影響性能的情況下,集群通過增加外部節點進行擴展。
  • 無限的可擴展性:這里的擴展性分兩方面,一是數據存儲容量無限可擴展;二是Swift性能(如QPS、吞吐量等)可線性提升,擴容只需簡單地新增機器,系統會自動完成數據遷移等工作,使各存儲節點重新達到平衡狀態。
  • 極高的數據持久性

Swift可以用以下用途:

  • 圖片、文檔存儲
  • 長期保存的日志文件
  • 存儲媒體庫(照片、音樂、視頻等)
  • 視頻監控文件的存檔

總結:Swift適合用來存儲大量的、長期的、需要備份的對象。

2.3 公有云對象存儲

公有云大都只有對象存儲。例如,谷歌云存儲是一個快速,具有可擴展性和高可用性的對象存儲。

Amazon類似產品就是S3: http://aws.amazon.com/s3;

微軟類似產品Azure Bolb:http://azure.microsoft.com/en-us/documentation/articles/storage-dotnet-how-to-use-blobs/;

阿里類似的有OSS:https://www.aliyun.com/product/oss/;

阿里云對象存儲OSS

阿里云對象存儲服務(Object Storage Service,簡稱 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存儲服務

存儲類型(Storage Class)

OSS 提供標準、低頻訪問、歸檔三種存儲類型,其中標準存儲類型提供高可靠、高可用、高性能的對象存儲服務,能夠支持頻繁的數據訪問;低頻訪問存儲類型適合長期保存不經常訪問的數據(平均每月訪問頻率 1 到 2 次),存儲單價低于標準類型;歸檔存儲類型適合需要長期保存(建議半年以上)的歸檔數據,在三種存儲類型中單價最低。

應用場景

(1)圖片和音視頻等應用的海量存儲

OSS可用于圖片、音視頻、日志等海量文件的存儲。

(2)云端數據處理

上傳文件到OSS后,可以配合媒體處理服務和圖片處理服務進行云端的數據處理。

(3)網頁或者移動應用的靜態和動態資源分離

利用海量互聯網帶寬,OSS可以實現海量數據的互聯網并發下載。

2.4 GlusterFS分布式文件系統

GlusterFS(GNU ClusterFile System)是一種全對稱的開源分布式文件系統,所謂全對稱是指GlusterFS采用彈性哈希算法,沒有中心節點,所有節點全部平等。GlusterFS配置方便,穩定性好,可輕松達到PB級容量,數千個節點,2011年被紅帽收購。

PB級容量 ?高可用性 基于文件系統級別共享 分布式 去中心化

glusgerfs存儲卷的類型

基本類型:條帶,復制,哈希。

復合卷

復合卷就是分布式復制,分布式條帶,分布式條帶復制卷,像分布式復制,分布式條帶這兩個是比較常用的,像分布式條帶復制卷三種揉一塊兒的用的都比較少,

各種卷的整理

分布卷:存儲數據時,將文件隨機存儲到各臺glusterfs機器上。

  • 優點:存儲數據時,讀取速度快
  • 缺點:一個birck壞掉,文件就會丟失

復制卷:存儲數據時,所有文件分別存儲到每臺glusterfs機器上。

  • 優點:對文件進行的多次備份,一個brick壞掉,文件不會丟失,其他機器的brick上面有備份
  • 缺點:占用資源

條帶卷:存數據時,一個文件分開存到每臺glusterfs機器上

  • 優點:對大文件,讀寫速度快
  • 缺點:一個brick壞掉,文件就會壞掉

最常見的GPFS和HDFS有什么區別?

GPFS和Hadoop的HDFS系統對比,它設計用于在商用硬件上存儲類似或更大的數據

HDFS還將文件分割成塊,并將它們存儲在不同的文件系統節點內。

HDFS對磁盤可靠性的依賴并不高,它可以在不同的節點內存儲塊的副本。保存單一副本塊的一個節點出現故障可以再復制該組其它有效塊內的副本。相較而言,雖然GPFS支持故障節點恢復,但它是一個更嚴重的事件,它可能包括數據(暫時性)丟失的高風險。

GPFS支持完整的Posix文件系統語義。 HDFS和GFS(谷歌文件系統)并不支持完整的Posix語義。

GPFS跨文件系統分布它的目錄索引和其它元數據。相反, Hadoop將它們保留在主要和次要Namenode中,大型服務器必須在RAM內存儲所有的索引信息。

GPFS將文件分割成小塊。Hadoop HDFS喜歡64MB甚至更多的塊,因為這降低了Namenode的存儲需求。小塊或很多小的文件會快速填充文件系統的索引,因此限制了文件系統的大小。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73423.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73423.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73423.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux驅動開發實戰(五):Qt應用程序點RGB燈(保姆級快速入門!)

Linux驅動開發實戰(五):Qt應用程序點RGB燈(保姆級快速入門!) 文章目錄 Linux驅動開發實戰(五):Qt應用程序點RGB燈(保姆級快速入門!)前…

Docker安裝Kafka(內含zookeeper)

因為kafka是基于zookeeper做的,所以必須要有zookeeper 一、Zookeeper 1.拉取鏡像 docker pull zookeeper:3.7.02.運行 docker run --restartalways \--log-driver json-file \--log-opt max-size100m \--log-opt max-file2 \--name zookeeper -p 2181:2181 \-v…

芯谷D8563TS實時時鐘/日歷芯片詳解可替代PCF8563

概述 芯谷D8563TS是一款低功耗CMOS實時時鐘/日歷芯片,廣泛應用于移動電話、便攜式儀器、傳真機和電池供電產品等領域。該芯片通過兩線雙向IC總線進行數據傳輸,最大總線速度為400 kbits/s。D8563TS內置了自動遞增的字地址寄存器,支持多種功能…

【一次成功】Win10本地化單機部署k8s v1.31.2版本及可視化看板

【一次成功】Win10本地化單機部署k8s v1.31.2版本及可視化看板 零、安裝清單一、安裝Docker Desktop軟件1.1 安裝前<啟用或關閉Windows功能> 中的描紅的三項1.2 查看軟件版本1.3 配置Docker鏡像 二、更新裝Docker Desktop三、安裝 k8s3.1 點擊啟動安裝3.2 查看狀態3.3 查…

MoonSharp 文檔五

目錄 13.Coroutines&#xff08;協程&#xff09; Lua中的協程 從CLR代碼中的協程 從CLR代碼中的協程作為CLR迭代器 注意事項 搶占式協程 14.Hardwire descriptors&#xff08;硬編碼描述符&#xff09; 為什么需要“硬編碼” 什么是“硬編碼” 如何進行硬編碼 硬編…

【初級篇】如何使用DeepSeek和Dify構建高效的企業級智能客服系統

在當今數字化時代,企業面臨著日益增長的客戶服務需求。使用Dify創建智能客服不僅能夠提升客戶體驗,還能顯著提高企業的運營效率。關于DIfy的安裝部署,大家可以參考之前的文章: 【入門級篇】Dify安裝+DeepSeek模型配置保姆級教程_mindie dify deepseek-CSDN博客 AI智能客服…

【網絡編程】HTTP網絡編程

13.1 HTTP 簡介 HTTP(Hyper Text Transfer Protocol,超文本傳輸協議)是用于從萬維網(WWW:World Wide Web) 服務器(簡稱Web 服務器)傳輸超文本到本地瀏覽器的傳送協議&#xff0c;基于TCP/IP 通信協 議來傳遞數據 (HTML 文件、圖片文件、查詢結果等)。 13.2 HTTP 的工作原理 …

用Scrum敏捷的視角看《哪吒2》的創作

去年我們公司邀請Scrum中文網的老師培訓了敏捷開發課程&#xff0c;讓我對敏捷有了更深入的理解。前陣子我參加了scrum中文網的一個直播&#xff0c;老師分享了敏捷在個人領域或生活其他領域的應用&#xff0c;很有意思。因為我學習敏捷&#xff0c;除了應用到本身軟件研發的工…

Docker+Flask 實戰:打造高并發微服務架構

DockerFlask 實戰&#xff1a;打造高并發微服務架構 今天我們要深入探討一個非常熱門且實用的主題&#xff1a;基于 Docker 部署 Python Flask 應用。Docker 作為當下最流行的容器化技術&#xff0c;已經廣泛應用于各種開發和部署場景&#xff0c;尤其是在微服務架構中。而 Fl…

Linux find 命令完全指南

find 是 Linux 系統最強大的文件搜索工具&#xff0c;支持 嵌套遍歷、條件篩選、執行動作。以下通過場景分類解析核心用法&#xff0c;涵蓋高效搜索、文件管理及高級技巧&#xff1a; 一、基礎搜索模式 1. 按文件名搜索&#xff08;精確/模糊匹配&#xff09; <BASH> f…

【量化策略】趨勢跟蹤策略

【量化策略】趨勢跟蹤策略 &#x1f680;量化軟件開通 &#x1f680;量化實戰教程 技術背景與應用場景 在金融市場中&#xff0c;趨勢跟蹤策略是一種基于市場趨勢進行交易的量化投資方法。該策略的核心思想是“順勢而為”&#xff0c;即認為市場價格會沿著一定的方向持續移…

AI自動化、資本短視、三輸與破局

當前AI應用中的一個深層矛盾&#xff1a;工程師使用AI將很專業的任務變成小白可以操作的工作&#xff0c;然后資本方給小白很少的錢把工程師裁掉了&#xff0c;然而小白不懂底層&#xff0c;出問題幾乎無法修復。由此&#xff0c;技術普及與專業能力之間的斷層引發了"三輸…

Python數據分析之數據可視化

Python 數據分析重點知識點 本系列不同其他的知識點講解&#xff0c;力求通過例子讓新同學學習用法&#xff0c;幫助老同學快速回憶知識點 可視化系列&#xff1a; Python基礎數據分析工具數據處理與分析數據可視化機器學習基礎 四、數據可視化 圖表類型與選擇 根據數據特…

簡述計算機網絡中的七層模型和四層模型

在計算機網絡中&#xff0c;網絡協議棧的設計通常采用分層結構來處理不同的通信任務。常見的分層結構有OSI七層模型和TCP/IP四層模型。雖然它們的層次數量不同&#xff0c;但本質上都在解決如何有效地進行計算機間通信。本文將分別介紹這兩種結構的功能和各層的協議。 一、OSI七…

2025高頻面試算法總結篇【持續更新中】

文章目錄 遞歸&回溯131. 分割回文串面試題 08.12. 八皇后 動態規劃72編輯距離5. 最長回文子串279. 完全平方數300. 最長遞增子序列 遞歸&回溯 131. 分割回文串 回溯思路&#xff1a; 臨界條件&#xff1a; if (start s.length) > 保存 循環遍歷這個字串 for (int…

【大模型學習】第二十二章 什么是對抗生成網絡

目錄 一、背景介紹 二、生活化例子說明什么是對抗生成網絡 三、技術細節詳解 &#xff08;一&#xff09;基本概念 &#xff08;二&#xff09;訓練機制 &#xff08;三&#xff09;損失函數 一、背景介紹 對抗生成網絡&#xff08;Generative Adversarial Networks, GANs…

攝像頭模塊ISP處理流程

攝像頭模塊的ISP&#xff08;圖像信號處理器&#xff09;處理流程是對圖像傳感器輸出的原始信號進行系統性優化的過程&#xff0c;主要分為以下關鍵步驟及對應功能模塊&#xff1a; 一、原始信號輸入與預處理 ?傳感器信號捕獲? CMOS/CCD傳感器將光信號轉換為模擬電信號&…

linux系統安裝和激活conda

安裝 wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbash ./Miniconda3-latest-Linux-x86_64.sh回車到最后按照輸入yes&#xff0c;之后按提示操作。 激活 conda activate如果沒有反應或者返回&#xff1a; bash: conda: command not found則…

(全)2024下半年真題 系統架構設計師 綜合知識 答案解析02

系統架構設計師第二版教程VIP課程https://edu.csdn.net/course/detail/40283 面向對象技術 在UML用例圖中&#xff0c;參與者之間存在 關系。 A. 聚合 B. 包含 C. 繼承 D. 擴展 答案&#xff1a;C 解析&#xff1a;用例圖描述了一組用例、參與者以及它們之間的關系…

【學習筆記】《逆向工程核心原理》03.abex‘crackme-2、函數的調用約定、視頻講座-Tut.ReverseMe1

文章目錄 abexcrackme-21. Visual Basic文件的特征1.1. VB專用引擎1.2. 本地代碼與偽代碼1.3. 事件處理程序1.4. 未文檔化的結構體 2. 開始調試2.1. 間接調用2.2. RT_MainStruct結構體2.3. ThunRTMain()函數 3. 分析crackme3.1. 檢索字符串3.2. 查找字符串地址3.3. 生成Serial的…