系列文章目錄
第五章 Minio 對象存儲 OSS概述
Minio 對象存儲 OSS概述
- 系列文章目錄
- 對象存儲 OSS
- 基本概念
- 存儲空間(Bucket)
- 對象(Object)
- ObjectKey
- Region(地域)
- Endpoint(訪問域名)
- AccessKey(訪問密鑰)
- 強一致性
- 數據冗余機制
- OSS與文件系統的對比
- 應用場景
- 圖片和音視頻等應用的海量存儲
- 網頁或者移動應用的靜態和動態資源分離
- 云端數據處理
對象存儲 OSS
文檔來源于阿里云對象存儲 OSS,Minio也是對象存儲 OSS,很多概念都是相通的,所以了解下。實際企業應用使用阿里OSS是一個很不錯的選擇。
對象存儲服務(Object Storage Service,OSS)是一種海量、安全、低成本、高可靠的云存儲服務,適合存放任意類型的文件。容量和處理能力彈性擴展,多種存儲類型供選擇,全面優化存儲成本。
阿里云對象存儲OSS(Object Storage Service)是阿里云提供的海量、安全、低成本、高持久的云存儲服務。其數據設計持久性不低于99.9999999999%(12個9),服務可用性(或業務連續性)不低于99.995%。
基本概念
存儲空間(Bucket)
存儲空間是用戶用于存儲對象(Object)的容器,所有的對象都必須隸屬于某個存儲空間。存儲空間具有各種配置屬性,包括地域、訪問權限、存儲類型等。用戶可以根據實際需求,創建不同類型的存儲空間來存儲不同的數據。
同一個存儲空間的內部是扁平的,沒有文件系統的目錄等概念,所有的對象都直接隸屬于其對應的存儲空間。
每個用戶可以擁有多個存儲空間。
存儲空間的名稱在OSS范圍內必須是全局唯一的,一旦創建之后無法修改名稱。
存儲空間內部的對象數目沒有限制。
存儲空間的命名規范如下:
只能包括小寫字母、數字和短劃線(-)。
必須以小寫字母或者數字開頭和結尾。
長度必須在3~63字符之間。
對象(Object)
對象是OSS存儲數據的基本單元,也被稱為OSS的文件。和傳統的文件系統不同,對象沒有文件目錄層級結構的關系。對象由元信息(Object Meta),用戶數據(Data)和文件名(Key)組成,并且由存儲空間內部唯一的Key來標識。對象元信息是一組鍵值對,表示了對象的一些屬性,比如最后修改時間、大小等信息,同時用戶也可以在元信息中存儲一些自定義的信息。
對象的生命周期是從上傳成功到被刪除為止。在整個生命周期內,除通過追加方式上傳的Object可以通過繼續追加上傳寫入數據外,其他方式上傳的Object內容無法編輯,您可以通過重復上傳同名的對象來覆蓋之前的對象。
對象的命名規范如下:
使用UTF-8編碼。
長度必須在1~1023字符之間。
不能以正斜線(/)或者反斜線(\)開頭。
對象名稱需要區分大小寫。如無特殊說明,本文檔中的對象、文件稱謂等同于Object。
ObjectKey
在各語言SDK中,ObjectKey、Key以及ObjectName是同一概念,均表示對Object執行相關操作時需要填寫的Object名稱。例如向某一存儲空間上傳Object時,ObjectKey表示上傳的Object所在存儲空間的完整名稱,即包含文件后綴在內的完整路徑,如填寫為abc/efg/123.jpg。
Region(地域)
Region表示OSS的數據中心所在物理位置。用戶可以根據費用、請求來源等選擇合適的地域創建Bucket。一般來說,距離用戶更近的Region訪問速度更快。詳情請參見OSS已經開通的Region。
Region是在創建Bucket的時候指定的,一旦指定之后就不允許更改。該Bucket下所有的Object都存儲在對應的數據中心,目前不支持Object級別的Region設置。
Endpoint(訪問域名)
Endpoint表示OSS對外服務的訪問域名。OSS以HTTP RESTful API的形式對外提供服務,當訪問不同的Region的時候,需要不同的域名。通過內網和外網訪問同一個Region所需要的Endpoint也是不同的。例如杭州Region的外網Endpoint是oss-cn-hangzhou.aliyuncs.com,內網Endpoint是oss-cn-hangzhou-internal.aliyuncs.com。具體的內容請參見各個Region對應的Endpoint。
AccessKey(訪問密鑰)
AccessKey簡稱AK,指的是訪問身份驗證中用到的AccessKeyId和AccessKeySecret。OSS通過使用AccessKeyId和AccessKeySecret對稱加密的方法來驗證某個請求的發送者身份。AccessKeyId用于標識用戶;AccessKeySecret是用戶用于加密簽名字符串和OSS用來驗證簽名字符串的密鑰,必須保密。對于OSS來說,AccessKey的來源有:
Bucket的擁有者申請的AccessKey。
被Bucket的擁有者通過RAM授權給第三方請求者的AccessKey。
被Bucket的擁有者通過STS授權給第三方請求者的AccessKey。
強一致性
Object操作在OSS上具有原子性,操作要么成功要么失敗,不會存在有中間狀態的Object。OSS保證用戶一旦上傳完成之后讀到的Object是完整的,OSS不會返回給用戶一個部分上傳成功的Object。
Object操作在OSS同樣具有強一致性,用戶一旦收到了一個上傳(PUT)成功的響應,該上傳的Object就已經立即可讀,并且Object的冗余數據已經寫成功。不存在一種上傳的中間狀態,即read-after-write卻無法讀取到數據。對于刪除操作也是一樣的,用戶刪除指定的Object成功之后,該Object立即變為不存在。
數據冗余機制
OSS使用基于糾刪碼、多副本的數據冗余存儲機制,將每個對象的不同冗余存儲在同一個區域內多個設施的多個設備上,確保硬件失效時的數據持久性和可用性。
OSSObject操作具有強一致性,用戶一旦收到了上傳或復制成功的響應,則該上傳的Object就已經立即可讀,且數據已經冗余寫入到多個設備中。
OSS會通過計算網絡流量包的校驗和,驗證數據包在客戶端和服務端之間傳輸中是否出錯,保證數據完整傳輸。
OSS的冗余存儲機制,可支持兩個存儲設施并發損壞時,仍維持數據不丟失。
當數據存入OSS后,OSS會檢測和修復丟失的冗余,確保數據持久性和可用性。
OSS會周期性地通過校驗等方式驗證數據的完整性,及時發現因硬件失效等原因造成的數據損壞。當檢測到數據有部分損壞或丟失時,OSS會利用冗余的數據,進行重建并修復損壞數據。
OSS與文件系統的對比
因此,將OSS映射為文件系統是非常低效的,也是不建議的做法。如果一定要掛載成文件系統的話,建議盡量只做寫新文件、刪除文件、讀取文件這幾種操作。使用OSS應該充分發揮其優點,即海量數據處理能力,優先用來存儲海量的非結構化數據,比如圖片、視頻、文檔等。
以下是OSS與文件系統的概念對比:
OSS術語表
應用場景
圖片和音視頻等應用的海量存儲
OSS可用于圖片、音視頻、日志等海量文件的存儲。各種終端設備、Web網站程序、移動應用可以直接向OSS寫入或讀取數據。OSS支持流式寫入和文件寫入兩種方式。
網頁或者移動應用的靜態和動態資源分離
利用海量互聯網帶寬,OSS可以實現海量數據的互聯網并發下載。OSS提供原生的傳輸加速功能,支持上傳加速、下載加速,提升跨國、跨洋數據上傳、下載的體驗。同時,OSS也可以結合CDN產品,提供靜態內容存儲、分發到邊緣節點的解決方案,利用CDN邊緣節點緩存的數據,提升同一個文件被同一地區客戶大量重復并發下載的體驗。
云端數據處理
上傳文件到OSS后,可以配合媒體處理服務和圖片處理服務進行云端的數據處理。