NVMe簡介1

它分為兩部分,這里是第一部分。
NVM Express(NVMe)是一種高性能、可擴展的接口協議,用于通過PCI express(PCIe)總線,實現主機軟件與NVM設備之間的通信。目前,由于NVMe SSD相比于SATA SSD具有更高的吞吐量、更快的訪問速度和更低的功耗,已經被廣泛應用于各種計算領域和存儲系統。

NVMe隊列

NVMe協議采用成對的提交隊列(Submission Queue,SQ)和完成隊列(Completion Queue,CQ)機制。SQ用于存放提交命令,而CQ則用于存放完成信息。隊列狀態信息通過門鈴寄存器(Door Bell,DB)來檢測。這兩個隊列采用了環形隊列結構,隊列可以映射到任何PCIe可訪問的內存中,通常放在主機側內存。對于提交隊列,主機端是生產者,NVMe SSD是消費者。完成隊列的情況剛好相反。因此SQ Tail指針和CQ Head指針由主機更新,而其他兩個指針由NVMe控制器更新。NVMe的隊列結構如圖1所示。
在這里插入圖片描述
圖1 隊列示意圖
NVMe隊列的深度是固定的,通過Tail和Head來分別指向隊列的首尾位置,隊列實際可用的大小是隊列大小減1,當Head條目指針等于Tail條目指針時,隊列為空。當Head條目指針比Tail條目指針多一個時,隊列為滿。
NVMe協議中根據命令類型將隊列分為了Admin隊列和I/O隊列,Admin隊列用來緩存管理Admin命令,如獲取SSD屬性、創建I/O隊列等。而I/O隊列用來緩存管理I/O命令,如讀、寫、識別等。在一個系統中只能有一對Admin SQ/CQ,但可以存在多對IO SQ/CQ。Admin SQ/CQ僅用來進行Admin命令的交互,I/O SQ/CQ僅用來進行I/O命令的交互。對于多核系統來說,每個核內雖然只有1個I/O CQ,但是可以存在多個I/O SQ,如圖2所示。
在這里插入圖片描述
圖2 NVME 多隊列示意圖
由于Host端可能存在多個流水線,多隊列的設計可以讓系統的性能最大化。同時,可以通過對不同的隊列設置不同的優先級,來保證高優先級隊列的命令更快完成。NVMe協議中規定Admin SQ/CQ的隊列深度最大可以支持4096(4K),I/O SQ/CQ的隊列深度最大可以支持65536(64K)。在一個實際設計中,SQ的個數和深度的設置可以根據項目需求和硬件資源進行配置。隊列深度的設置主要和系統中隊列消費者和生產者之間的速率有關。

NVMe分層結構

NVMe協議棧結構分為應用層和傳輸層兩個層次。在應用層中實現NVMe命令生成、隊列管理和流程控制,而傳輸層則借助PCIe協議進行實現。PCIe協議分為三層,即事務層、數據鏈路層和物理層。事務層負責將數據傳輸請求和響應打包成事務進行傳輸,數據鏈路層則負責數據傳輸的可靠性和流控制,通過鏈路層控制器(Link Layer Controller, LLC)實現。物理層則負責物理傳輸,包括電信號的發射和接收、時序控制和線路管理等。其分層結構圖如圖3所示。首先,在應用層生成NVMe命令傳輸至事務層。其次,在事務層會對上層傳輸的數據添加首部和校驗,封裝成TLP(Transaction Level Packet)傳輸至數據鏈路層。然后,在數據鏈路層會對TLP添加序列號和校驗,封裝成DLLP。最后,在物理層對數據包進行編碼和并轉串處理后,通過SerDes(Serializer/Deserializer)將數據發送至PCIe鏈路中。
在這里插入圖片描述
圖3 NVMe 分層結構示意圖
由于NVMe協議是基于PCIe協議實現的,下面通過在PCIe拓撲結構中介紹NVMe協議中的SQ、CQ和DB的位置,以及數據在Host和NVMe SSD之間的傳輸流程。NVMe SSD在PCIe拓撲結構中的位置如圖4所示。
在這里插入圖片描述
圖4 PCIe拓撲結構圖
PCIe的拓撲結構由三部分組成,根聯合體(Root Complex, RC)、PCIe交換器(PCIe Switch)和端點(Endpoint, EP)。根聯合體位于拓撲結構的根部,最靠近CPU。端點設備位于PCIe的端末。交換機位于根聯合體和端點設備之間。PCIe使用串行鏈路連接,一個鏈路的兩端只能有兩個設備。因此PCIe需要通過PCIe Switch擴展PCIe鏈路后,才能連接多個EP設備。在NVMe存儲結構中,NVMe SSD也作為PCIe的一個EP端掛載在RC上。
NVMe協議中的SQ和CQ位于Host內存中,主機在初始化時根據隊列的個數和深度在主機內存開辟出相應的內存空間,來存放SQ、CQ命令。DB寄存器位于NVMe SSD中,且被映射到BAR(Base Address Register)空間中,Host可以通過訪問BAR空間來更新DB寄存器的值。
當Host需要向NVMe SSD發送命令時,首先將命令存放在主機內存開辟的SQ區域中,其次通過訪問BAR空間的DB寄存器來告訴NVMe SSD到主機端內存區域取走待執行的命令。待命令執行完成后,NVMe SSD向主機內存的CQ區域寫入完成命令。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/82992.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/82992.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/82992.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

微服務商城(1)開篇、服務劃分

參考:https://mp.weixin.qq.com/s?__bizMzg2ODU1MTI0OA&mid2247485597&idx1&sn7e85894b7847cc50df51d66092792453&scene21#wechat_redirect 為什么選擇go-zero go-zero 為我們提供了許多高并發場景下的實用工具,比如為了降低接口耗時…

《隱私計算:數據安全與隱私保護的新希望》

一、引言 在數字化時代,數據已成為企業和組織的核心資產。然而,數據的收集、存儲和使用過程中面臨著諸多隱私和安全挑戰。隱私計算作為一種新興技術,旨在解決數據隱私保護和數據共享之間的矛盾。本文將深入探討隱私計算的基本概念、技術原理、…

MySQL 學習(九)bin log 與 redo log 的區別有哪些,為什么快速恢復使用 redo log 而不用 bin log?

目錄 一、bin log 與 redo log 的區別1)實現方式不同:2)日志內容不同:3)記錄方式不同:4)使用場合不同: 二、為什么快速恢復使用 redo log 而不用 bin log? 面試題&#x…

用Array.from實現創建一個1-100的數組

一、代碼實現 let arr Array.from({length: 100}, (_, i) > i 1); 二、代碼分析 1、Array.from(arrayLike, mapFn) (1)arrayLike 類數組對象(如 { length: 100 })本身沒有索引屬性(如 0: undefined, 1: undefi…

javaScript簡單版

簡介 JavaScript(簡稱:JS)是一門跨平臺、面向對象的腳本語言,是用來控制網頁行為,實現頁面的交互效果。 JavaScript和Java是完全不同的語言,不論是概念還是設計。但是基礎語法類似。 組成: ECMAScript:規定了JS基礎語法核心知…

Python刷題練習

文章目錄 1.尋找相同字串2.密鑰格式化3.五鍵鍵盤的輸出4.單詞重量5.輸出指定字母在字符串的中的索引6.污染水域7.九宮格按鍵輸入8.任務最優調度9.高效的任務規劃 1.尋找相同字串 題目描述: 給你兩個字符串t和p,要求從t中找到一個和p相同的連續子串,并輸…

MATLAB實現振幅調制(AM調制信號)

AM調制是通信專業非常重要的一個知識點。今天我們使用MATLAB編程實現AM調制。 我們實現輸入一個載波信號的頻率與調制信號的頻率后,再輸入調幅度,得到已調信號的波形與包絡信號的波形,再使用FFT算法分析出已調信號的頻譜圖。 源代碼&#x…

JJJ:linux ida

文章目錄 1.總結2.各類函數2.1 分配一個倉庫2.2 銷毀倉庫2.3 從倉庫里面分配一個整數id2.4 將上面分配的整數id從倉庫里面刪除2.5 在指定范圍內分配一個id 1.總結 ida使用起來很簡單,就是先分配一個倉庫一樣的實例,再從這個倉庫里面分配一個獨一無二的整…

FastByteArrayOutputStream和ByteArrayInputStream有什么區別

FastByteArrayOutputStream 和 ByteArrayInputStream 是兩種完全不同的 Java I/O 類,它們的主要區別體現在 設計目的 和 使用場景 上。以下是詳細對比: 1. 核心區別總結 特性FastByteArrayOutputStream (Spring框架)ByteArrayInputStream (JDK原生)所屬…

docker-compose——安裝redis

文章目錄 一、編寫docker-compose.yaml文件二、編寫redis.conf文件三、啟動docker-compose 一、編寫docker-compose.yaml文件 version: 3.3 services:redis:image: redis:latestcontainer_name: redisrestart: alwaysports:- 6379:6379volumes:- ./redis/data:/data- ./redis/…

東芝推出新的SCiB模塊,散熱性能加倍,適用于電動公交車、電動船舶和固定應用

東京—東芝公司推出了一種新的SCiB模塊,這是一種專為電動汽車、電動船舶和固定應用而設計的鋰離子電池。新產品采用鋁制底板,散熱量約為當前模塊的兩倍。它將于2025年4月中旬在日本和全球上市。 鋰離子電池的使用越來越多,而且越來越多樣化&a…

【進程控制二】進程替換和bash解釋器

【進程控制二】進程替換 1.exec系列接口2.execl系列2.1execl接口2.2execlp接口2.3execle 3.execv系列3.1execv3.2總結 4.實現一個bash解釋器4.1內建命令 通過fork創建的子進程,會繼承父進程的代碼和數據,因此本質上還是在執行父進程的代碼 進程替換可以將…

Java基礎語法之數組

數組 一、認識數組 1.什么是數組 數組就是一個容器,用來存一批同種類型的數據。 舉例 20, 10, 80, 60, 90 int[] arr {20, 10, 80, 60, 90};張三, 李四, 王五 String[] names {"張三", "李四", "王五"};2.為什么要使用數組 假設…

Java死鎖排查:線上救火實戰指南

想象一下,你正在值班,突然監控告警紅成一片,用戶反饋雪花般飄來:“系統卡死了!用不了了!” —— 這很可能就是Java應用遭遇了“死鎖”這個大魔王。這時候,你就是救火隊長,首要任務不…

006-nlohmann/json 結構轉換-C++開源庫108杰

絕大多數情況下,程序和外部交換的數據,都是結構化的數據。 1. 手工實現——必須掌握的基本功 在的業務類型的同一名字空間下,實現 from_json 和 to_json 兩個自由函數(必要時,也可定義為類型的友元函數)&a…

白盒測試——基本路徑測試法

一、實驗名稱 白盒測試——基本路徑測試法 二、實驗目的 白盒測試是結構測試,是依據被測程序的內部邏輯結構設計測試用例,驅動被測程序運行完成的測試,通過本實驗希望: 1、掌握基本路徑測試法的基本概念,用具體的例子…

【嵌入模型與向量數據庫】

目錄 一、什么是向量? 二、為什么需要向量數據庫? 三、向量數據庫的特點 四、常見的向量數據庫產品 FAISS 支持的索引類型 vs 相似度 五、常見向量相似度方法對比 六、應該用哪種 七、向量數據庫的核心邏輯 🔍 示例任務:…

matlab中和三角函數相關的內容

和三角相關的函數 以下內容為Ai輸出 函數描述示例sin(x)正弦函數,返回x的正弦值,x單位為弧度sin(pi/2)cos(x)余弦函數,返回x的余弦值,x單位為弧度cos(pi)tan(x)正切函數,返回x的正切值,x單位為弧度tan(pi…

scratch基礎-外觀模塊

一、本次任務 二、內容詳解 1、模塊介紹 1、說[你好] (2)秒:臨時對話框,短暫對話 2、說[你好]:持續顯示對話框,長文本顯示 3、思考[嗯…] (2)秒:臨時顯示思考氣泡,用于角色思考 4、思考[嗯…] &#xff1a…

TAOCMS漏洞代碼學習及分析

路由規則 分為前臺和后臺&#xff0c; 前臺在api.php中 <?php session_start(); include(config.php); include(SYS_ROOT.INC.common.php); $ctrl$_REQUEST[ctrl]; $action$_REQUEST[action]; $mucfirst($action); if(!in_array($m,array(Api,Comment)))d…