英偉達GB300新寵:新型LPDDR5X SOCAMM內存

隨著人工智能(AI)、機器學習(ML)和高性能計算(HPC)應用的快速發展,對于高效能、大容量且低延遲內存的需求日益增長。NVIDIA在其GB系列GPU中引入了不同的內存模塊設計,以滿足這些嚴格的要求。

此前,當從H100升級到H200時,由于后者提供了更高的內存帶寬(4.8TB/s對比H100的3.35TB/s),所有可比較的批處理大小上的交互性普遍提高了43%。得益于KVCache對總批處理大小的限制減少,H200能夠以更高的批處理速度運行,從而每秒生成三倍數量的token。這使得整體運營成本降低了約三倍,遠超出了單純硬件規格所能帶來的預期收益。

圖片

隨著NVIDIA推出GB300 GPU,其供應鏈和提供的組件發生了重大變化。此前,針對GB200,NVIDIA提供了完整的Bianca板(包括Blackwell GPU、Grace CPU、512GB的LPDDR5X內存、VRM內容等集成在一個PCB上),以及交換托盤和銅背板。然而,對于GB300,NVIDIA采取了不同的策略,僅提供核心組件,并允許更多原始設備制造商(OEM)和原始設計制造商(ODM)參與計算模塊的制造。

圖片

NVIDIA將只提供B300 GPU作為“SXM Puck”模塊,而不是整個Bianca板。這種轉變使得更多的OEM和ODM能夠參與到計算模塊的生產中來。Grace CPU將以BGA封裝形式單獨提供,不再集成在Bianca板上。高帶寬內存(HBM)控制器(HMC)將由美國初創公司Axiado提供,取代了GB200上的Aspeed產品。

圖片

在GB200時代,NVIDIA選擇了直接焊接在Bianca板上的512GB LPDDR5X作為主存方案。GB300,然而,在GB300的設計中,為了提高靈活性并降低成本,NVIDIA決定二級內存采用可插拔式的LPCAMM模塊來替代傳統的焊接內存,這一變化不僅簡化了制造過程,還允許用戶根據具體需求靈活配置內存容量和類型。

面對數據中心空間有限以及對更高密度內存解決方案的需求,NVIDIA提出了全新的SOCAMM(Space-Optimized CAMM)概念。SOCAMM旨在通過緊湊的設計實現最大化的存儲容量,同時保持優異的性能表現。它特別適用于那些需要在有限的空間內部署大量計算資源的應用場景,如超大規模數據中心、邊緣計算節點等。

近日,美光(Micron)與 SK 海力士(SK hynix)在存儲技術領域邁出了重要一步,推出了新型的 LPDDR5X SOCAMM 內存,最高容量可達 128GB,并首次在英偉達(Nvidia)的 GB300 系統中亮相。這一創新成果為人工智能(AI)和低功耗服務器領域帶來了全新的解決方案,有望重塑相關行業的內存應用格局。

SOCAMM,其尺寸僅為14x90mm,約為傳統RDIMM的三分之一 。然而,“小身材”卻蘊含著“大能量”,它最多可承載四個16芯片的LPDDR5X內存堆棧。美光的初始SOCAMM模塊就提供了高達128GB的容量,這一容量規格在當前的內存市場中具備很強的競爭力,能夠滿足AI和低功耗服務器對大容量內存的需求。

image.png

美光的SOCAMM模塊基于其1β(1-beta,第五代10nm級)DRAM工藝技術生產的LPDDR5X內存設備打造。雖然美光并未透露其初始SOCAMM內存棒具體支持的數據傳輸速率,但表明該內存的額定速度高達9.6 GT/s。

圖片

而SK海力士在GTC 2025上展示的SOCAMM額定速度也達到了7.5 GT/s。與相同容量的RDIMM相比,LPDDR5X SOCAMM的帶寬提升了2.5倍 ,這意味著數據能夠以更快的速度在內存與處理器之間傳輸,大大提高了系統的數據處理能力,對于AI計算中大量數據的快速讀寫操作極為有利。

在服務器運行過程中,內存的功耗是一個不可忽視的問題。以配備每插槽TB級DDR5內存的服務器為例,其中DRAM的功耗甚至超過了CPU的功耗 。英偉達圍繞LPDDR5X內存設計了Grace CPU,正是看中了LPDDR5X相較于DDR5更低的功耗特性。美光宣稱,其128GB的SOCAMM內存功耗僅為同等容量DDR5 RDIMM的三分之一 。低功耗不僅有助于降低服務器的運營成本,還能減少數據中心的散熱壓力,對于追求綠色節能的數據中心而言,具有重要的意義。

圖片

此次推出的LPDDR5X SOCAMM內存將首先應用于基于英偉達GB300 Grace Blackwell Ultra Superchip系統的服務器。

在AI領域,無論是訓練還是推理應用,都需要處理海量的數據,這對內存的性能和容量提出了嚴苛的要求。例如,在AI訓練過程中,深度學習模型需要頻繁讀取和存儲大量的參數和數據,高帶寬、大容量的內存能夠顯著加速數據的傳輸和處理,縮短訓練時間。而在推理應用中,如智能語音助手、圖像識別系統等,快速的內存響應速度可以使系統更及時地給出準確的結果。

LPDDR5X SOCAMM內存的出現,為英偉達GB300系統在AI計算方面提供了強大的內存支持,有助于進一步挖掘AI的潛力,推動相關應用的發展。

隨著云計算和數據中心的發展,低功耗服務器的需求日益增長。低功耗服務器不僅可以降低運營成本,還能減少對環境的影響。LPDDR5X SOCAMM內存憑借其低功耗、高容量和高性能的特點,成為低功耗服務器的理想選擇。它能夠在保證服務器性能的前提下,有效降低能耗,提升服務器的能效比。這對于構建綠色、高效的數據中心具有重要意義,有助于數據中心運營商在控制成本的同時,滿足不斷增長的數據處理需求。

盡管LPDDR5X SOCAMM內存展現出了諸多優勢,但目前仍存在一些不確定性。例如,SOCAMM是否會成為JEDEC(固態技術協會)支持的行業標準尚未可知。如果能成為行業標準,將有利于其更廣泛地推廣和應用,促進整個行業的規范化發展;反之,若僅作為美光、三星、SK海力士和英偉達為特定服務器開發的專有解決方案,其應用范圍可能會受到一定限制 。但無論如何,LPDDR5X SOCAMM內存的出現都為存儲技術的發展注入了新的活力,值得業界持續關注。

如果您看完有所受益,歡迎點擊文章底部左下角“關注”并點擊“分享”、“在看”,非常感謝!

精彩推薦:

  • 深度解讀PCIe相關內存操作原理

  • 基于CXL內存的熱數據檢測技術解讀

  • 學術前沿|專為CXL SSD設計的文件系統

  • 2025伊始,PCIe 7.0的腳步更近了

  • 存儲隨筆2024年度技術分享總結

  • 淺析下一代NAND接口新特性SCA

  • 2025年CXL強勢啟航:開啟內存擴展新時代

  • PCIe SSD在溫變環境的穩健性技術剖析

  • DWPD指標:為何不再適用于大容量SSD?

  • 突破內存墻:DRAM的過去、現在與未來

  • E1.S接口如何解決SSD過熱問題?

  • ZNS SSD是不是持久緩存的理想選擇?

  • 存儲正式邁入超大容量SSD時代!

  • FMS 2024: 帶來哪些存儲技術亮點?

  • IEEE報告解讀:存儲技術發展趨勢分析

  • PCIe P2P DMA全景解讀

  • 深度解讀NVMe計算存儲協議

  • 淺析不同NAND架構的差異與影響

  • 淺析PCI配置空間

  • 淺析PCIe系統性能

  • 存儲隨筆《NVMe專題》大合集及PDF版正式發布!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/74983.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/74983.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/74983.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

靜態網頁應用開發環境搭建實戰教程

1. 前言 靜態網頁開發是前端工程師的基礎技能之一,無論是個人博客、企業官網還是簡單的Web應用,都離不開HTML、CSS和JavaScript。搭建一個高效的開發環境,能夠極大提升開發效率,減少重復工作,并優化調試體驗。 本教程…

Python每日一題(9)

Python每日一題 2025.3.29 一、題目二、分析三、源代碼四、deepseek答案五、源代碼與ai分析 一、題目 question["""企業發放的獎金根據利潤提成。利潤(I)低于或等于10萬元時,獎金可提10%,利潤高于10萬元,低于20萬元時,低于10萬元的部分按10%提成,高于10萬元的部…

游戲引擎學習第187天

看起來觀眾解決了上次的bug 昨天遇到了一個相對困難的bug,可以說它相當棘手。剛開始的時候,沒有立刻想到什么合適的解決辦法,所以今天得從頭開始,逐步驗證之前的假設,收集足夠的信息,逐一排查可能的原因&a…

【入門初級篇】布局類組件的使用(1)

【入門初級篇】布局類組件的使用(1) 視頻要點 (1)章節大綱介紹 (2)布局類組件類型介紹:行布局、列布局、標題 (3)實操演示:列表統計查詢布局模型 點擊訪問my…

對內核fork進程中寫時復制的理解記錄

前言 文章寫于學習Redis時對aof后臺重寫中寫時復制的疑問 一、感到不理解的歧義 在部分技術文檔中(以小林的文章為例),對寫時復制后的內存權限存在如歧義: ! 二、正確技術表述 根據Linux內核實現(5.15版本&#x…

Ditto-Talkinghead:阿里巴巴數字人技術新突破 [特殊字符]?

Ditto-Talkinghead:阿里巴巴數字人技術新突破 🗣? 阿里巴巴推出了一項新的數字人技術,名為 Ditto-Talkinghead。這項技術主要用于生成由音頻驅動的說話頭,也就是我們常說的“數字人”。不過,現有的基于擴散模型的同類…

.NET開發基礎知識1-10

1. 依賴注入(Dependency Injection) 技術知識:依賴注入是一種設計模式,它允許將對象的依賴關系從對象本身中分離出來,通過構造函數、屬性或方法參數等方式注入到對象中。這樣可以提高代碼的可測試性、可維護性和可擴展…

每日一題 MySQL基礎知識----(三)

數據庫常用基礎知識:代碼講解和實驗 1.創建數據庫student 02,創建一個名為student02的數據庫 CREATE DATABASE student02; 2.在student02中創建一張 students表,并且具有學生的編號id,姓名name,年齡age,生…

MySQL多表查詢實驗

1.數據準備 -- 以下語句用于創建 students 表,該表存儲學生的基本信息 -- 定義表名為 students CREATE TABLE students (-- 定義學生的唯一標識符,類型為整數,作為主鍵,且支持自動遞增student_id INT PRIMARY KEY AUTO_INCREMENT…

windows第二十章 單文檔應用程序

文章目錄 單文檔定義新建一個單文檔應用程序單文檔應用程序組成:APP應用程序類框架類(窗口類)視圖類(窗口類,屬于框架的子窗口)文檔類(對數據進行保存讀取操作) 直接用向導創建單文檔…

C++ 初階總復習 (16~30)

C 初階總復習 (16~30) 目的16. 2009. volatile關鍵字的作用17. 2010.什么是多態 簡單介紹下C的多態18. 2011. 什么是虛函數 介紹下C中虛函數的原理19. 2012 構造函數可以是虛函數嘛20. 2013.析構函數一定要是虛函數嘛?21. 2015. 什么是C中的虛…

第一天 Linux驅動程序簡介

目錄 一、驅動的作用 二、裸機驅動 VS linux驅動 1、裸機驅動 2、linux驅動 三、linux驅動位于哪里? 四、應用編程 VS 內核編程 1、共同點 2、不同點 五、linux驅動分類 1、字符設備 2、塊設備 3、網絡設備 六、Linux驅動學習難點與誤區 1、學習難點 …

PaddleX產線集成功能的使用整理

一、環境搭建 1.1 安裝paddle-gpu 需要根據安裝機器的cuda的版本,選擇合適的版本進行安裝 #安裝paddle-gpu 官網鏈接 https://www.paddlepaddle.org.cn/install/quick?docurl/documentation/docs/zh/install/pip/linux-pip.html python -m pip install paddle…

docker-compese 啟動mysql8.0.36與phpmyadmin,并使用web連接數據庫

1、找一個文件夾,比如 E:\zqy\file\mysql,cd到這個目錄下創建文件docker-compose.yml 2、將下面的代碼塊復制到docker-compose.yml文件中 version: 3.3 services:mysql:image: mysql:8.0.36container_name: mysqlrestart: alwaysports:- 3306:3306netw…

解決 Gradle 構建錯誤:Could not get unknown property ‘withoutJclOverSlf4J’

解決 Gradle 構建錯誤:Could not get unknown property ‘withoutJclOverSlf4J’ 在構建 Spring 源碼或其他基于 Gradle 的項目時,可能會遇到如下錯誤: Could not get unknown property withoutJclOverSlf4J for object of type org.gradle…

mcp 接freecad畫齒輪

from mcp.server.fastmcp import FastMCP import freecad.gears.commands import os from freecad import app from freecad import part mcp FastMCP("Demo")mcp.tool() def create_gear(num_teeth20,height10,double_helix True):"""創建一個漸開線…

【大前端系列19】JavaScript核心:Promise異步編程與async/await實踐

JavaScript核心:Promise異步編程與async/await實踐 系列: 「全棧進化:大前端開發完全指南」系列第19篇 核心: 深入理解Promise機制與async/await語法,掌握現代異步編程技術 📌 引言 在JavaScript的世界中,異步編程是無…

如何排查java程序的宕機和oom?如何解決宕機和oom?

排查oom 用jmap生成我們的堆空間的快照Heap Dump(堆轉儲文件),來分析我們的內存占用 用可視化工具,例如java中的jhat分析Heap Dump文件 ,它分析完會通過一個瀏覽器打開一個可視化頁面展示分析結果 根據oom的類型來調…

什么是 OLAP 數據庫?企業如何選擇適合自己的分析工具

引言:為什么企業需要 OLAP 數據庫? 你是否曾經經歷過這樣的場景: 市場部門急需一份用戶行為分析報告,數據團隊告訴你:“數據太大了,報表要跑 4 個小時”;業務負責人在會議中提出一個臨時性分析…

測試:認識Bug

目錄 一、軟件測試的生命周期 二、bug 一、軟件測試的生命周期 軟件測試貫穿于軟件的生命周期。 需求分析: ???度:軟件需求是否合理 技術?度:技術上是否可?,是否還有優化空間 測試?度:是否存在業務邏輯錯誤、…