訓推一體 | 暴雨X8848 G6服務器 x Intel?Gaudi? 2E AI加速卡

近日，暴雨信息攜手英特爾，針對Gaudi? 2E AI加速器HL-288 PCIe卡（簡稱Intel?Gaudi? 2E PCIe卡，下同）完成專項調優與適配工作，并重磅推出Intel Eagle Stream平臺4U8卡解決方案。該方案通過軟硬件協同優化，顯著提升深度學習訓練與推理性能，尤其在大模型訓練、高內存容量需求及實時推理等高強度場景中表現突出，可充分滿足行業對高效AI計算的核心訴求。

而Intel?Gaudi? 2E PCIe卡基于Habana Gaudi2架構設計，面向數據中心和企業級AI工作負載優化，旨在提供高性能、高效率的生成式AI計算。

該卡配備96 GB大容量內存，其先進的HBM控制器針對隨機訪問和線性訪問場景進行了深度優化，在各種訪問模式下可提供高內存帶寬，有效避免因顯存不足造成AI訓練或推理任務的延遲問題，保障計算流程的流暢性。在擴展性方面，該卡表現尤為突出：單卡原生集成24個50GbE RoCE v2 RDMA端口，通過配套的四卡全連接板，可對四張PCIe卡進行全連接，提升多卡互聯性能。全連接板與每張PCIe卡內18個50Gbps口相連，實現四張卡兩兩互聯300Gbps的通信帶寬。

同時，該卡基于Intel的可編程TPC和GEMM引擎，融合了諸多技術創新，支持各種面向AI級的高級數據類型，如FP8/BF16/PF16/TF32和FP32。通過外接網卡，實現橫向擴展，以滿足多節點集群的需要。

據最新實測數據顯示，X8848 G6服務器：搭配8張Intel?Gaudi??2E PCIe卡，運行DeepSeek-R1-671B模型，在輸入/輸出token長度均為1k，多用戶并發數為32的條件下，單并發Token生成效率達11 Tokens/s，可滿足企業級私有化部署。搭配2張Intel?Gaudi? 2E PCIe卡，運行DeepSeek-R1-Distill-Qwen-32B模型，在輸入/輸出token長度均為1k、多用戶并發數為32的條件下，單并發Token生成效率達20 Tokens/s，可滿足AI推理（知識庫）一體化應用。

在AI算力需求爆發的當下，暴雨信息X8848 G6服務器與Intel?Gaudi? 2E AI加速卡的強強聯合，正是精準呼應 “訓推一體” 的高效算力需求—— 從模型訓練的深度突破到推理部署的實時響應，其全能表現將切實助力各行各業加速 AI 技術落地與價值釋放。若您想了解更多適配場景、性能數據或定制化方案，歡迎聯系交流，我們將為您提供更詳盡的技術解讀與全流程支持，讓高效AI算力真正轉化為業務增長的強勁引擎。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/92935.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/92935.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/92935.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！