AI Rack架構高速互連的挑戰:損耗設計與信號完整性的設計框架

?

在AI驅動的時代,系統設計已經從單一PCB的視角,逐步轉向以整個rack為單位來考量。 對于信號完整性而言,焦點以不再局限于單一PCB上的損耗,而是擴展到芯片與芯片之間的端到端互連損耗(end-to-end interconnect loss)。 這種轉變反映了現代高性能系統設計的新需求與挑戰,也讓互連損耗成為設計者無法忽視的核心課題。

比如最近大家一直在關注的GB200,Compute Tray即透過Cable Cartridge與Switch Tray高速連通,這種End-End loss(Blackwell to NVswitch)大概落在40~45dB,也是目前SerDes做Equalization的上限。

?

晶片到芯片的互連損耗可以細分為以下三個主要部分,每一部分都對整體系統性能產生重要影響:

1. 封裝載板與PCB損耗

載板與PCB損耗這部分是整體訊號互連損耗的重要組成,主要包括以下幾個方面:

金屬損耗

金屬損耗主要分成金屬(通常是銅)本身的電阻效應以及表面粗糙度

銅箔電阻損耗

PCB上絕大多數的金屬是銅,本身就帶有些許電阻,低頻時電流較為平均分布在銅箔內部,損耗較小; 高頻時會有集膚效應,電流會分布在銅箔表面,電流截面積下降,導致高頻電阻升高的情況下高頻時損耗會上升。

?

表面粗糙度

再加上PCB銅箔的表面不會是一個完整的平面,微觀來講可以看到些許的顆粒,銅箔的這些顆粒會增加其與樹脂的表面接觸面積,使其結合強度變高,銅皮會較不易脫落,不過在高頻時的損耗會急劇增加!

?

透過改善銅皮的表面粗糙的行為,可以改善表面粗糙度,通常以Ra或是Rz呈現,對SI工程師而言,我們較常關心的是Rz。 而依不同銅皮的表現又分成不同等級,其中有RTF(Reverse Treated Foil)、VLP(Very Low-Profile)、HVLP(Highly Very Low-Profile)、ANP(Any No-Profile)等等。

目前產業界最高檔的銅箔是HVLP5,幾乎已經是沒有任何的Rz,可以將表面粗糙度降低許多! 不過CCL與PCB廠還在努力克服沒有顆粒的銅箔對于材料拉力(Peeling)的影響,預計今年(Y2025)會有好消息。

?

?

介質損耗

PCB介質有所謂的損耗正切參數(Loss Tangent)或是所謂DF(Dissipation Factor),這兩者指的是同一件事,代表材料在高頻信號通過時,會有多少能量損耗(消耗成熱能等)。

從電磁學的角度,介電材料會有「實部 \( \mathrm{Re}(\varepsilon) \)」與「虛部 \( \mathrm{Im}(\varepsilon) \)」的介電常數:

??實部代表電場儲存能量的能力;

??虛部代表材料吸收并轉換這些能量的損耗能力。

而 DF可以寫成:

tan(δ)≈Im(ε)Re(ε)

這里 \( \delta \) 是介電損耗角。 數值越大,表示「虛部」在整個介電常數所占比重越高,也就是介質損耗越顯著。

來個比喻:我們可以將介質損耗則可以比擬為水流過程中管壁吸收能量、造成水流衰減的效果。 若管壁很粗糙、吸水量大(損耗大),水流一路過去就會衰減得很厲害; 反之,若管壁光滑且不吸水(損耗小),水能保有更多原本的流量與壓力。

?

輻射損耗

將輸出信號電壓扣除信號的反射與系統內的損耗后,剩余的能量可以視為輻射信號。 輻射訊號實際上是一種損耗,因為這些能量會直接散布到環境中。 然而,從系統SI的角度來看,我們通常不特別關注這部分損耗。 原因在于,只要系統的阻抗設計得當,輻射能量通常會被控制在非常小的范圍內,對整體性能的影響可以忽略不計。

\( \text{Radiation Loss} \; =\; 1 \; -\; |S_{11}|^2 \; -\; |S_{21}|^2 \)

鍍穿孔與雷射孔

在PCB設計中,我們習慣將互連(Interconnect)分為2D與3D走線兩類。?2D走線通常指的是傳輸線,這些線路可以使用2D軟件進行高效的模型化,例如 Keysight ADS 的 CILD 模塊或常見的 Polar 軟件,都能很好地處理這類結構。 而3D結構則包括鍍穿孔(Plating Through Hole, PTH)與激光孔(Laser Via),這些結構需要借助3D電磁場模擬軟件來建模,如 Cadence 的 Clarity 或 Ansys 的 HFSS。 相較于2D軟件,3D模擬的分析時間更長,對技術要求也更高,并且需要較長的學習與建模周期,才能確保模型與軟件設定的準確性。

?

隨著產業邁向?224G-PAM4?的時代,Via 已成為設計中無法忽略的關鍵因素。 由于服務器或交換機主板的厚度不斷增加(目前厚度即將超過6mm),Via的長度也隨之變長。 同時,頻率已攀升至53GHz,在這樣的條件下,單一Via的損耗可能高達1.5dB至2dB,所有Via的損耗就占掉了整個通道損耗的15%左右。 更為關鍵的是,在目前PCB材料升級受限的情況下,Via所帶來的損耗顯得格外突出,對整體通道性能的影響不容忽視。 (P.S. 所有Cable損耗均包含與其連接的Connector損耗)

?

2. 連接器損耗

開頭已經提到,現今的AI system是不同機柜間的連結,訊號路徑上會有許多的連接器,例如GB200的Compute Tray對外就有一個Backplane連接器跟Cable cartridge對接,再利用銅纜線接到Switch Tray。 (圖為Samtec的Backplane連接器,或稱BP Connector)

?

這些連接器是3D的架構,設計上很仰賴3D建模的技術,且與PCB via類似,缺乏完整的reference plane,因此連接器的高頻特性不容易控制,從圖可以看到高頻損耗抖動的非常嚴重! 最好的做法就是做的精小,可是會遇到機械結構較為薄弱,焊接或是組裝不良的議題,相當不好搞!

?

3. 銅纜損耗

以現在的AI system來說,這部分又分成兩種

  • 內部飛線(Internal Flyover Cable):例如GB200的Switch Tray內部即是用這種Amphenol的飛線。

?

  • 外部系統間連接(External Cable):例如交換機網絡對連需要用到的DAC cable(Direct-Access Cable)或是類似GB200 Compute Tray與Switch Tray外部的Cable,都是屬于這類型的外部連接媒介。

因為Cable具有穩定的阻抗特性、良好的reference path以及較低的材料DF,所以比PCB CCL材料的損耗還來的小很多。 對比M8等級的材料來看(例如臺光電的EM892K+HVLP4銅箔),在224G-PAM4的應用上,30AWG的Cable的損耗大約是0.35dB/inch而PCB的損耗大約是1.3dB/inch,兩者差別極大!

?

然而沒有這么美好的事情,有好就有壞,用Cable會有幾個Trade-off:

  • 成本較高:Cable本身就已經很貴了,還需要加上連接Cable的連接器的成本,所以使用內部 Cable的機臺成本都較高。
  • 散熱問題:因為需要內部連接器組裝Cable,這些連接器會有一定的高度(通常20mm),這會影響內部的風流,使得ASIC或是GPU的散熱效果變差。 當然如果走水冷(Liquid Cooling),可能是比較沒差?

?

  • 組裝與維修:多了內部連接器,對于系統組裝一定會有所影響,畢竟多了一道工序。 且這種連接器為了做在內部,會比較精小,所以機械強度比較弱,很容易掉件,且維修時整臺機臺都需要開蓋檢查,較為麻煩!
  • 模態轉換損耗:Cable結構的不均勻性(P/N Skew)會引發額外的模態轉換損耗(Mode Conversion Loss),這個損耗隨著數據傳輸速度越來越快而越難被忽視,這不只牽扯到Cable本身制造上的穩定度,還得分析當Cable轉折時是否會影響到差動對兩條線的均勻性, 抑或是Cable與Connector在焊接過程中的不匹配性,相當地復雜!

?

總結

隨著數據傳輸速度不斷提升,對損耗的要求也越來越嚴苛,訊號完整性的重要性日益凸顯! 這不僅僅是對SI工程師的專業要求,從業人士也需要具備基礎的理解能力。 無論是如何解讀供應商提供的損耗規格,還是熟悉零組件的技術迭代,這些都成為不可或缺的能力。 此外,能夠憑借專業知識提出針對性問題,例如詢問Cable的P/N Skew等被設計「包裝」的細節,也是未來工作的核心能力之一。

未來,我們將有機會逐一剖析如何有效控制與設計這些損耗,敬請期待!

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/903857.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/903857.shtml
英文地址,請注明出處:http://en.pswp.cn/news/903857.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

杭電oj(1180、1181)題解

目錄 1180 題目 思路 問題概述 代碼思路分析 1. 數據結構與全局變量 2. BFS 函數 bfs 3. 主函數 main 總結 代碼 1181 題目 思路 1. 全局變量的定義 2. 深度優先搜索函數 dfs 3. 主函數 main 總結 代碼 1180 題目 思路 注:當走的方向和樓梯方向一…

軟件測試概念

這里寫目錄標題 需求開發模型軟件生命周期瀑布模型螺旋模型增量模型、迭代模型敏捷模型Scrum 測試模型V模型W模型(雙V模型) 需求 用戶需求:沒有經過合理的評估,通常就是一句話 軟件需求:是開發人員和測試人員執行工作…

數字基帶信號和頻帶信號的區別解析

數字基帶信號和數字頻帶信號是通信系統中兩種不同的信號形式,它們的核心區別在于是否經過調制以及適用的傳輸場景。以下是兩者的主要區別和分析: 1. 定義與核心區別 數字基帶信號(Digital Baseband Signal) 未經調制的原始數字信號…

Linux52 運行百度網盤 解決故障無法訪問repo nosandbox 未解決:疑似libstdc++版本低導致無法運行baidu網盤

昨日參考 哦 我是root Cannot find a valid baseurl for repo: centos-sclo-rh/x86_64 沒了 計劃去手動下一個 還是不行 放棄 猜測是 centos7 過期了 一些依賴組件也沒地方下載了 通過阿里云鏡像站下載 之前安裝的好像不是這個版本 還是計劃用yum去下載依賴,先處…

2000-2022年上市公司數字經濟專利申請數據

2000-2022年上市公司數字經濟專利申請數據 1、時間:2000-2022年 2、來源:國家知識產權局 3、指標:年份、股票代碼、股票簡稱、行業名稱、行業代碼、省份、城市、區縣、行政區劃代碼、城市代碼、區縣代碼、首次上市年份、上市狀態、數字經濟…

機器學習之五:基于解釋的學習

正如人們有各種各樣的學習方法一樣,機器學習也有多種學習方法。若按學習時所用的方法進行分類,則機器學習可分為機械式學習、指導式學習、示例學習、類比學習、解釋學習等。這是溫斯頓在1977年提出的一種分類方法。 有關機器學習的基本概念,…

Chromium 134 編譯指南 - Android 篇:安裝構建依賴項(七)

1. 引言 歡迎來到《Chromium 134 編譯指南》系列的第七篇文章!在前面的章節中,我們已經成功獲取了Chromium源代碼,并將其配置為支持Android平臺。這些步驟為我們的編譯之旅奠定了堅實的基礎,但在開始實際編譯之前,我們…

java 進階 1.0

靜態方法 static 就是能直接用,不用再new一個對象了 一般java中Math等靜態類就是可以直接使用其方法 main函數里面不能包含太多的邏輯性語句,全部寫成模塊 寫好程序之后如何測試呢? 使用junit,不能在main函數里測試 測試本身就…

中小企業MES系統詳細設計

版本:V1.1 日期:2025年5月2日 一、設備協議兼容性設計 1.1 設備接入框架 #mermaid-svg-PkwqEMRIIlIBPP58 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-PkwqEMRIIlIBPP58 .error-icon{fill…

Spring Security會話管理

用戶認證通過后,為了避免用戶的每次操作都進行認證,可以將用戶的信息保存在會話中。會話就是系統為了保持當前用戶的登錄狀態所提供的機制,常見的有基于Session方式、基于Token方式等。Spring Security提供會話管理功能,只需要配置…

PostgreSQL數據庫操作基本命令

常用操作sql 🔐 用戶管理 -- 創建用戶 CREATE USER username WITH PASSWORD password;-- 修改用戶密碼 ALTER USER username WITH PASSWORD newpassword;-- 刪除用戶 DROP USER username;📦 數據庫操作 -- 創建數據庫 CREATE DATABASE dbname;-- 刪除…

[吾愛出品] 網文提取精靈_4.0

網文提取精靈 鏈接:https://pan.xunlei.com/s/VOPDvKljcT3EWLjpt5LeDZvfA1?pwdw8kq# 易語言寫的,介意的不要下載 相對網文提取工具_2.10.02版,因為是重寫界面,目前版本限制最高5線程,暫時不支持批處理。 雖然不支…

每日算法-250502

每日算法 - 2025.05.02 記錄一下今天刷的幾道 LeetCode 算法題。 3191. 使二進制數組全部等于 1 的最少操作次數 I 題目 思路 貪心 解題過程 遍歷數組 nums。當我們遇到 nums[i] 時: 如果 nums[i] 是 1,我們不需要進行操作,因為目標是全 …

移動端開發中設備、分辨率、瀏覽器兼容性問題

以下是針對移動端開發中設備、分辨率、瀏覽器兼容性問題的 系統化解決方案&#xff0c;按開發流程和技術維度拆解&#xff0c;形成可落地的執行步驟&#xff1a; 一、基礎環境適配&#xff1a;從「起點」杜絕兼容性隱患 1. Viewport 元標簽標準化 <meta name"viewpor…

2025最新AI繪畫系統源碼 - 畫圖大模型/GPT-4全支持/AI換臉/自定義智能體

在AI繪畫技術日新月異的2025年&#xff0c;比象AI繪畫系統源碼以其突破性的技術創新重新定義了數字藝術創作的邊界。作為第四代AI繪畫引擎&#xff0c;我們不僅集成了最先進的GPT-4o多模態畫圖模型&#xff0c;實現了從基礎文生圖到專業級藝術創作的全面進化。本系統源碼經過多…

構造函數詳解

構造函數的作用 構造函數的主要任務是初始化對象&#xff0c;而不是創建對象&#xff08;對象的內存空間在構造函數被調用前已經分配好&#xff09;。 構造函數特性 命名規則&#xff1a;函數名必須與類名完全相同。 返回值&#xff1a;構造函數沒有返回值類型&#xff08;連…

jaffree 封裝ffmpeg 轉換視頻格式,獲取大小,時間,封面

下載 參考網址 【收藏級教程】FFmpeg音視頻處理寶典&#xff1a;從入門到精通的50個實用技巧_ffmpeg教程-CSDN博客 配置環境變量 驗證 重啟idea開發工具 springboot maven集成 <dependency><groupId>com.github.kokorin.jaffree</groupId><artifactId&…

2505C++,wmi客戶端示例

原文 #define _WIN32_DCOM #include <iostream> using namespace std; #include <comdef.h> #include <Wbemidl.h> #pragma comment(lib, "wbemuuid.lib") int main(int argc, char **argv) {HRESULT hres;//初化COM.hres CoInitializeEx(0, CO…

[面試]SoC驗證工程師面試常見問題(三)

SoC驗證工程師面試常見問題(三) 在 SoC 驗證工程師的面試中,面試官可能會要求候選人現場編寫 SystemVerilog、UVM (Universal Verification Methodology) 或 SystemC 代碼,以評估其編程能力、語言掌握程度以及解決實際驗證問題的能力。這種隨機抽題寫代碼的環節通常…

HTML5+JavaScript實現連連看游戲之二

HTML5JavaScript實現連連看游戲之二 以前一篇&#xff0c;見 https://blog.csdn.net/cnds123/article/details/144220548 連連看游戲連接規則&#xff1a; 只能連接相同圖案&#xff08;或圖標、字符&#xff09;的方塊。 連線路徑必須是由直線段組成的&#xff0c;最多可以有…