AMD在其新的YouTube視頻系列《高級洞察》第一集中,由AMD首席技術官Mark Papermaster擔任主持人,討論了AMD在數據中心領域的突破性進展及其持續增長。然而,AMD在服務器業務的發展并非一帆風順,兩位高管公開討論了早期Epyc Naples和Rome原型芯片在初次啟動時遇到的一些初期難題。
在節目中,Mark Papermaster與AMD數據中心解決方案業務部執行副總裁兼總經理Forrest Norrod展開對話。Norrod作為首位嘉賓,談論了AMD如何通過破壞性技術改變市場格局,以AMD近九年來在服務器業務中的發展為例,生動展現了破壞性技術的力量。
在AMD最初收到Epyc Naples芯片樣品時,曾遭遇無法啟動的問題。訪談中并未明確指出Epyc芯片哪個部分導致了實驗室中的這個重大障礙,但通過工程師們的智慧和堅持不懈的努力,最終解決了這個問題。
當首批Epyc Rome芯片抵達AMD測試實驗室時,再次出現了無法啟動的情況,這次是因為早期芯片樣本在內存訪問方面的故障。工程師們緊張且高強度地工作,最終讓芯片進入可測試的啟動狀態。
面對如此嚴重的問題,Norrod表示他會遵循一個72小時原則,避免倉促作出反應。盡管人們仍在忙于解決問題,但通常幾天后,情況會有所改善,可以更清晰地制定戰略。幸運的話,在72小時之后,AMD的工程師有時就已經完全解決了這些問題。
視頻討論還回顧了基于Zen架構的服務器市場變革歷程。大約九年前,AMD渴望擁有競爭力的核心CPU以及一些差異化優勢。通過Epyc Naples,AMD首次為數據中心提供了基于Zen核心的CPU,帶來了內存通道、I/O接口和核心數量的顯著提升。Papermaster強調,Epyc Naples滿足了HPC的期望,這一點至關重要。
隨后,Epyc Rome作為AMD首款基于chiplet設計的服務器處理器,其成功的關鍵在于為每個chiplet選擇合適的半導體技術。關于chiplet技術,Norrod高度贊揚了Sam Naffziger為“chiplet之父”。Chiplet技術使得AMD能夠持續擴展規模,更快地采用新技術,并解決了非統一內存訪問(NUMA)問題,令AMD的批評者感到困惑。Memory和I/O需與核心數量同步擴展以滿足計算需求,Papermaster和Norrod對此觀點一致,Infinity Fabric在此發揮了重要作用。
Epyc Milan被視為另一個轉折點。這一代產品中,AMD宣稱已經解決了單線程性能比較差的問題,并且Norrod自信地表示AMD在這個時代實現了全面領先。如今,AMD可以向客戶展示一個可靠且值得信賴的長期發展規劃。
AMD高管認為,Epyc處理器和服務器持續成功背后的其他顛覆性因素還包括:
1. 安全性 - 服務器的保密計算。Norrod表示,他最初了解到這一差異化優勢是在討論AMD游戲主機芯片的過程中。
2. 總擁有成本(TCO) - Norrod堅持認為80%的客戶現在應該轉向單插槽服務器。雖然在考慮工作負載時這是正確的,但要改變人們的觀念還需要教育和時間。不過,由于Epyc CPU被認為有顯著的TCO優勢,AMD高管認為這只是時間問題。
最后,提及AMD在未來人工智能(AI)領域的機遇,Papermaster表示他從未像現在這樣對前景感到興奮。Norrod補充說,AI處理面臨巨大的數學挑戰,需要依賴最強大的GPU、內存、I/O、網絡、CPU和存儲技術進行矩陣和矢量計算。他認為,沒有任何一家公司比AMD更適合接受這個挑戰,因為AMD擁有深厚且廣泛的才能和經驗積累。