在英偉達官網,我們可以清晰地看到其從1999年Celsius到2024年Blackwell的20+代架構演進。這一歷程猶如一部波瀾壯闊的科技史詩,見證了英偉達在GPU領域的卓越創新與持續引領。
NVIDIA GPU架構變遷路線:
年份 | NV GPU架構變遷 |
2025 | Blackwell 2.0 |
2024 | Blackwell |
2023-2024 | Hopper |
2022-2024 | Ada Lovelace |
2020-2024 | Ampere |
2018-2022 | Turing |
2017-2020 | Volta |
2016-2021 | Pascal |
2014-2019 | Maxwell 2.0 |
2014-2017 | Maxwell |
2013-2015 | Kepler 2.0 |
2012-2018 | Kepler |
2010-2016 | Fermi 2.0 |
2010-2013 | VLIW Vec4 |
2010-2016 | Fermi |
2007-2013 | Tesla 2.0 |
2006-2010 | Tesla |
2003-2013 | Curie |
2003-2005 | Rankine |
2001-2003 | Kelvin |
1999-2005 | Celsius |
1999年:Celsius(NV1x)——開啟GPU時代
Celsius架構的代表產品GeForce 256橫空出世,它首次提出了“GPU(圖形處理器)”的概念,堪稱具有劃時代意義的創舉。以往,圖形處理任務主要由CPU承擔,效率較低。而GeForce 256具備硬件T&L(變換和光照)功能,能夠將圖形處理從CPU中解放出來,實現了圖形加速,大大提升了運算效率,其運算能力達到當時CPU的5倍之多,就此開啟了GPU作為獨立計算核心的嶄新時代。
Database參考:https://www.techpowerup.com/gpu-specs/nvidia-nv10.g165
2000年:Kelvin(NV2x)——多顯示器支持的先驅
Kelvin 架構(NV20 核心)是英偉達在 2000 年代初推出的關鍵圖形架構。它最初應用于搭載NV2A GPU的XBOX游戲主機,之后GeForce 2系列GPU也基于此架構發布。GeForce 2成為首個支持多顯示器的GPU產品。其代表產品GeForce3于 2001 年 2 月 27 日發布,基于 150nm 工藝制造,核心面積 128mm2,集成 5700 萬個晶體管。作為首款支持DirectX 8.1的消費級 GPU,GeForce3 標志著圖形計算從固定管線向可編程渲染的重大躍遷,徹底改變了游戲開發的技術范式。
Database參考:https://www.techpowerup.com/gpu-specs/geforce3.c738
2001年:Rankine(NV3x)——圖形功能增強的探索
Rankine架構作為Kelvin微架構的后續版本,主要應用于NVIDIA GPU的GeForce 5系列產品。在這一系列中,Rankine微架構引入了對頂點和片段程序的支持,豐富了圖形處理的功能。同時,將顯存(VRAM)大小擴展至256MB,為GPU性能提升和圖形處理能力增強提供了有力支撐,進一步提升了圖形渲染的質量與效率。
Rankine 架構(NV34 核心)是英偉達在 2003 年推出的入門級圖形架構,其代表產品GeForce FX 5100于 2003 年 3 月 6 日發布,基于 150nm 工藝制造,核心面積 124mm2,集成 4500 萬個晶體管。作為 GeForce FX 系列的低端型號,該架構主打 DirectX 9.0a 支持,試圖在入門級市場延續可編程渲染的技術紅利,但受限于硬件規格,成為英偉達架構迭代中的過渡性產品。
Database參考:https://www.techpowerup.com/gpu-specs/geforce-fx-5100.c1834
2004年:Curie(NV4x)——顯存與視頻解碼的革新
Curie 架構(NV40 核心)是英偉達在 2004 年推出的旗艦級圖形架構,其代表產品GeForce 6800 XT于 2005 年 9 月 30 日發布,基于 130nm 工藝制造,核心面積 287mm2,集成 2.22 億個晶體管。作為首款支持DirectX 9.0c的消費級 GPU,該架構標志著英偉達在獨立 Shader 架構時代的性能巔峰,同時為后續統一渲染架構的轉型埋下伏筆。
Database參考:https://www.techpowerup.com/gpu-specs/geforce-6800-xt.c176
2006年:Tesla(G80、G92)——通用計算的開拓者
2006 年推出的Tesla 架構(G80 核心)是英偉達發展史上的分水嶺 —— 它首次引入統一渲染架構(Unified Shader Architecture),將頂點著色器、像素著色器和幾何著色器合并為通用的CUDA 核心(Compute Unified Device Architecture),徹底解決了獨立管線時代的資源分配難題。這一架構不僅重塑了圖形計算范式,更開啟了 GPU 通用計算(GPGPU)的新紀元。
Database參考:https://www.techpowerup.com/gpu-specs/geforce-8400-se.c3779
2009年:Fermi(GF100)——制程與功能的雙重升級
Fermi架構是第一款采用40nm制程的GPU。它帶來了諸多重大改進,引入L1/L2快速緩存,加速了數據的讀取與存儲;具備錯誤修復功能,提高了系統的穩定性;采用GPUDirect技術,允許GPU在無需訪問CPU的情況下相互通信,無論是在同一臺計算機內部還是通過網絡進行通信,大大提升了數據傳輸效率。Fermi GTX 480擁有480個流處理器,帶寬達到177.4GB/s,計算能力相比Tesla架構大幅提升。
Database參考:https://www.techpowerup.com/gpu-specs/geforce-gtx-480.c268
2009 年推出的Fermi 架構(GF100 核心)是英偉達首次專為通用計算(GPGPU)設計的架構,其核心目標是在保持圖形性能的同時,構建可擴展的計算平臺。關鍵創新包括:
-
統一計算架構:
引入流式多處理器(SM,Streaming Multiprocessor),每個 SM 包含 32 個 CUDA 核心、16 個紋理單元和 4 個 ROP 單元,支持動態分配圖形計算與通用計算任務。 -
計算可靠性:
首次支持ECC 內存糾錯,滿足醫療、金融等工業場景對數據準確性的需求;引入動態并行(Dynamic Parallelism),允許 GPU 直接生成子任務,減少 CPU 介入。 -
雙精度計算:
GF100 核心雙精度浮點性能達 1 TFLOPS,是同期 ATI Radeon HD 5870 的 2 倍,成為超級計算機的核心組件(如美國橡樹嶺國家實驗室的 “美洲豹” 超算)。
2012年:Kepler(GK104、GK110)——高性能計算的新起點
Kepler架構采用28nm制程,是首個支持超級計算和雙精度計算的GPU架構。其擁有全新的流式多處理器架構SMX,帶來了多方面的提升,完整支持TXAA(一種抗鋸齒方法),CUDA核心數顯著增加,如GK110B具有2880個流處理器,帶寬高達288GB/s,計算能力比Fermi架構提高3 - 4倍。Kepler架構的出現,使GPU在高性能計算領域受到廣泛關注,為科學研究、大數據分析等領域提供了強大的計算支持。
2012 年推出的Kepler 架構(GK104/GK110 核心)是英偉達在統一計算架構下的集大成之作,其設計目標是 “讓 GPU 成為并行計算的超級計算機”。核心創新包括:
- 第三代 CUDA 核心:
每個 SMX 單元包含 192 個 CUDA 核心(較 Fermi 架構的 SM 增加 50%),支持動態指令調度和分支預測,計算效率提升 40%。 - 異構計算支持:
引入Hyper-Q技術,支持同時處理 32 個 CPU 線程請求,多任務并行效率提升 2 倍;集成Dynamic Parallelism 2.0,允許 GPU 自主生成子任務樹,減少 CPU 介入延遲。 - 圖形渲染強化:
首次支持自適應細分曲面(Adaptive Tessellation),配合FXAA 抗鋸齒,在《孤島危機 3》中實現曲面細節提升 50% 的同時,性能損耗控制在 15% 以內。
GeForce GTX 660 和 780 TI是 Kepler 架構的縮影 —— 前者以主流性能定義性價比標桿,后者以旗艦規格探索硬件極限。它們不僅鞏固了英偉達在圖形市場的統治力,更將 GPU 從 “游戲硬件” 升級為 “通用計算平臺”。Kepler 架構的成功,本質是英偉達對 “摩爾定律 +