一、驅動安裝
1、下載驅動
前往NVIDIA驅動下載頁,輸入顯卡型號和操作系統類型,選擇≥目標CUDA版本要求的驅動版本?。
2、安裝驅動?
- ?Windows?:雙擊安裝包按向導操作。
- ?Linux?:建議使用
apt
或官方.run
文件安裝?。
3、驗證
運行nvidia-smi
,檢查驅動版本是否滿足要求?。
二、核心匹配原則
1、顯卡驅動與CUDA版本兼容性?。
1)NVIDIA 顯卡驅動需滿足 CUDA 工具包的最低要求,例如 CUDA 11.8 需驅動版本 ≥515.43.04,CUDA 12.x 需驅動 ≥535.54.03?
顯卡驅動查詢方法?:輸入命令:nvidia-smi,輸出右上角顯示 ?CUDA Version: 12.5?即最高支持的 CUDA 版本?。
2)CUDA版本所需的最低驅動版本。
訪問NVIDIA官方文檔?,進入CUDA Toolkit Release Notes ,查找目標CUDA版本對應的驅動版本要求?。
注意:驅動是向下兼容的,其決定了可安裝的CUDA Toolkit的最高版本。
2、GPU 算力與?CUDA?版本對應關系
?顯卡算力與CUDA版本的關系主要體現在顯卡的Compute Capability(算力)決定了支持的CUDA版本。?
NVIDIA顯卡的算力是通過Compute Capability(CC)來衡量的,不同的顯卡有不同的CC值。例如,NVIDIA的RTX A2000顯卡的算力為8.6,即CC為8.6?1。CUDA版本需要支持顯卡的CC值,否則會出現兼容性問題。
1)查顯卡算力
https://developer.nvidia.com/cuda-gpus#compute
比如:GeForce RTX 3080 算力8.6
2)通過NVIDIA Datacenter Drivers :: NVIDIA Data Center GPU Driver Documentation查詢算力對應CUDA版本。
3、CUDA 與 cuDNN 的對應關系
?CUDA 與 cuDNN?:需嚴格匹配,例如 CUDA 11.8 對應 cuDNN 8.6.0,CUDA 12.2 對應 cuDNN 8.9.0?。
官方版本對應表可參考cuDNN Archive | NVIDIA Developer
4、TensorRT與CUDA、cuDNN?的對應關系
?TensorRT 依賴?:必須與 CUDA、cuDNN 版本一致(如 TensorRT 8.5.3.1 需 CUDA 11.8 + cuDNN 8.6.0)?。
1)打開TensorRT官網說明文檔,查看各版本支持的計算能力。
Documentation Archives :: NVIDIA Deep Learning TensorRT Documentation
從上面列表中,點擊打開一個鏈接,有該TensorRT版本適配CUDA版本和cuDNN版本。比如:NVIDIA?TensorRT?8.6.1?打開后選擇“Support Matrix”鏈接。
點擊打開鏈接后,搜索“Supported Features per Platform”,里面就有CUDA、cuDNN版本。
注意文檔最后注角解釋,有些限制條件。
搜索“Compute Capability per Platform”,查看支持的算力。每個型號顯卡都有對應的算力。
搜索“Software Versions Per Platform”,查看一些軟件版本。
三、推薦版本組合
顯卡系列 | 驅動版本 | CUDA 版本 | cuDNN 版本 | TensorRT 版本 |
---|---|---|---|---|
?RTX 40 系? | ≥535.54.03 | 12.2 | 8.9.0 | 10.0.0.1 |
?RTX 30 系? | ≥515.43.04 | 11.8 | 8.6.0 | 8.5.3.1 |
通用兼容方案 | ≥545.84 | 12.3 | 8.9.7(適配 12.x) | 8.6.1 |
?Titan V/RTX 20系? | ≥470.82 | 11.1 | 8.2.1 | 8.2.4.2 |
四、安裝與驗證
1、?安裝順序
顯卡驅動??→??Visual Studio(可選)??→??CUDA??→??cuDNN??→??TensorRT??。
Windows 示例?:安裝 CUDA 12.2 時需先卸載舊版本驅動,避免沖突?。
?
2、版本驗證
CUDA?:終端輸入?nvcc --version
,輸出顯示 CUDA 編譯工具版本?。
cuDNN?:在 Python 中執行?torch.cuda.cudnn_version()
?或檢查安裝目錄的版本文件?。TensorRT?:運行?trtexec --version
?或檢查安裝目錄的版本文件?。
五、注意事項
1、驅動更新策略?
1)優先通過 NVIDIA 官網下載驅動,避免使用系統自動更新(可能導致版本不匹配)。
2)若 CUDA 版本與驅動不兼容,需降級驅動或升級 CUDA。
2、?性能優化建議
1)、使用 TensorRT 官方測試過的組合(如 CUDA 12.2 + cuDNN 8.9.0 + TensorRT 10.0.0.1),可減少推理時延。
2)、避免混用不同版本的 CUDA 動態庫(如同時安裝 CUDA 11.x 和 12.x)。