我的Linux系統背景:
-
系統和驅動都已安裝。
-
系統是centos 8。查看自己操作系統的版本信息:
cat /etc/issue
或者是?cat /etc/lsb-release
-
用
nvidia-smi
可以看到顯卡驅動和可支持的最高cuda版本,我的是12.2。驅動版本是535.129.03
首先,檢查是否安裝了CUDA:ls -l /usr/local | grep cuda
http:// https://developer.nvidia.com/cuda-toolkit-archive?如下截圖, 選擇自己系統對應的?CUDA
?版本,
若第1步提示Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing.,選擇continue,繼續操作
Do you accept the above EULA? (accept/decline/quit):
│ accept #輸入accept
│─────────────────────────────────────────────────────
#安裝選項,由于我已經安裝有Driver: 535.54.03,所以沒有選擇。
│ CUDA Installer
│ - [ ] Driver
│ [ ] 535.54.03
│ + [X] CUDA Toolkit 10.2
│ [ ] CUDA Samples 10.2
│ [ ] CUDA Demo Suite 10.2
│ [ ] CUDA Documentation 10.2
│ Options
│ Install #[ ]不選擇,帶X的是需要安裝的部分,之后選擇 Install
————————————————
安裝好后顯示?
?
輸入 ll /usr/local/
可以看到 /usr/local/
目錄下已經有 cuda -> /usr/local/cuda-10.2//
軟鏈接。
?
添加環境變量
打開 ~/.bashrc
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
?
驗證安裝成功
最后輸入命令 nvcc -V
有如下輸出,說明已安裝成功。
最后這步有問題在打開 ~/.bashrc中重寫下面三行
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
nvcc -V
cuDNN的安裝與檢測
3.1. cuDNN的安裝
從NVIDIA官網的cudnn下載頁面上下載與安裝CUDA對應的cudnn,網址為Log in | NVIDIA Developer。選擇Ubuntu2
cudnn-linux-x86_64-8.8.0.121_cuda12-archive.tar.xz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
參考:https://blog.csdn.net/wohu1104/article/details/107041387