nivida-smi查看顯卡驅動版本
(一)安裝CUDA
cuda官網
cuda官網
下載對應版本的cuda
這個官網真不錯啊,下面附上了指令
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-ubuntu2404-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2404-12-8-local_12.8.0-570.86.10-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2404-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
驗證是否安裝cuda成功
nvcc -V
#或者
nvcc --version
然后就發現啥都沒有
一查原來是沒有配置環境變量
如果是自帶的cuda安裝(sudo apt install nvidia-cuda-toolkit),會給你配好環境變量的,但自己去官網下載需要自己配置環境變量
配置環境變量(讓 nvcc 可用)
1)編輯 ~/.bashrc:
nano ~/.bashrc
2)在文件末尾添加:
export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
保存并退出(Ctrl + X → Y → Enter)。
3)使更改生效
source ~/.bashrc
4)驗證 nvcc
nvcc -V
現在應該能正確顯示 CUDA 12.8 的版本信息。
nvidia官網往下翻,還看到教我怎么安裝顯卡驅動的指令哎,開源的或者傳統版本
(二)安裝cudnn
官網
cudnn官網
1)附有指令
wget https://developer.download.nvidia.com/compute/cudnn/9.10.2/local_installers/cudnn-local-repo-ubuntu2404-9.10.2_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.10.2_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.10.2/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn
2)驗證 cuDNN 是否被正確識別
檢查文件是否在 CUDA 目錄中
運行以下命令,確認 cuDNN 的頭文件和庫文件已存在:
# 檢查頭文件
ls /usr/local/cuda/include/cudnn*.h
# 檢查庫文件
ls /usr/local/cuda/lib64/libcudnn*
正常情況會輸出類似:
/usr/local/cuda/include/cudnn_version.h
/usr/local/cuda/lib64/libcudnn.so.8
/usr/local/cuda/lib64/libcudnn.so.8.9.4
果不其然,我的又是找不到
解決措施如下:
手動創建符號鏈接到 CUDA 目錄(推薦)
將 cuDNN 的頭文件和庫文件鏈接到 CUDA 的默認路徑,這樣編譯器和深度學習框架會自動找到它們。
1. 鏈接頭文件
sudo ln -s /usr/include/cudnn.h /usr/local/cuda/include/cudnn.h
sudo ln -s /usr/include/cudnn_version.h /usr/local/cuda/include/cudnn_version.h
2. 鏈接庫文件
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so /usr/local/cuda/lib64/libcudnn.so
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so.8 /usr/local/cuda/lib64/libcudnn.so.8
sudo ln -s /usr/lib/x86_64-linux-gnu/libcudnn.so.8.x.x /usr/local/cuda/lib64/libcudnn.so.8.x.x # 替換 x.x 為具體版本號
3. 更新動態鏈接庫緩存
sudo ldconfig
驗證鏈接是否成功
ls -l /usr/local/cuda/include/cudnn* # 檢查頭文件鏈接
ls -l /usr/local/cuda/lib64/libcudnn* # 檢查庫文件鏈接
如果顯示鏈接已創建(如 cudnn.h -> /usr/include/cudnn.h),說明操作成功。
(三)下載對應的torch 和torchision
torch官網
下載torch官網
我下的是python3.8的,感覺3.8穩定好用
注意:torch torchvision cuda要對應好各自的版本,我的cuda雖然是12.8但是在這里沒找到比121更高的版本了。
(四)安裝miniconda
指令
# 刪除舊安裝(如果存在)
rm -rf /home/shangshuiai/miniconda3#shangshuiai是我自己的目錄,你們替換成自己的# 下載并安裝 Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p /home/shangshuiai/miniconda3
#shangshuiai是我自己的文件夾目錄,你們替換成自己的