背景:
緊接前文:Proxmox VE 8.4 顯卡直通完整指南:NVIDIA 2080 Ti 實戰。在R740服務器完成了proxmox的安裝,并且安裝了一張2080ti 魔改22g顯存的的顯卡。配置完了proxmox顯卡直通,并將顯卡掛載到了vm 301(ubuntu22.04)的虛擬機上面。現在需要安裝顯卡驅動與cuda以及cuDNN!
ubuntu22.04安裝顯卡驅動與cuda+cuDNN
下載并安裝顯卡驅動
下載顯卡驅動到虛擬機實例
登錄NVIDIA驅動官方網站,輸入對應產品型號,選擇操作系統,開始搜索:
這里直接下載了最新的570.144 版本驅動,點擊獲取下載:
點擊立即下載通過瀏覽器下載驅動到本地:
通過rz or其他ftp工具上傳驅動程序到VM301實例:
我這里使用rz上傳了驅動程序到/data/soft目錄下了,這里的操作全憑喜好,并給驅動程序增加可執行權限:
mkdir -p /data/soft
cd /data/soft
chmod +x NVIDIA-Linux-x86_64-570.144.run
安裝所需依賴
sudo apt-get update
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
注:如果沒有安裝如上依賴執行驅動可執行程序會報錯 gcc 等依賴的錯誤:
卸載原有 NVIDIA 驅動(如果有)
sudo apt-get remove --purge nvidia*
禁用 nouveau (通用驅動程序)
編輯/etc/modprobe.d/blacklist.conf文件,在末尾添加以下兩行,保存后關閉文本
blacklist nouveauoptions nouveau modeset=0
在終端輸入如下更新,更新結束后重啟電腦(必須)
sudo update-initramfs -u
reboot
重啟后輸入如下指令,如無輸出則已關閉 nouveau
安裝顯卡驅動
進入驅動可執行文件存放目錄,執行可執行程序:
cd /data/soft/
./NVIDIA-Linux-x86_64-570.144.run
圖像框默認即可,安裝頁面如下:
具體過程截圖太多,只保留最后的截圖:
驗證驅動 程序安裝成功:
nvidia-smi
根據顯卡驅動,下載安裝對應的 CUDA
下載并安裝cuda
通過nvidia-smi 可以看到顯卡最高支持的cuda版本是 12.8,訪問cuda下載頁面 點擊 12.8.0對應鏈接:
選擇自己的操作系統、芯片架構、Linux發行版本、安裝方式:
我這里創建了一個目錄存放cuda對應deb包,并執行官方提供的安裝命令:
mkdir /data/soft/cuda
cd /data/soft/cuda
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
配置環境變量并驗證cuda:
vi ~/.bashrc 到尾行增加如下配置
export PATH=/usr/local/cuda-12.8/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
刷新bashrc 文件,并驗證cuda是否安裝成功:
source ~/.bashrc
nvcc –V
根據 CUDA版本,下載對應的 cuDNN 庫
cuDNN 是 NVIDIA 專門為深度學習任務開發的加速庫,cuDNN 需要和上面安裝的 CUDA 版本對應起來:
訪問cuDNN 下載頁面,依然下載最新的了 v8.9.7版本:
下載linux_x86_x64版本到本地并上傳到服務器(這里貌似需要登錄NVIDIA賬號):
解壓 cuDNN 文件
mkdir /data/soft/cuDNN
cd /data/soft/cuDNN
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
將以下文件復制到 CUDA 目錄(<font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">/usr/local/cuda/</font>
文件夾下面的 <font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">include</font>
和 <font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">lib64</font>
)
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
驗證是否安裝成功
sudo cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
注意:
以上步驟操作用戶為root,包括環境變量的配置環境變量都為root用戶,如使用其他用戶,請注意增加對應環境變量配置!