一、安裝cuda
1?? 檢查是否有 GPU
lspci | grep -i nvidia
如果沒有輸出,可能你的服務器 沒有 GPU,或者 GPU 未正確識別。
2?? 檢查 NVIDIA 驅動是否安裝
dpkg -l | grep -i nvidia
如果沒有相關輸出,說明驅動未安裝,建議安裝最新的 NVIDIA 驅動。
3?? 重新安裝 NVIDIA 驅動
如果驅動未正確安裝,可以嘗試重新安裝:
sudo apt update
sudo apt install -y nvidia-driver-535 # 535 是示例版本,可換成最新版本
安裝完成后,重啟系統:
sudo reboot
4?? 確保 NVIDIA 驅動已加載
執行:
lsmod | grep nvidia
如果沒有輸出,說明驅動未加載,可以手動加載:
sudo modprobe nvidia
5?? 確保 NVIDIA 驅動服務已啟動
sudo systemctl restart nvidia-persistenced
然后再嘗試運行:
nvidia-smi
6?? 檢查 CUDA 是否安裝
如果你要使用 CUDA,也需要檢查:
nvcc --version
如果 CUDA 沒有安裝,可以從 NVIDIA 官網下載安裝:
sudo apt install -y cuda
二、安裝Pytorch
1??查看cuda版本
2??pytorch官網查找對應版本的安裝命令行
pip3 install torch torchvision torchaudio
安裝過程有點漫長😮?💨😮?💨😮?💨