一、安裝前準備
1.禁用Nouveau驅動
Ubuntu默認使用開源Nouveau驅動,需要手動禁用:
vim /etc/modprobe.d/blacklist-nouveau.conf
# 添加以下內容:
blacklist nouveau
options nouveau modeset=0
# 更新內核并重啟:
update-initramfs -u
reboot
2.驗證禁用是否生效
lsmod | grep nouveau # 無輸出表示已禁用
二、安裝NVIDIA驅動
方法 1:通過Ubuntu官方倉庫安裝(推薦)
1.添加NVIDIA官方倉庫
apt update
apt install software-properties-common
add-apt-repository ppa:graphics-drivers/ppa
apt update
2.查找可用驅動版本
ubuntu-drivers devices # 查看推薦的驅動版本(A30 需 ≥ 470)
3.安裝驅動
# 安裝推薦版本(例如 535)
sudo apt install nvidia-driver-535# 或安裝指定版本(如 525)
sudo apt install nvidia-driver-525
4.重啟系統
reboot
方法 2:手動安裝官方.run驅動
1.下載驅動
訪問NVIDIA 驅動下載界面,選擇:
- Product Type: Tesla
- Product Series: A-Series
- Product: A30
- OS: Linux 64-bit
- 下載對應的驅動文件(如 NVIDIA-Linux-x86_64-535.129.03.run)
2.安裝依賴
apt install build-essential libglvnd-dev
3.關閉圖形界面
systemctl isolate multi-user.target
4.運行安裝程序
chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run# 安裝選項:
# - 選擇 "Install NVIDIA's 32-bit compatibility libraries"
# - 選擇 "Yes" 自動生成 Xorg 配置文件
5.重啟系統
reboot
三、驗證安裝
1.檢查驅動狀態
nvidia-smi
#輸入應顯示 A30 GPU信息,如下:
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 560.35.03 Driver Version: 560.35.03 CUDA Version: 12.6 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA A30 Off | 00000000:AF:00.0 Off | 0 |
| N/A 27C P0 26W / 165W | 4MiB / 24576MiB | 0% Default |
| | | Disabled |
+-----------------------------------------+------------------------+----------------------+
2.檢查內核模塊
lsmod | grep nvidia # 應顯示 nvidia、nvidia_uvm 等模塊
四、常見問題解決
問題 1:安裝后黑屏/無法進入桌面
- 原因: 驅動與Secure Boot沖突。
- 解決方案:
# 禁用 Secure Boot(進入 BIOS 設置)
# 或為驅動簽名:
sudo mokutil --disable-validation
問題 2:nvidia-smi 顯示“No devices found”
- 檢查PCie連接
lspci | grep -i nvidia # 確認顯卡被系統識別
- 重新加載驅動
sudo modprobe -r nvidia-drm nvidia-uvm nvidia
sudo modprobe nvidia
問題 3:驅動版本沖突
- 完全卸載舊驅動:
sudo apt purge nvidia-*
sudo /usr/bin/nvidia-uninstall
sudo reboot
五、后續配置(可選)
1.安裝CUDA Toolkit
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt install cuda-toolkit-12-2
2.配置MIG(多實例GPU)
sudo nvidia-smi -i 0 -mig 1
sudo nvidia-smi mig -cgi 1g.5gb -C