文章目錄
- 一、安裝顯卡驅動
- 1.1 查看顯卡型號
- 1.2 根據顯卡型號選擇驅動
- 1.3 獲取下載鏈接
- 1.4 查看下載的顯卡驅動安裝文件
- 1.5 更新軟件列表和安裝必要軟件、依賴
- 1.6 卸載原有驅動
- 1.7 禁用默認驅動
- 1.8 安裝lightdm顯示管理器
- 1.9 停止顯示服務器
- 1.10 在文本界面中,禁用X-window服務
- 1.11 安裝驅動
- 1.12 檢測顯卡驅動是否安裝成功
- 1.12 重啟顯示服務、恢復圖像界面
- 二、安裝CUDA
- 2.1 選擇合適的CUDA版本
- 2.2 下載CUDA
- 2.3 安裝CUDA
- 2.4 環境變量配置
- 2.5 檢測CUDA是否安裝成功
- 三、Miniconda
- 3.1 下載Miniconda
- 3.2 安裝Miniconda
- 3.3 配置環境
- 四、安裝Pytorch
- 4.1 選擇合適Pytorch版本
- 4.2 安裝Pytorch
- 五、關于安裝cuDNN(這個坑以后再補)
一、安裝顯卡驅動
1.1 查看顯卡型號
lspci | grep -i nvidia
我們發現輸出的信息中有
Device 2230
,可以根據這個信息查詢顯卡型號
查詢網址:https://admin.pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci
輸入后點擊
Jump
查詢
我們發現顯卡型號為
RTX A6000
1.2 根據顯卡型號選擇驅動
英偉達驅動下載:https://www.nvidia.cn/Download/Find.aspx?lang=cn&QNF=1
根據需求,輸入顯卡型號
、操作系統
和語言
,選擇相應的驅動版本,我選擇550.78
這個版本。
1.3 獲取下載鏈接
點擊下載
點擊【同意并開始下載
】
1.4 查看下載的顯卡驅動安裝文件
ll
1.5 更新軟件列表和安裝必要軟件、依賴
sudo apt-get update
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
1.6 卸載原有驅動
sudo apt-get remove --purge nvidia*
1.7 禁用默認驅動
在安裝NVIDIA驅動前,禁用系統自帶顯卡驅動nouveau
使用vim
打開和修改文件,也可用gedit
sudo vim /etc/modprobe.d/blacklist.conf
在文件尾增加兩行:
blacklist nouveau
options nouveau modeset=0
更新文件
sudo update-initramfs -u
此時必須重啟電腦:
sudo reboot
1.8 安裝lightdm顯示管理器
sudo apt-get install lightdm
1.9 停止顯示服務器
sudo telinit 3
1.10 在文本界面中,禁用X-window服務
sudo service gdm3 stop
1.11 安裝驅動
# 授予執行權限
sudo chmod 777 NVIDIA-Linux-x86_64-550.78.run# 執行安裝命令
sudo ./NVIDIA-Linux-x86_64-550.78.run
1.12 檢測顯卡驅動是否安裝成功
nvidia-smi
大功告成~
1.12 重啟顯示服務、恢復圖像界面
sudo service gdm3 start
sudo telinit 5
二、安裝CUDA
2.1 選擇合適的CUDA版本
我顯卡的驅動版本是550.78
,可以安裝CUDA 12版本。可根據自己顯卡版本選擇合適的CUDA版本:查詢鏈接:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
2.2 下載CUDA
下載頁面鏈接:https://developer.nvidia.com/cuda-toolkit-archive
# 使用命令下載文件:
wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda_12.1.0_530.30.02_linux.run
# 使用命令查看文件下載:
ll
2.3 安裝CUDA
sudo sh cuda_12.1.0_530.30.02_linux.run
稍等一會,會出現如下界面,輸入:accept
即可安裝
接著會出現如下界面:
需要注意的是,上述過程我們已在步驟1安裝顯卡驅動,已無需再裝,可通過鍵盤選擇,取消驅動的安裝。
再將光標通過鍵盤移至Install
,開始安裝:
2.4 環境變量配置
以vim
方式打開配置文件
sudo vim ~/.bashrc
在文件尾中加入以下兩行:
export PATH="/usr/local/cuda-12.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH"
更新環境變量
source ~/.bashrc
2.5 檢測CUDA是否安裝成功
nvcc -V
命令行顯示如上信息,表明安裝成功!大功告成~
三、Miniconda
Anaconda簡介:
Anaconda 是一個用于科學計算的 Python 發行版,支持 Linux, Mac, Windows, 包含了眾多流行的科學計算、數據分析的 Python 包。
Anaconda
和Miniconda
的區別:Anaconda
軟件包大概500MB
,安裝后大概3-4G,base環境包括了conda管理器、Pyhon編譯器、常用的包和Spyder IDE等;Miniconda
軟件包大概50MB
,安裝后大概300MB,base環境選擇只包括conda管理器和Python編譯器,其他的包需要通過conda命令安裝。
3.1 下載Miniconda
官網鏈接
:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/
右鍵選擇“復制鏈接”,并使用wget命令在Ubuntu服務器下載:
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py38_23.11.0-1-Linux-x86_64.sh
3.2 安裝Miniconda
(1)開始安裝。輸入以下命令后,敲擊回車鍵
sudo bash Miniconda3-py38_23.11.0-1-Linux-x86_64.sh
(2)接受條款。按著Enter不松,直到出現條款,輸入yes
:
(3) 輸入安裝路徑后敲擊回車鍵。我的安裝路徑為:/usr/local/miniconda
(4)最后敲擊回車鍵
3.3 配置環境
(1)配置環境變量。修改/etc/profile
文件,來配置環境,添加一行(根據自己的安裝路徑添加)
export PATH=/usr/local/miniconda/bin:$PATH
(2)注入環境。
source /etc/profile
(3) 驗證是否安裝成功
conda -V
若顯示版本號,表明miniconda已安裝成功!
四、安裝Pytorch
4.1 選擇合適Pytorch版本
鏈接:https://pytorch.org/get-started/previous-versions/
由于CUDA安裝的版本是12.1,所以可以用Pytorch的v2.2.0版本
4.2 安裝Pytorch
可用conda安裝
conda install pytorch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 pytorch-cuda=12.1 -c pytorch -c nvidia
也可用pip安裝
pip install torch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu121
五、關于安裝cuDNN(這個坑以后再補)
cuDNN
是一個基于CUDA的深度學習GPU加速庫,可以提高深度學習模型在GPU上的訓練速度。cuDNN不是必須安裝的,但是一般會采用這個加速庫。部分深度學習框架,如PyTorch,會自帶預先編譯的cuDNN,無需手動安裝
。后面我還需要安裝Pytorch,所以cuDNN就沒安裝,需要安裝的可以參考下面信息,但是不完整。
版本查看頁面:https://developer.nvidia.com/cudnn-downloads
下載
CUDA 12
對應的cuDNN版本,這里我們選擇8.9.0
版本。點擊該版本,顯示如下,我們選擇紅框圈中的版本。