前言:
? ? ? ? 最近做橫向需要使用實驗室服務器跑模型,之前用師兄的賬號登錄服務器跑yolo,3張3090一輪14秒,我本地一張4080laptop要40秒,效率還是快很多,(這么算一張4080桌面版居然算力能比肩3090,老黃好刀法),不過一直用師兄的號也不好意思,所以開了自己單獨的號記錄下如何配置Linux深度學習的環境。
? ? ? ? 本文使用的是Anaconda進行配置,因為使用 Anaconda 安裝深度學習環境時,通常不需要單獨安裝 CUDA 和 cuDNN,當然前提是你通過?conda install
?直接安裝 PyTorch 的 CUDA 版本。
前置工具:
先下好下面兩個工具Xshell和Xftp到自己電腦上,前者負責遠程連接,輸入指令,后者負責文件傳輸,以及提供可視化文件管理。鏈接如下(注意下載免費版本的):
XSHELL - The Industry's Most Powerful SSH Clienthttps://www.netsarang.com/en/xshell/
下載后打開,兩者使用方式差不多,新建會話->輸入主機ip->輸入用戶名密碼
然后點擊連接就能進入遠控的界面。
XFTP同理連接后能夠看到下面界面,左邊為本機文件管理,右邊為遠程主機文件管理,左鍵單擊或右鍵選擇傳輸可實現兩機文件交換,同時也可可視化操作linux的文件比如復制粘貼刪除重命名而不用輸指令。
一、Python版本檢查
(雖然理論上感覺安裝anaconda前不需要額外安裝python,畢竟它本身其實就是為了完成python環境的隔離,但似乎后續conda install失敗時使用pip install要是版本不對可能會發生問題?以及我確實找到了一些關于anaconda和python版本的對應關系圖,姑且就安裝對應的版本。)
python3或python查看本地python版本,顯示為3.10.6,exit()退出
二、Anaconda下載和安裝
這是找到的對應圖,不過也是陳年老博客了,鏈接如下:
Index of /archivehttps://repo.anaconda.com/archive/
依次輸入下面指令:
下載:換成自己對應的鏈接
wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh
添加權限:
chmod +x Anaconda3-2023.03-1-Linux-x86_64.sh
運行:
./Anaconda3-2023.03-1-Linux-x86_64.sh
按enter:
輸入yes:
使用默認地址就好,按enter:
使用初始化,輸入yes:
等待后輸入ls能夠看見創建了一個anaconda3的文件夾,使用rm刪除之前下載的sh腳本
重新加載環境
source ~/.bashrc
查看版本校驗是否安裝成功
conda --version
創建一個環境,這里命名為yolo,使用3.9版本的python(師兄建議不要使用3.10+版本)
激活對應環境:
source activate yolo
三、安裝torch
點擊下面鏈接,
https://pytorch.org/get-started/previous-versions/https://pytorch.org/get-started/previous-versions/
復制下面指令:
conda install pytorch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 pytorch-cuda=11.8 -c pytorch -c nvidia
然后等待一段時間都顯示done后就配置好環境了。
(是的就這么幾步,倒騰了一下午就弄好了,windows的環境配置我反而折騰了一個多星期)
四、驗證
1.看所有安裝的庫:
conda list
(前面括號里面表示激活的環境,使用source activate切換)
很明顯這邊以及安裝上cuda版本的torch
2.代碼驗證:
依次輸入
python
import torch
print(torch.cuda.is_available())
結果為true即可。
最后:
?????????難得這部分配置環境順順利利沒有出錯,不過后面yolo在linux上的環境還是報了不少錯,好在最后順利解決,后續會出一篇使用yolo在windows和linux分別訓練自己的模型的博客,可以點點關注!