服務器因系統故障重裝,安裝docker容器時發現幾年前的在線安裝步驟不好使了,只好嘗試離線安裝。為了下次不卡殼,記錄一下安裝步驟。
先確定自己的操作系統,并確保已經安裝了nvidia driver。我的操作系統是Ubuntu 20.04。
1. 下載Docker安裝包:
下載地址:https://download.docker.com/linux/ubuntu/dists/focal/pool/stable/amd64/
下載如下幾個安裝包(根據自己的系統和硬件情況下載相應的版本):
- containerd.io_1.7.27-1_amd64.deb
- docker-ce_28.1.1-1~ubuntu.20.04~focal_amd64.deb
- docker-ce-cli_28.1.1-1~ubuntu.20.04~focal_amd64.deb
- docker-ce-rootless-extras_28.1.1-1~ubuntu.20.04~focal_amd64.deb
2. 安裝Docker
在以上安裝包存放目錄一鍵安裝以上幾個安裝包:
sudo dpkg -i *.deb
安裝完成后,啟動docker:
sudo systemctl daemon-reload
sudo systemctl restart docker
驗證docker是否啟動成功:
docker --version
正常輸出docker版本即表示docker安裝成功了。
3. 下載NVIDIA Container Toolkit安裝包
安裝完docker,我們需要下載Nvidia container Toolkit安裝包,下載地址如下:
https://mirror.cs.uchicago.edu/nvidia-docker/libnvidia-container/stable/
下載如下幾個安裝包(根據自己系統選擇相應的版本):
- libnvidia-container1_1.13.5-1_amd64.deb
- libnvidia-container-tools_1.13.5-1_amd64.deb
- nvidia-container-runtime_3.13.0-1_all.deb
- nvidia-container-toolkit_1.13.5-1_amd64.deb
- nvidia-container-toolkit-base_1.13.5-1_amd64.deb
- nvidia-docker2_2.13.0-1_all.deb
4. 安裝NVIDIA Container Toolkit
進入到存放這幾個安裝包的目錄,一鍵安裝:
sudo dpkg -i *.deb
重啟docker容器:
sudo systemctl daemon-reloadsudo systemctl restart docker
檢查是否安裝成功,先檢測一下版本:
nvidia-container-toolkit -version
輸出如下:
NVIDIA Container Runtime Hook version 1.13.5
commit: 6b8589dcb4dead72ab64f14a5912886e6165c079
基本問題不大。
5. 測試CPU容器:
用一個已有的GPU容器鏡像(freespeech:v1)測試一下:
docker run --rm --gpus all freespeech:v1 nvidia-smi
輸出如下:?
功能正常,可以干活兒了。