文章目錄
- 一、待解決問題
- 1.1 問題描述
- 1.2 解決方法
- 二、方法詳述
- 2.1 必要說明
- 2.2 應用步驟
- 2.2.1 明確pytorch安裝依賴
- 2.2.2 conda創建虛擬環境
- 2.2.3 安裝pytorch
- 2.2.4 驗證pytorch安裝
- 2.2.5 安裝Tensorflow
- 2.2.6 驗證Tensorflow安裝
- 三、疑問
- 四、總結
一、待解決問題
1.1 問題描述
為了最終運行MARL算法代碼,在安裝好anaconda環境后,進行pytorch框架的安裝。
1.2 解決方法
操作系統:ubuntu 22.04 LTS
顯卡型號:Geforce RTX 4060 Mobile
顯卡驅動:nvidia-550.120
CUDA版本:CUDA 12.4
預裝軟件:Anaconda
(1)明確pytorch安裝依賴。
(2)conda創建虛擬環境。
(3)安裝pytorch。
(4)驗證pytorch安裝。
(5)安裝tensorflow。
(6)驗證tensorflow安裝。
二、方法詳述
2.1 必要說明
? GPU、Nvidia顯卡驅動、CUDA Toolkit、pytorch框架是什么關系呢?
簡單來說就是圖示中的關系,層層調用。
- 硬件設備:GPU 是一種專門用于進行圖形計算和并行計算的硬件設備
- 硬件驅動:Nvidia 顯卡驅動是運行在操作系統上的軟件,用于讓操作系統和應用程序能夠與 Nvidia GPU 進行通信和交互。它提供了對 GPU 硬件的底層控制和管理,確保 GPU 能夠正常工作,并將來自應用程序的指令正確地傳遞給 GPU。
- GPU應用工具包:CUDA Toolkit 是用于開發基于 CUDA 應用程序的工具包,它包含了編譯器、庫、運行時環境等組件,使開發者能夠利用 GPU 的強大計算能力進行通用計算。它依賴于 Nvidia 顯卡驅動來與 GPU 進行交互。
- 深度學習框架:PyTorch 是一個流行的開源深度學習框架。它支持使用 GPU 來加速計算,當 PyTorch 運行在安裝了 CUDA Toolkit 和 Nvidia 顯卡驅動的環境中時,它可以通過 CUDA Toolkit 調用 GPU 的計算資源,從而實現對深度學習模型的快速訓練和推理。
2.2 應用步驟
2.2.1 明確pytorch安裝依賴
目標導向,首先查看pytorch官網,了解官網安裝依賴。
鏈接:pytorch Get Start
總結如下:
python版本要求:3.9或更新
ubuntu版本要求:13.04或更新
包管理工具:Anaconda 或 pip3
(1)python版本要求:
(2)操作系統版本要求
(3)包管理工具要求
2.2.2 conda創建虛擬環境
依據pytorch中對python版本的要求,創建一個python 3.11的環境。
#查看已創建的虛擬環境
conda info --envs
#創建python 3.11的虛擬環境
conda create -n marl_onpolicy python=3.11
#激活剛創建的虛擬環境
conda activate marl_onpolicy
#安裝pip3
sudo apt install python3-pip
#查看當前虛擬環境下已安裝的包
conda list
? 這里為什么要安裝pip3 ?
因為pytorch官網安裝命令提示,已不支持conda安裝。
2.2.3 安裝pytorch
確認已安裝的CUDA版本。
nvcc -V
在pytorch官網選擇對應選項,并在虛擬環境下運行命令
pip3 install torch torchvision torchaudio
安裝過程無報錯,最后提示安裝了如下組件:
Installing collected packages: triton, nvidia-cusparselt-cu12, mpmath, typing-extensions, sympy, pillow, nvidia-nvtx-cu12, nvidia-nvjitlink-cu12, nvidia-nccl-cu12, nvidia-curand-cu12, nvidia-cufft-cu12, nvidia-cuda-runtime-cu12, nvidia-cuda-nvrtc-cu12, nvidia-cuda-cupti-cu12, nvidia-cublas-cu12, numpy, networkx, MarkupSafe, fsspec, filelock, nvidia-cusparse-cu12, nvidia-cudnn-cu12, jinja2, nvidia-cusolver-cu12, torch, torchvision, torchaudio
Successfully installed MarkupSafe-3.0.2 filelock-3.17.0 fsspec-2025.2.0 jinja2-3.1.5 mpmath-1.3.0 networkx-3.4.2 numpy-2.2.3 nvidia-cublas-cu12-12.4.5.8 nvidia-cuda-cupti-cu12-12.4.127 nvidia-cuda-nvrtc-cu12-12.4.127 nvidia-cuda-runtime-cu12-12.4.127 nvidia-cudnn-cu12-9.1.0.70 nvidia-cufft-cu12-11.2.1.3 nvidia-curand-cu12-10.3.5.147 nvidia-cusolver-cu12-11.6.1.9 nvidia-cusparse-cu12-12.3.1.170 nvidia-cusparselt-cu12-0.6.2 nvidia-nccl-cu12-2.21.5 nvidia-nvjitlink-cu12-12.4.127 nvidia-nvtx-cu12-12.4.127 pillow-11.1.0 sympy-1.13.1 torch-2.6.0 torchaudio-2.6.0 torchvision-0.21.0 triton-3.2.0 typing-extensions-4.12.2
2.2.4 驗證pytorch安裝
(有pycharm、vscode等IDE的可跳過這一步)
首先安裝spyder IDE
conda install spyder
#啟動spyder
spyder
官方提供了驗證方式,在IDE中python編譯以下代碼,能夠正確輸出即表示pytorch安裝成功。
import torch
x = torch.rand(5, 3)
print(x)
if torch.cuda.is_available():print("cuda available_flag: yes")
else:print("cuda available_flag: no")
輸出矩陣,并且表明CUDA可使用,即安裝成功。
2.2.5 安裝Tensorflow
在虛擬環境下,開始安裝。
(!需要主要的是,tensorflow 版本對python版本是有需求的,先自動安裝,不能運行再調整版本)
conda install tensorflow-gpu
#查看tensorflow版本
conda list | grep tensor
2.2.6 驗證Tensorflow安裝
打開spyder,輸入以下代碼,看是否有輸出。
import tensorflow as tf
tf.add(1, 2).numpy()
hello = tf.constant('Hello, TensorFlow!')
hello.numpy()
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
💐💐💐 完結撒花 💐💐💐
三、疑問
暫無
四、總結
- GPU、顯卡驅動、CUDA Toolkit都是nvidia官方提供的。
- pytorch 作為深度學習框架提供了許多模型,用戶可以基于這些模型開發自己應用。
- anaconda 作為包管理工具可以很好地控制各開發代碼的環境,編寫新代碼時建議創建新環境,以更好控制代碼版本。