要查看服務器上有多少張 GPU,你可以使用以下幾種方法:
1.1 使用 nvidia-smi工具(針對 NVIDIA GPU):
如果你的服務器上安裝了 NVIDIA GPU 驅動程序,那么可以使用 nvidia-smi 命令查看詳細的 GPU 信息。
nvidia-smi
該命令將顯示服務器上所有的 NVIDIA GPU 及其詳細信息,包括驅動版本、每個 GPU 的使用情況、內存使用、溫度等。
1.2 使用 lspci 命令:
這個命令可以用于列出所有的 PCI 設備,包括 GPU。在命令輸出中,你可以過濾出與顯卡相關的信息。
lspci | grep -i --color 'vga\|3d\|2d'
這將顯示所有與圖形相關的設備,不過它可能不會顯示 GPU 的具體型號和詳細信息。
1.3 使用 lshw 工具:
lshw 是一個可以列出硬件的詳細信息的工具。你可以用它來列出所有圖形設備。
sudo lshw -C display
這將提供顯示控制器的詳細信息。如果沒有顯示出 GPU 型號,確保 lshw 已正確安裝,并以 sudo 權限運行。
1.4 使用 glxinfo 工具:
glxinfo 是一個用于顯示 OpenGL 和圖形相關信息的工具。
glxinfo | grep "OpenGL renderer"
這種方法也提供當前機器上可用的 GPU 信息,但其主要用于圖形界面的環境。
1.5 Python 腳本(如果已安裝 PyCUDA 或 TensorFlow):
在 Python 中,使用 PyCUDA 庫:
import pycuda.driver as cuda
cuda.init()
print(f"Detected {cuda.Device.count()} CUDA-capable device(s)")
使用 TensorFlow(如果 TensorFlow 和 CUDA 已正確安裝):
import tensorflow as tf
gpus = tf.config.list_physical_devices('GPU')
print(f"Available GPU(s): {len(gpus)}")
通過這些方法,你應該能夠確定服務器上安裝了多少 GPU,并獲取一些基本的信息。如果正在使用的是其他品牌的 GPU(比如 AMD),則需要相應的工具來獲取信息。