在 Linux 系統中查看 GPU 占用情況,主要取決于你的 GPU 類型(NVIDIA/AMD),以下是常用方法:
一、NVIDIA GPU(最常用,如 RTX 系列、Tesla 系列)
使用 NVIDIA 官方工具 nvidia-smi
(需安裝 NVIDIA 驅動):
1. 基本查看
直接在終端運行:
nvidia-smi
輸出內容包含:
- GPU 編號、名稱、驅動版本
- 顯存使用情況(Total/Used/Free)
- GPU 利用率(GPU-Util)
- 溫度(Temperature)
- 占用 GPU 的進程(PID、進程名、顯存占用)
2. 實時監控(每秒刷新)
watch -n 1 nvidia-smi # 1秒刷新一次,按Ctrl+C退出
3. 更簡潔的輸出
nvidia-smi --query-gpu=name,memory.total,memory.used,memory.free,temperature.gpu,utilization.gpu --format=csv
自定義需要的參數(更多參數可通過 nvidia-smi --help-query-gpu
查看)。
二、AMD GPU
使用 ROCm 工具鏈中的 rocm-smi
(需安裝 ROCm 驅動):
1. 基本查看
rocm-smi
輸出包含 GPU 型號、溫度、顯存使用、利用率等信息。
2. 實時監控
watch -n 1 rocm-smi
三、通用工具(支持多品牌)
1. gpustat
(更友好的命令行工具)
- 安裝:
pip install gpustat
(需要 Python 環境) - 使用:
gpustat # 簡潔顯示GPU狀態gpustat -i # 顯示進程詳情(如PID和進程名)watch -n 1 gpustat # 實時監控
2. glances
(系統監控工具,支持 GPU)
- 安裝:
sudo apt install glances
(Ubuntu/Debian) - 使用:運行
glances
,在界面中找到 GPU 相關指標(需系統支持)。
四、注意事項
- 若
nvidia-smi
提示命令不存在,說明未安裝 NVIDIA 驅動,需先安裝對應版本的驅動。 - 對于服務器級 GPU(如 Tesla),輸出內容可能包含更多功耗、性能狀態等信息。
- 若需查看特定進程占用的 GPU 資源,可結合
ps
命令進一步分析,例如:
ps -p \<PID> -o %cpu,%mem,cmd # 查看某個PID的CPU/內存占用
根據你的 GPU 類型選擇對應工具即可快速掌握 GPU 的占用情況。