Jetson Xavier NX 安裝 CUDA 支持的 PyTorch 指南

本指南將幫助開發者完成在 Jetson Xavier NX 上安裝 CUDA 支持的 PyTorch。

安裝方法

在 Jetson 上安裝 Pytorch 只有兩種方法。

  • 一種是直接安裝他人已經編譯好的 PyTorch 輪子;
  • 一種是自己從頭開始開始構建 PyTorch 輪子并且安裝。

使用輪子安裝

可以從我的?GitHub 倉庫?直接下載我編譯好的 PyTorch 輪子(torch-1.13.0-cuda-11.4-python-3.8-aarch64)。

安裝前先確保 python 版本為 PyTorch 輪子對應的 Python 3.8。

下載完畢后使用pip install安裝:

sudo -H pip install torch-1.13.0a0+git7c98e70-cp38-cp38-linux_aarch64.whl

如果你以前安裝過 torch 的其他版本,則需要添加--force-reinstall覆蓋安裝。

其他低于 CUDA 11 的 PyTorch 輪子可以在?Qengineering 的 GitHub 倉庫?尋找。

編譯源碼安裝

接下來說一下重點,自己從源碼構建輪子并安裝。自行構建需要花費數個小時的時間。

PyTroch 1.11.0 以及以上版本只能在 Ubuntu 20.04 上安裝。

安裝依賴

sudo apt-get update
sudo apt-get upgrade
sudo apt-get install ninja-build git cmake 
sudo apt-get install libjpeg-dev libopenmpi-dev libomp-dev ccache libopenblas-dev libblas-dev libeigen3-dev
sudo pip3 install -U --user wheel mock pillow
sudo -H pip3 install testresources setuptools==58.3.0 scikit-build

下載源碼

請克隆自己需要的 PyTorch 版本,修改-b后的版本參數。

git clone -b v1.13.0 --depth=1 --recursive https://github.com/pytorch/pytorch.git
cd pytorch

擴大交換內存

構建 PyTorch 需要大于 4GB 的 RAM 和 2GB 的交換內存。

先使用free -m查看當前的交換內存。

安裝dphys-swapfiel

sudo apt-get install dphys-swapfile

需要修改兩個文件/sbin/dphys-swapfile/etc/dphys-swapfile

先修改/sbin/dphys-swapfile的第30行,將CONF_MAXSWAP=2048修改成4096

sudo vim /sbin/dphys-swapfile

再修改/etc/dphys-swapfile的第26行,將#去掉,后面加上4096

sudo vim /etc/dphys-swapfile

保存修改后重啟系統。

sudo reboot

重啟完畢后可以使用?free -m?查看交換內存是否擴大成功。

使用 GCC

請使用 GCC 和 G++ 編譯器,如果使用 GNU 編譯器會導致浮點數出現錯誤的問題,使用 Clang 編譯器在構建 CUDA 11.4 的 PyTorch 時候會報錯。

設置 CUDA 版本

修改環境變量

修改系統環境變量,如果你使用的是 bash 則修改?~/.bashrc,如果使用 zsh 則修改?~/.zshrc

vim ~/.zshrc #或 ~/.bashrc

在文件末尾添加三行:

export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64
export PATH=$PATH:$CUDA_HOME/bin

如果你之前添加過 CUDA 的環境變量,則直接在對應行修改。

保存并退出,應用修改:

source ~/.zshrc #或 ~/.bashrc

切換 CUDA 版本

先切換系統 CUDA 版本到即將編譯的 CUDA 版本,這里以 CUDA 11.4 為例。

sudo update-alternatives --config cuda

選擇2,回車。

修改 CMakeLists.txt

需要在 CMakeLists.txt 文件里指定 CUDA 編譯器的路徑。

cd pytorch
vim CMakeLists.txt

在?project(Torch CXX C)上方添加一行?set(CMAKE_CUDA_COMPILER /usr/local/cuda/bin/nvcc)

保存并退出。

構建 PyTorch

設置 Ninja 構建參數

需要添加一些環境變量。

export BUILD_CAFFE2_OPS=OFF
export USE_FBGEMM=OFF
export USE_FAKELOWP=OFF
export BUILD_TEST=OFF
export USE_MKLDNN=OFF
export USE_NNPACK=OFF
export USE_XNNPACK=OFF
export USE_QNNPACK=OFF
export USE_PYTORCH_QNNPACK=OFF
export USE_CUDA=ON
export USE_CUDNN=ON
export TORCH_CUDA_ARCH_LIST="5.3;6.2;7.2"
export USE_NCCL=OFF
export USE_SYSTEM_NCCL=OFF
export USE_OPENCV=OFF
export MAX_JOBS=4
export PATH=/usr/lib/ccache:$PATH
export CC=gcc
export CXX=g++
export CUDACXX=/usr/local/cuda/bin/nvcc
export CUDA_TOOLKIT_ROOT_DIR=/usr/local/cudasudo ln -s /usr/lib/aarch64-linux-gnu/libcublas.so /usr/local/cuda/lib64/libcublas.so

開始構建 PyTorch

python3 setup.py bdist_wheel

如果構建過程中報錯,需要重新構建,請先用python3 setup.py clean重置構建。

安裝 PyTorch

經過漫長的編譯,編譯好的.whl輪子文件會放在dist文件夾里。

cd dist
sudo -H pip3 install <torch文件>.whl

如果你以前安裝過 torch 的其他版本,則需要添加--force-reinstall覆蓋安裝:

sudo -H pip3 install <torch文件>.whl --force-reinstall

驗證安裝

導入驗證 torch 不能在 PyTorch 源代碼目錄,否則會報錯,先用cd ../..退出源代碼文件夾。

python3 -c "import torch as t; print(t.__version__); print(t.version.cuda); print(t.cuda.is_available());"

大功告成!

清理空間

先停 dphys-swapfile:

sudo /etc/init.d/dphys-swapfile stop

如果磁盤空間緊缺,可以將 PyTorch 源代碼刪除,不過刪除前建議先將 Jetson 辛辛苦苦構建 PyTorch 輪子備份保存一下。

mv pytorch/dist/*.whl ~

刪除源代碼:

rm -r pytorch

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/66840.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/66840.shtml
英文地址,請注明出處:http://en.pswp.cn/web/66840.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Ansible fetch模塊詳解:輕松從遠程主機抓取文件

在自動化運維的過程中&#xff0c;我們經常需要從遠程主機下載文件到本地&#xff0c;以便進行分析或備份。Ansible的fetch模塊正是為了滿足這一需求而設計的&#xff0c;它可以幫助我們輕松地從遠程主機獲取文件&#xff0c;并將其保存到本地指定的位置。在這篇文章中&#xf…

【AI論文】生成式視頻模型是否通過觀看視頻學習物理原理?

摘要&#xff1a;AI視頻生成領域正經歷一場革命&#xff0c;其質量和真實感在迅速提升。這些進步引發了一場激烈的科學辯論&#xff1a;視頻模型是否學習了能夠發現物理定律的“世界模型”&#xff0c;或者&#xff0c;它們僅僅是復雜的像素預測器&#xff0c;能夠在不理解現實…

論文速讀|Matrix-SSL:Matrix Information Theory for Self-Supervised Learning.ICML24

論文地址&#xff1a;Matrix Information Theory for Self-Supervised Learning 代碼地址&#xff1a;https://github.com/yifanzhang-pro/matrix-ssl bib引用&#xff1a; article{zhang2023matrix,title{Matrix Information Theory for Self-Supervised Learning},author{Zh…

視覺語言模型 (VLMs):跨模態智能的探索

文章目錄 一. VLMs 的重要性與挑戰&#xff1a;連接視覺與語言的橋梁 &#x1f309;二. VLMs 的核心訓練范式&#xff1a;四種主流策略 &#x1f5fa;?1. 對比訓練 (Contrastive Training)&#xff1a;拉近正例&#xff0c;推遠負例 ??2. 掩碼方法 (Masking)&#xff1a;重構…

數據結構——堆(介紹,堆的基本操作、堆排序)

我是一個計算機專業研0的學生卡蒙Camel&#x1f42b;&#x1f42b;&#x1f42b;&#xff08;剛保研&#xff09; 記錄每天學習過程&#xff08;主要學習Java、python、人工智能&#xff09;&#xff0c;總結知識點&#xff08;內容來自&#xff1a;自我總結網上借鑒&#xff0…

c++迷宮問題(migong)

今天的題目叫“迷宮問題(migong&#xff09;”&#xff0c;是“DFS深度優先搜索 遞歸”一類的。 題目描述 設有一個N*N(2<N<10)方格的迷宮&#xff0c;入口和出口分別在左上角和右上角。迷宮格子中 分別放0和1&#xff0c;0表示可通&#xff0c;1表示不能&#xff0c;入…

機器學習-線性回歸(簡單回歸、多元回歸)

這一篇文章&#xff0c;我們主要來理解一下&#xff0c;什么是線性回歸中的簡單回歸和多元回歸&#xff0c;順便掌握一下特征向量的概念。 一、簡單回歸 簡單回歸是線性回歸的一種最基本形式&#xff0c;它用于研究**一個自變量&#xff08;輸入&#xff09;與一個因變量&…

Git知識分享

一、理解git首先要理清楚下面五個概念&#xff1a; 1、工作區(git add 命令之前的樣子) 2、stash 暫存(暫存工作區和暫存區的更改) 3、暫存區(git add 命令之后的存儲區, 4、本地倉庫(git commit提交的位置) 5、遠程倉庫(git push提交的位置) 二、git常用命令&#xff1a; 1、g…

2024年度技術總結——MCU與MEMS和TOF應用實踐

引言 2024年對我來說是技術成長與突破的一年。在這一年里&#xff0c;我不僅在技術領域拓展了深度和廣度&#xff0c;還通過與客戶合作的實際項目&#xff0c;成功實現了從單一MCU到MCU、MEMS與TOF技術融合的跨越。這一過程中&#xff0c;我深刻認識到&#xff0c;技術的進步不…

一句話,我讓 AI 幫我做了個 P 圖網站!

每到過節&#xff0c;不少小伙伴都會給自己的頭像 P 個圖&#xff0c;加點兒裝飾。 比如圣誕節給自己頭上 P 個圣誕帽&#xff0c;國慶節 P 個小紅旗等等。這是一類比較簡單、需求量卻很大的 P 圖場景&#xff0c;也有很多現成的網站和小程序&#xff0c;能幫你快速完成這件事…

如何打造一個高并發系統?

今天和大家聊聊作為一個后端開發&#xff0c;在實際工作中&#xff0c;我們如何打造一個高并發的系統&#xff1f; 如下圖所示&#xff0c;大概有六個層面&#xff0c;我們結合具體的場景直播間簽到去一一細說。 一、前端 1、打散請求&#xff1a;即把用戶的接口分散一點去請求…

996引擎 - 前期準備-配置開發環境

996引擎 - 前期準備 官網搭建服務端、客戶端單機搭建 開發環境配置后端開發環境配置環境 前端開發環境配置環境 后端簡介前端簡介GUILayoutGUIExport 官網 996傳奇引擎官網 所有資料從官網首頁開始&#xff0c;多探索。 文檔&#xff1a; 996M2-服務端Lua 996M2-客戶端Lua 搭…

迅為RK3568開發板篇OpenHarmony實操HDF驅動控制LED-添加內核編譯

編譯內核時將該 HDF 驅動編譯到鏡像中&#xff0c;接下來編寫驅動編譯腳本 Makefile&#xff0c;代碼如下所示&#xff1a; 加入編譯體系&#xff0c;填加模塊目錄到 drivers/hdf_core/adapter/khdf/linux/Makefile 文件 更多內容可以關注&#xff1a;迅為RK3568開發板篇OpenHa…

生信軟件管家——conda vs pip

pip vs conda&#xff1a; 安裝過python包的人自然兩種管理軟件都用過&#xff0c; Pip install和Conda install在Python環境中用于安裝第三方庫和軟件包&#xff0c;但它們在多個方面存在顯著的區別 總的來說&#xff1a; pip是包管理軟件&#xff0c;conda既是包管理軟件&…

電子電氣工程會議

征稿主題 集中但不限于“電子電氣與信息工程”等其他相關主題。 電子、電氣工程&#xff1a; 電路與電子學、智能芯片、半導體器件、數字信號處理、遙感&#xff0c;雷達和傳感、射頻技術、微電子技術與電子信息、電子工程中的計算智能、電力領域的數據科學技術、智能電力設…

OpenVela 架構剖析:從內核到應用

目錄 一、總體架構概述 二、 內核層 2.1. OpenVela架構的內核基礎 2.2. 內核層的主要職責 2.3. OpenVela對NuttX的擴展與優化 三、系統服務層 2.1. 進程管理 2.2. 內存管理 2.3. 文件系統 2.4. 網絡通信 四、框架層 4.1. 模塊化設計 4.2. API接口 4.3. 組件和服務…

ubuntu 布暑python項目

在Ubuntu上部署Python項目通常包括以下幾個步驟&#xff1a; 1 安裝必要的軟件&#xff1a; 確保系統已經安裝了Python、pip&#xff08;Python包管理工具&#xff09;以及virtualenv&#xff08;可選&#xff0c;用于創建獨立的Python環境&#xff09;。如果還沒有安裝&#…

RV1126畫面質量一:視頻基礎

在聊視頻畫面調節之前&#xff0c;先來認識一下視頻畫面的有一些基礎問題 如今我們所處的時代&#xff0c;是移動互聯網時代&#xff0c;也可以說是 視頻時代 。 從快播到抖音&#xff0c;從“ 三生三世 ” 到 “ 三十而已 ” &#xff0c;我們的生活&#xff0c;被越來越多的 …

準備知識——波紋度和粗糙度區別與聯系

在開始齒輪齒面波紋度開始前&#xff0c;先來學習一下基本概念——波紋度和粗糙度&#xff0c;廢話不多說&#xff0c;直接開始&#xff1a; 什么是表面粗糙度&#xff1f; 表面粗糙度定義為實際表面相對于波谷的較短頻率。如果去觀察加工零件&#xff0c;會注意到它們的表面…

五、華為 RSTP

RSTP&#xff08;Rapid Spanning Tree Protocol&#xff0c;快速生成樹協議&#xff09;是 STP 的優化版本&#xff0c;能實現網絡拓撲的快速收斂。 一、RSTP 原理 快速收斂機制&#xff1a;RSTP 通過引入邊緣端口、P/A&#xff08;Proposal/Agreement&#xff09;機制等&…