PaddleDetection系列2--NCCL安裝及測試

NCCL安裝及測試

    • 1 系統信息查看
      • 1.1 查看本機的操作系統和位數信息:
      • 1.2 確認處理器架構
      • 1.3 確認cuda版本
    • 2 NCCL安裝
      • 2.1 根據上面的系統架構以及CUDA版本,進入[官網](https://developer.nvidia.com/nccl/nccl-download)下載匹配的nccl,若想獲取舊版本,進入[舊版本](https://developer.nvidia.com/nccl/nccl-legacy-downloads)鏈接
      • 2.2 選擇下圖的安裝版本和安裝方式
      • 2.3 測試
    • 3 paddle安裝

安裝paddle 環境,使用多卡訓練,需要安裝NCCL,注意,需要先安裝NCCL,再安裝paddle

1 系統信息查看

1.1 查看本機的操作系統和位數信息:

uname -m && cat /etc/*release

我的系統輸出為
CentOS Linux release 7.9.2009

1.2 確認處理器架構

python3 -c "import platform;print(platform.architecture()[0]);print(platform.machine())"

我的系統輸出為x86_64,代表x86_64架構(或稱作 x64、Intel 64、AMD64)架構。

1.3 確認cuda版本

nvcc -V

我的系統輸出

Cuda compilation tools, release 11.1, V11.1.105

2 NCCL安裝

2.1 根據上面的系統架構以及CUDA版本,進入官網下載匹配的nccl,若想獲取舊版本,進入舊版本鏈接

2.2 選擇下圖的安裝版本和安裝方式

在這里插入圖片描述

具體命令為

for RedHat/CentOS 7

sudo yum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo

For RHEL/Centos:

sudo yum install libnccl-2.8.4-1+cuda11.1 libnccl-devel-2.8.4-1+cuda11.1 libnccl-static-2.8.4-1+cuda11.1

提示如下,證明安裝成功

已安裝:libnccl.x86_64 0:2.8.4-1+cuda11.1              libnccl-devel.x86_64 0:2.8.4-1+cuda11.1              libnccl-static.x86_64 0:2.8.4-1+cuda11.1             完畢!

2.3 測試

$ git clone https://github.com/NVIDIA/nccl-tests.git
$ cd nccl-tests
$ make
$ ./build/all_reduce_perf -b 8 -e 256M -f 2 -g <ngpus># nThread 1 nGpus 4 minBytes 8 maxBytes 268435456 step: 2(factor) warmup iters: 5 iters: 20 agg iters: 1 validation: 1 graph: 0
#
# Using devices
#  Rank  0 Group  0 Pid 200875 on  localhost device  0 [0x3b] Tesla T4
#  Rank  1 Group  0 Pid 200875 on  localhost device  1 [0x5e] Tesla T4
#  Rank  2 Group  0 Pid 200875 on  localhost device  2 [0x86] Tesla T4
#  Rank  3 Group  0 Pid 200875 on  localhost device  3 [0xaf] Tesla T4

輸出上面信息證明測試成功

3 paddle安裝

paddle對CUDA 11.1支持的版本比較少,因此先進入如下鏈接
查找能夠支持的版本,最終選擇2.3.2版本paddle,安裝命令如下

python3 -m pip install paddlepaddle-gpu==2.3.2.post111 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安裝后輸出如下信息證明安裝成功

Installing collected packages: paddlepaddle-gpu
Successfully installed paddlepaddle-gpu-2.3.2.post111

進入python 環境,輸入如下命令以及提示信息,證明nccl已安裝成功,可以多卡訓練。

>>> import paddle
>>> paddle.utils.run_check()PaddlePaddle works well on 4 GPUs.
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/209759.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/209759.shtml
英文地址,請注明出處:http://en.pswp.cn/news/209759.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

力扣44題通配符匹配題解

44. 通配符匹配 - 力扣&#xff08;LeetCode&#xff09; 給你一個輸入字符串 (s) 和一個字符模式 (p) &#xff0c;請你實現一個支持 ? 和 * 匹配規則的通配符匹配&#xff1a; ? 可以匹配任何單個字符。* 可以匹配任意字符序列&#xff08;包括空字符序列&#xff09;。 …

【ITK庫學習】使用itk庫進行圖像濾波ImageFilter:梯度Gradient

目錄 1、itkGradientImageFilter2、itkGradientMagnitudeImageFilter 梯度強度3、itkGradientMagnitudeRecursiveGaussianImageFilter 帶濾波的梯度強度4、itkDerivativeImageFilter 不帶濾波的導函數 1、itkGradientImageFilter 該類是一個基類&#xff0c;用于使用方向導數計…

C++筆試題之回文數的判斷

“回文”是指正讀反讀都能讀通的句子&#xff0c;它是古今中外都有的一種修辭方式和文字游戲&#xff0c;如“我為人人&#xff0c;人人為我”等。在數學中也有這樣一類數字有這樣的特征&#xff0c;成為回文數&#xff08;palindrome number&#xff09;。 設n是一任意自然數…

MSSQL 程序集使用方法

1.C# 寫一個程序 1.1新建一個項目【類庫【.Net FrameWork】 1.2編寫代碼 刪除 namespace ApiSQLClass { } 代碼如下&#xff1a;【具體調用API模式根據具體編寫】 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.…

1. 使用poll或epoll創建echo服務器

1. 說明&#xff1a; 此篇博客主要記錄一種客戶端實現方式&#xff0c;和兩種使用poll或者epoll分別創建echo服務器的方式&#xff0c;具體可看代碼注釋&#xff1a; 2. 相關代碼&#xff1a; 2.1 echoClient.cpp #include <iostream> #include <cstdio> #incl…

C語言中的 sizeof 運算符

在 C 語言中&#xff0c;sizeof 是一個運算符&#xff0c;用于獲取給定類型或變量的字節大小。它返回一個 size_t 類型的值&#xff0c;表示以字節為單位的對象大小。 sizeof 運算符有以下特點&#xff1a; 用法&#xff1a;sizeof 運算符可以應用于數據類型或表達式。計算靜…

酷開科技以創新為動力用大數據提升品牌認知

在21世紀的今天&#xff0c;我們生活在一個被互聯網深深改變的世界。互聯網不僅改變了我們的生活方式&#xff0c;也正在改變我們的思維方式和工作方式。而互聯網作為一種新的發展趨勢&#xff0c;更是為我們提供了無數的機會和無限可能性&#xff0c;從電子商務時代到社交網絡…

CSP-何以包郵?

題目描述 新學期伊始&#xff0c;適逢頓頓書城有購書滿 x 元包郵的活動&#xff0c;小 P 同學欣然前往準備買些參考書。 一番瀏覽后&#xff0c;小 P 初步篩選出 n 本書加入購物車中&#xff0c;其中第 i 本&#xff08;1≤i≤n&#xff09;的價格為 ai 元。 考慮到預算有限&am…

scala編碼

1、Scala高級語言 Scala簡介 Scala是一門類Java的多范式語言&#xff0c;它整合了面向對象編程和函數式編程的最佳特性。具體來講Scala運行于Java虛擬機&#xff08;JVM)之上&#xff0c;井且兼容現有的Java程序&#xff0c;同樣具有跨平臺、可移植性好、方便的垃圾回收等特性…

ubuntu server 20.04 備份和恢復 系統 LTS

ubuntu server 20.04 備份和恢復 系統 LTS tar命令系統備份與恢復&#xff08;還原or新裝&#xff09; 備份系統 cd / su root tar cvpzf backup.tgz --exclude/tmp --exclude/run --exclude/dev --exclude/snap --exclude/proc --exclude/lostfound --exclude/backup.tgz …

啟動游戲出現concrt140.dll錯誤的8種解決方法

在計算機使用過程中&#xff0c;我們經常會遇到一些錯誤提示&#xff0c;其中之一就是找不到concrt140.dll文件。這個錯誤通常會導致程序無法正常運行&#xff0c;給用戶帶來困擾。本文將介紹找不到concrt140.dll無法繼續執行代碼的8個方法&#xff0c;同時探討concrt140.dll丟…

LinuxBasicsForHackers筆記 -- 文件系統和存儲設備管理

設備目錄/dev Linux 有一個特殊的目錄&#xff0c;其中包含代表每個連接設備的文件&#xff1a;相應命名的 /dev 目錄。 /dev中有很多設備列表。 特別令人感興趣的是設備 sda1、sda2、sda3、sdb 和 sdb1&#xff0c;它們通常是硬盤驅動器及其分區以及 USB 閃存驅動器及其分區…

理解基于 Hadoop 生態的大數據技術架構

轉眼間&#xff0c;一年又悄然而逝&#xff0c;時光荏苒&#xff0c;歲月如梭。當回首這段光陰&#xff0c;不禁感嘆時間的匆匆&#xff0c;仿佛只是一個眨眼的瞬間&#xff0c;一年的旅程已成為過去&#xff0c;而如今又到了畫餅的時刻了 &#xff01; 基于 Hadoop 生態的大數…

固態硬盤SSD

目錄 1.2 組成1.3 讀寫性能特性1.4 與機械硬盤相比的特點1.5 磨損均衡技術 \quad \quad SSD基于閃存技術Flash Memory, 屬于電可擦除ROM, 即EEPROM \quad 1.2 組成 \quad \quad \quad 系統對固態硬盤的讀寫是以頁為單位的 固態硬盤里的塊相當于機械硬盤里的磁道 固態硬盤里的頁…

Redis基礎系列-持久化

Redis基礎系列-持久化 文章目錄 Redis基礎系列-持久化1. 什么是持久化2. 為什么要持久化3. 持久化的兩種方式3.1 持久化方式1&#xff1a;RDB(redis默認持久化方式)3.11 配置步驟-自動觸發3.12 配置步驟-手動觸發3.12 優點3.13 缺點3.14 檢查和修復RDB快照文件3.15 哪些情況會觸…

每天一個Linux命令 -- (7)more命令

歡迎閱讀《每天一個Linux命令》系列&#xff01;在本篇文章中&#xff0c;將介紹Linux系統下的more命令&#xff0c;它用于逐屏顯示文件的內容。 概念 more命令是Linux系統下的文件逐屏顯示命令&#xff0c;用于逐屏顯示文件的內容。 命令操作 more命令的語法如下&#xff1…

ubuntu22.04 安裝cuda

CUDA&#xff08;Compute Unified Device Architecture&#xff09;是由 NVIDIA 開發的一種并行計算平臺和編程模型。它允許開發者利用 NVIDIA 的 GPU&#xff08;圖形處理單元&#xff09;進行高效的計算處理。CUDA 通過提供一系列的 C、C 和 Fortran 擴展&#xff0c;使得開發…

我的NPI項目之Android電源系列 -- 關于剩余充滿時間的問題(一)

我的新項目是基于高通最新的5G平臺&#xff0c;但是由于還沒有拿到EVT。所以&#xff0c;就在目舊的平臺和OS上進行學習。遇到第一個問題就是插上type-c之后&#xff0c;充滿剩余時間異常的問題。 問題描述&#xff0c;在充電過程中&#xff0c;顯示充滿時間為“0 min left unt…

9.基于SpringBoot3+I18N實現國際化

1. 新建資源文件 在resources目錄下新建目錄i18n, 然后 新建messages_en.properties文件 user.login.erroraccount or password error&#xff01;新建messages_zh_CN.properties文件 user.login.error帳戶或密碼錯誤&#xff01;2. 新建LocaleConfig.java文件 Configurati…

2004-2021年上市公司環境規制強度相關數據

2004-2021年上市公司環境規制強度相關數據 1、時間&#xff1a;2004-2021年 2、指標&#xff1a;年份、股票代碼、股票簡稱、行業名稱、行業代碼、省份、城市、區縣、行政區劃代碼、城市代碼、區縣代碼、首次上市年份、上市狀態、所屬省份-工業增加值_億元、所屬省份-治理廢氣…