Ascend上如何進行帶寬測試

1 工具安裝

1.1 下載鏈接

https://www.hiascend.com/developer/download/community/result?module=dl%2Bcann

1.2 安裝指令:

./Ascend-mindx-toolbox_{version}_linux-{arch}.run --install設置環境變量:
source /usr/local/Ascend/toolbox/set_env.sh
source /usr/local/Ascend/ascend-toolkit/set_env.sh

2 帶寬測試

分別執行一下四個指令

ascend-dmi --bw -t d2d
ascend-dmi --bw -t d2h
ascend-dmi --bw -t h2d
ascend-dmi --bw -t p2p

參考鏈接:https://www.hiascend.com/document/detail/zh/mindcluster/70rc1/toolbox/toolboxug/toolboxug_0015.html

參數說明:

參數說明約束是否必填
[-bw, --bw, --bandwidth]使用該參數測試芯片或整卡的帶寬。支持-bw,但建議使用–bw或–bandwidth。-
[-t, --type]指測試數據流向的分類。當使用帶寬測試功能時,測試的數據流可以分為以下方向,若不填寫數據流方向則默認返回h2d、d2h、d2d三個方向的帶寬和總耗時。h2d:指數據從Host側內存通過PCIe總線搬移到Device側內存,測試整體帶寬及總耗時。(使用Atlas A3 訓練系列產品帶寬測試功能時,測試的為HCCS平面總帶寬及總耗時。)d2h:指數據從Device側內存通過PCIe總線搬移到Host側內存,測試整體帶寬及總耗時。(使用Atlas A3 訓練系列產品帶寬測試功能時,測試的為HCCS平面總帶寬及總耗時。)d2d:指數據從Device側內存搬移到同一Device側內存(主要是用于測試Device側的內存帶寬),測試整體帶寬及總耗時。p2p:測試指定源頭Device到目標Device的傳輸速率和總耗時。說明使用p2p且不指定Device時(不指定-ds和-dd參數),-s、-et和-fmt參數不生效,使用定長模式和對應默認值。如ascend-dmi --bw -t p2p -fmt json命令中,-fmt參數不生效,使用默認值normal。Atlas 200I/500 A2 推理產品 僅支持d2d模式,不支持使用該參數。p2p模式僅支持 Atlas 訓練系列產品 、Atlas A2 訓練系列產品、 Atlas 800I A2 推理產品 、Atlas 300I Duo 推理卡、Atlas A3 訓練系列產品。Atlas 300I Duo 推理卡使用p2p模式時,-ds和-dd參數僅支持主芯片的Device ID或同一張卡的主從芯片對應的Device ID。執行Atlas 200T A2 Box16 異構子框上兩個8p之間的p2p測試時,僅支持輸出兩個對等位置的p2p結果,例如0卡對應8卡,可輸出0卡傳輸至8卡的p2p測試結果,以此類推。
[-m, --mode]指定帶寬測試模式,執行卡粒度或芯片粒度的帶寬測試。不指定該參數時默認測試device粒度的帶寬測試。device:表示芯片粒度,指昇騰芯片的邏輯ID。card:表示卡粒度,指昇騰芯片的卡ID,測試整卡的帶寬。僅支持Atlas 900 A3 SuperPoD 超節點、Atlas 9000 A3 SuperPoD 集群算力系統、A200T A3 Box8 超節點服務器在type為p2p模式時,使用此參數。
[-s, --size]指傳輸數據大小并指定測試結果顯示方式。傳輸數據的取值范圍有以下情況:超節點系列產品:d2h/h2d/p2p這3種模式下,最大傳輸數值為1Byte4G。其他產品:1Byte512M。指定-s參數后面必須填寫數值指定傳輸數據的大小,不填寫屬于錯誤寫法。在h2d、d2h、d2d以及p2p且指定-ds和-dd場景。指定-s為定長模式。不指定-s為步長模式,傳輸數據的默認取值范圍為2Byte~32M。p2p場景且不指定-ds和-dd場景。該場景下-s參數不生效,使用定長模式和默認值。默認值說明如下。Atlas A2訓練系列產品、Atlas A3 訓練系列產品,0卡或8卡到其他卡的默認傳輸數據大小為512M,除此之外,默認傳輸數據大小為256M。其他產品,傳輸數據大小默認值為128M。Atlas A2 訓練系列產品、Atlas 800I A2 推理服務器、Atlas A3 訓練系列產品若指定“-t”為d2d模式時,傳輸數據大小由AI Core決定,所以不支持使用“-s”參數。Atlas 200I/500 A2 推理產品 傳輸數據大小為固定值0.97GB(由傳輸數據的Tensor決定),不支持使用該參數。
[-et, --et, --execute-times]指迭代次數,即內存拷貝次數。取值范圍為[1, 1000],若不填寫,步長模式下拷貝次數則默認為5,定長模式下拷貝次數則默認為40。Atlas 200I/500 A2 推理產品 、Atlas 800I A2 推理服務器、Atlas A2 訓練系列產品、Atlas A3 訓練系列產品在d2d模式下,不支持使用該參數,拷貝次數默認為1。
[-d, --device]指定需要測試帶寬的Device ID,Device ID是指昇騰AI處理器的邏輯ID。若填寫Device ID時:默認返回對應的Device ID帶寬信息,ID字段回顯為對應的Device ID。若不填寫Device ID時:使用Atlas 900 A3 SuperPoD 超節點、Atlas 9000 A3 SuperPoD 集群算力系統在d2d模式下默認返回Device 0帶寬信息,ID字段回顯為0;在d2h、h2d模式下默認返回全量Device帶寬信息,ID字段回顯為All。使用A200T A3 Box8 超節點服務器或非Atlas A3 訓練系列產品在d2d、d2h、h2d模式下默認返回Device 0帶寬信息,ID字段回顯為0。為確保Atlas 300I Duo帶寬測試結果達到最佳,建議測試Device 0帶寬信息。Atlas A2 訓練系列產品在p2p模式下,不支持使用該參數。
[-ds, --ds, --device-src]指定p2p測試的源頭Device的ID號。必須與[-dd, --dd, --device-dst]參數成對指定;若與[-dd, --dd, --device-dst]參數同時不指定時,測試全量的昇騰NPU芯片。Atlas 200/300/500 推理產品 、 Atlas 推理系列產品 、Atlas 800I A2 推理服務器、 Atlas 200I/500 A2 推理產品 不支持使用該參數。
[-dd, --dd, --device-dst]指定p2p測試的目標Device的ID號。必須與[-ds, --ds, --device-src]參數成對指定;若與[-ds, --ds, --device-src]參數同時不指定時,測試全量的昇騰NPU芯片。Atlas 200/300/500 推理產品 、 Atlas 推理系列產品 、Atlas 800I A2 推理服務器、 Atlas 200I/500 A2 推理產品 不支持使用該參數。
[-fmt, --fmt, --format]指定輸出格式,可以為normal或json。若未指定則默認為normal。-
[-q, --quiet]指定該參數時,將不再進行防呆提示,用戶將默認允許該操作。若不指定該參數,將進行防呆提示,用戶需要輸入Y或N(y或n)確認是否進行測試。
[-h, --help]查看Ascend DMI工具“帶寬測試”功能的幫助信息。-

3 使用實例

p2p測試命令截圖取自訓練服務器。

  • 以不帶參數為例(不帶參數則默認查詢在Device 0,以h2d、d2h、d2d三個數據流向和步長模式顯示的帶寬耗時信息)。

    ascend-dmi --bw

  • 以測試數據從Host側傳輸到Device 0,迭代100次的帶寬與總耗時為例。

    • 定長模式。

      ascend-dmi --bw -t h2d -d 0 -s 8388608 --et 100

      若返回如圖1所示信息,表示工具運行正常,圖中參數介紹如表3所示。

      圖1 帶寬測試示例(定長模式)
      放大img

    • 步長模式。

      ascend-dmi --bw -t h2d -d 0 –et 100

      若返回如圖2所示信息,表示工具運行正常,圖中參數介紹如表3所示。

      圖2 帶寬測試示例(步長模式)
      img

  • 以測試數據從Device側傳輸到同一Device側的帶寬與總耗時為例。

    ascend-dmi --bw -t d2d -d 0

    若返回如圖3、圖4、圖5所示信息,表示工具運行正常,圖中參數介紹如表3所示。

    圖3 帶寬測試示例(Atlas 訓練系列產品)
    img

    圖4 帶寬測試示例(Atlas A2 訓練系列產品)
    img

    ascend-dmi --bw -d 0

    圖5 帶寬測試示例(Atlas 200I/500 A2 推理產品)
    img

  • 測試指定源頭Device到目標Device的傳輸速率和總耗時。

    • 以測試數據從源頭Device 0傳輸到目標Device 1的p2p測試為例。

      ascend-dmi --bw -t p2p --ds 0 --dd 1 -s 6 -q

      若返回如圖6所示信息,表示工具運行正常,圖中參數介紹如表3所示。

      圖6 p2p方式帶寬測試示例
      img

      表3 顯示界面參數介紹

      參數說明
      Host to Device Test帶寬數據流方向。有以下顯示可能:Host to Device TestDevice to Host TestDevice to Device TestUnidirectional Peer to Peer TestBidirectional Peer to Peer Test
      Device X : Ascend XXXDevice X為當前測試的設備ID,Ascend XXX為處理器類型。0表示源頭設備,1表示目標設備。
      ID0:表示測試d2d、d2h、h2d模式下Device 0的帶寬。0→1表示測試Device 0到Device 1的單向P2P帶寬。0?1表示測試Device 0和Device 1的雙向P2P帶寬。
      Size(Bytes)傳輸數據大小,單位為字節。
      Execute Times迭代次數
      Bandwidth(GB/s)芯片的帶寬
      Elapsed Time(us)總執行時長
    • 不指定源頭Device和目標Device的p2p樣例。

      ascend-dmi --bw -t p2p

      若返回如圖7所示信息,表示工具運行正常。

      圖7 不指定device的p2p方式帶寬測試示例
      img

  • 使用 Atlas 900 A3 SuperPoD 超節點 在p2p模式下,不指定源頭Card和目標Card的p2p樣例。

    ascend-dmi --bw -t p2p -q --mode card

    若返回如下所示信息,表示工具運行正常。

    [root@****]ascend-dmi --bw -t p2p -m card -q
    Unidirectional Peer to Peer Test Bandwidth Matrix(GB/s)C\C       0        1        2        3        4        5        6        70         ***      328.96   328.98   329.02   329.08   329.04   329.17   328.991         328.61   ***      328.58   328.56   328.48   328.55   328.53   328.572         328.57   328.49   ***      328.76   328.54   328.54   328.49   328.543         328.52   328.46   328.55   ***      328.72   328.50   328.54   328.544         329.02   329.05   328.99   329.03   ***      329.05   329.04   329.005         328.70   328.58   328.51   328.57   328.59   ***      328.56   328.566         328.56   328.53   328.63   328.58   328.61   328.57   ***      328.557         328.95   328.49   328.56   328.61   328.55   328.56   328.54   ***   Bidirectional Peer to Peer Test Bandwidth Matrix(GB/s)C\C       0        1        2        3        4        5        6        70         ***      540.51   540.39   540.50   541.80   541.90   541.05   540.341         540.90   ***      540.90   541.05   541.48   540.53   559.08   540.562         540.95   541.40   ***      540.61   540.45   540.76   540.80   541.783         540.97   540.87   541.61   ***      541.41   540.35   540.90   540.984         541.30   541.04   540.82   542.88   ***      540.40   541.13   540.685         540.68   541.14   541.86   540.80   540.44   ***      540.80   540.366         540.54   540.91   540.98   541.03   540.63   541.20   ***      541.277         540.51   542.78   540.91   541.69   540.22   540.95   541.02   ***   
    

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/85294.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/85294.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/85294.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

生產BUG集

磁盤達到閾值導致ES無法刪除數據 method [POST], host [http://xx.xxx.xxx.xxx:9200], URI [/security_event/_delete_by_query?slices1&requests_per_second-1&ignore_unavailablefalse&expand_wildcardsopen&allow_no_indicestrue&ignore_throttledtru…

基于FastAPI與Selenium的智能開關狀態管理系統實踐

引言 在工業物聯網(IIoT)與自動化控制場景中,設備狀態的實時監控與自然語言指令執行是提升效率的關鍵。本文將介紹一種基于 FastAPI 和 Selenium 的智能設備狀態管理系統,通過大語言模型(LLM)解析用戶指令…

主體和債項均為“AAA”等級 海爾消金發行10億金融債

6月18日,繼年內發行ABS、落地ESG掛鉤銀團貸后,海爾消費金融(以下簡稱“海爾消金”)在金融市場上又邁出重要一步,成功簿記發行2025年首期規模達10億元金融債,且主體信用等級仍為“AAA”。這一舉措為海爾消金…

n8n:輕松自動化您的工作流

借助開源自動化利器 n8n,釋放重復勞動的生產力! 引言 n8n 是一款免費、開源的工作流自動化工具,致力于幫助開發者和團隊通過連接各種應用和服務,實現重復任務的自動化處理。 它由 Jan Oberhauser 于 2019 年在德國柏林創建&…

Angular--Hello(TODO)

最近有個小錯誤,因為最近還是在看thingsboard,最近終于看到前端的代碼,突然發現怎么全是ts的文件,仔細一看原來并不是之前認為的AngularJS,而是Angular。。。我tm真的無語了,又要去重新學。。。 Angular的…

在 Linux 系統中通過 yum 安裝 Sublime Text

在 Linux 系統中通過 yum 安裝 Sublime Text 的步驟如下: ?步驟 1:導入 GPG 公鑰? sudo rpm -v --import https://download.sublimetext.com/sublimehq-rpm-pub.gpg 這一步用于驗證軟件包的合法性。 ?步驟 2:添加 Sublime Text 的軟件倉…

面向自主多星對地觀測的多智能體強化學習

大家讀完覺的有幫助記得及時關注和點贊!!! 抽象 近地軌道 (LEO) 衛星的指數級增長徹底改變了地球觀測 (EO) 任務,解決了氣候監測、災害管理等方面的挑戰。然而,多衛星系統…

flutter 短視頻相關插件選型

?插件名稱??核心優勢??缺點??短視頻場景適用性??推薦指數??video_player? (官方基礎庫)? 官方維護,跨平臺兼容性最佳(iOS/Android/macOS) ? 輕量級,無額外依賴,啟動速度快 ? 支持本地/網絡視頻、基礎播…

QTableView為例:Qt模型視圖委托(MVD)(Model-View-Delegate)

文章目錄 1. QT中的MVD模式2. View3. Model4. Delegate5. 以TableView為例 1. QT中的MVD模式 模型視圖委托(MVD)是Qt中特有的設計模式,類似MVC設計模式,將MVC設計模式中的Controller當做MVD中的Delegate,兩者的概念基…

uni-app總結3-項目新建運行調試

一、新建項目 通過HbuilderX新建 在點擊工具欄里的文件 -> 新建 -> 項目(快捷鍵CtrlN,MacOS上是CMD N): 左測Tab選擇uni-app類型,輸入工程名,選擇模板,Vue版本選擇3,其他不…

LeetCode 每日一題打卡|若谷的刷題日記 4day--移動零

移動零 題目: 給定一個數組 nums,編寫一個函數將所有 0 移動到數組的末尾,同時保持非零元素的相對順序。 請注意 ,必須在不復制數組的情況下原地對數組進行操作。 示例 1: 輸入: nums [0,1,0,3,12] 輸出: [1,3,1…

簡歷模板3——數據挖掘工程師5年經驗

姓名 / Your Name 數據挖掘工程師 | 5年經驗 | 推薦/畫像/反欺詐 📞 138-XXXX-XXXX | ?? your.emailexample.com | 🌐 github.com/yourname | 📍 北京 🎯 個人簡介 / Summary 5年大廠數據挖掘工程經驗,碩士學歷&am…

Vue添加圖片作為水印

直接上代碼 把圖片作為水印 <div class"info-warp"><div class"image-container"><img src"https://img.shetu66.com/2023/06/28/1687920981963810.png" /><div class"watermark-layer"><imgv-for"…

Conda 常用命令大全:從入門到高效使用

Conda 常用命令大全&#xff1a;從入門到高效使用 Conda 是 Python 生態中最流行的環境管理工具之一&#xff0c;它不僅可以管理 Python 包&#xff0c;還能創建隔離的虛擬環境&#xff0c;適用于數據分析、機器學習、科學計算等場景。本文將介紹 Conda 的常用命令&#xff0c…

【系統更新】TDuckX2.7升級!DSL邏輯、自定義Webhook、AI考試來襲

No.1 支持自定義 DSL 公式 邏輯規則支持自定義 DSL&#xff0c;通過公式表達式構建復雜邏輯條件&#xff0c;能夠支持選項、矩陣、自增表單中的內容控制&#xff0c;可以滿足多變業務場景&#xff0c;極大提升了邏輯配置的靈活性。 No.2 擴展值新增“名稱字段” 在批量生成擴…

安卓9.0系統修改定制化____深入解析安卓 9.0 各手機分區:功能、作用與差異 基礎篇二

在安卓 9.0 系統中,手機內部存儲被劃分為多個不同的分區,每個分區都承擔著獨特且重要的職責。深入了解這些分區,對于我們理解安卓系統運行機制、進行系統優化,甚至是刷機等操作都有著極大的幫助。尤其是rom定制與修改方面。 通過博文了解?????? 1??????-----了…

自動駕駛技術路線之爭:視覺派、激光雷達派與融合派,誰將引領未來?

自動駕駛的賽道上&#xff0c;科技巨頭、傳統車企和初創公司紛紛亮出“看家本領”。但你是否注意到&#xff0c;不同玩家的“眼睛”和“大腦”配置大相徑庭&#xff1f;特斯拉CEO馬斯克曾稱“激光雷達是徒勞的拐杖”&#xff0c;而國內華為、小鵬等企業則堅定擁抱激光雷達。這背…

Spring Cloud Alibaba 中間件

Spring Cloud Alibaba 中間件 &#x1f517; Spring官方介紹 [??Spring官方對Spring Cloud Alibaba的更新不及時] &#x1f517; Spring Cloud Alibaba官網 &#x1f4dd; 代碼記錄 Nacos&#xff08;服務注冊與發現&#xff09; Nacos(Dynamic Naming and Configuration…

uniapp+vue中 多次觸發onLoad/created

控制臺log輸出為何頻頻失蹤?   wxss代碼為何頻頻失效?   wxml布局為何亂作一團?   究竟是道德的淪喪?還是人性的缺失?   讓我們一起來 走 跑進科學 前言 uniapp中開發網頁h5&#xff0c;莫名其妙每次請求接口都會執行兩次&#xff0c;仔細排查發現是onLoadonShow…

[論文閱讀] 人工智能+軟件工程 | 軟件工程中非代碼工作的LLM能力評估

軟件工程中非代碼工作的LLM能力評估 論文信息 misc{2506.10833v1,title{Evaluating Large Language Models on Non-Code Software Engineering Tasks},author{Fabian C. Pea and Steffen Herbold},year{2025},eprint{2506.10833},archivePrefix{arXiv},primaryClass{cs.SE} }…