vscode調試pytorch分布式訓練

?launch.json文件如下"cwd"= "${fileDirname}"表示代碼調試的根目錄是當前你調試的文件,也就是pretrain.py所在的目錄。其他路徑參數都是相對這個目錄的

如果改成"cwd"= "${workspaceFolder}" 表示代碼調試的根目錄是打開的工作目錄,也就是你vscode打開的工程文件夾的目錄

"program"參數是是我們要運行的文件,默認是"program": "${file}",也就是你要調試的文件本身,

比如不調試分布式的話,就是pretrain.py,分布式的話要改成"program": "/root/miniconda3/lib/python3.10/site-packages/torch/distributed/run.py"表示我們其實是要運行這個文件,然后加入args參數,把pretrain.py作為一個參數

注意:pytorch1.9之后torch.distributed.launch 即將被廢棄,取而代之的是torch.distributed.run

https://www.cnblogs.com/tencent-cloud-native/p/15186403.html

而torchrun腳本就是torch.distributed.run的內容,所以在終端運行的話

python -m torch.distributed.run --nproc_per_node=8 pretrain.py --config ./configs/Pretrain.yaml --output_dir output/Pretrain

torchrun --nproc_per_node=8 pretrain.py --config ./configs/Pretrain.yaml --output_dir output/Pretrain

二者是等價的,終端直接輸入torchrun

root@autodl-container-115911b7ae-3dcde09d:~# torchrun
usage: torchrun [-h] [--nnodes NNODES] [--nproc_per_node NPROC_PER_NODE][--rdzv_backend RDZV_BACKEND] [--rdzv_endpoint RDZV_ENDPOINT][--rdzv_id RDZV_ID] [--rdzv_conf RDZV_CONF] [--standalone][--max_restarts MAX_RESTARTS] [--monitor_interval MONITOR_INTERVAL][--start_method {spawn,fork,forkserver}] [--role ROLE] [-m] [--no_python][--run_path] [--log_dir LOG_DIR] [-r REDIRECTS] [-t TEE][--node_rank NODE_RANK] [--master_addr MASTER_ADDR][--master_port MASTER_PORT]training_script ...
torchrun: error: the following arguments are required: training_script, training_script_args
root@autodl-container-115911b7ae-3dcde09d:~# which torchrun
/root/miniconda3/bin/torchrun

但vscode調試配置如下,如果直接用"program": "/root/miniconda3/bin/torchrun"也是可以的

?"name": "Python: Current File", 可以改成?"name": "Python: torchrun" 不過這個不影響,只是調試窗口名字

{// 使用 IntelliSense 了解相關屬性。 // 懸停以查看現有屬性的描述。// 欲了解更多信息,請訪問: https://go.microsoft.com/fwlink/?linkid=830387"version": "0.2.0","configurations": [{"name": "Python: Current File","type": "python","request": "launch","program": "/root/miniconda3/lib/python3.10/site-packages/torch/distributed/run.py","console": "integratedTerminal","justMyCode": false,"cwd": "${fileDirname}","args": ["--nproc_per_node=1","pretrain.py","--config=./configs/pretrain.yaml","--output_dir=output/Pretrain"],// "env": {"CUDA_VISIBLE_DEVICES":"0"},}]
}

最后:建議在每個工程都創建一個.vscode文件夾,在里面建一個lanuch.json文件,因為每個工程運行腳本肯定都不一樣,不要在/root目錄搞一個.vscode文件夾,不然你每次都是打開/root文件夾都要修改lanuch.json的內容,每次VSCODE都只打開一個工程,不要直接打開root目錄

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/211224.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/211224.shtml
英文地址,請注明出處:http://en.pswp.cn/news/211224.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Python百寶箱】構筑銅墻鐵壁:Python 認證與授權庫實戰指南

Python認證與授權:構建安全、可擴展的應用 前言 在當今數字化時代,用戶認證和授權是構建安全、可信任的應用程序的基石。Python生態系統提供了豐富而強大的庫和工具,以支持多種身份驗證和授權方案。本文將深入探討一系列Python庫&#xff0…

MyBatis框架中的5種設計模式總結

前言 MyBatis框架中使用的5種設計模式分別是:1、建造者模式(生成器模式)。2、工廠模式。3、單例模式。4、代理模式。5、適配器模式。 1、建造者模式(生成器模式) 在MyBatis環境的初始化過程中,SqlSessio…

Redis 環境搭建2

文章目錄 第2關:使用 Redis 第2關:使用 Redis 本文是接著上篇文章寫的第二關代碼,部分人再進入第二關時不會保留第一關的配置的環境,可以通過下面一句代碼進行檢驗。 redis-cli -p 7001 -c如果進入到了redis界面就是有環境&…

問題:batchnormal訓練單個batch_size就會報錯嗎

Batch Normalization(批標準化)是一種深度學習中的正則化技巧,它可以改進網絡的訓練過程。在訓練神經網絡時,Batch Normalization可以幫助解決內部協變量偏移(Internal Covariate Shift)的問題。 在標準的…

pytorch serve開始-Getting started

官網鏈接 Getting started — PyTorch/Serve master documentation 安裝TorchServe和torch-model-archiver 安裝依賴 注意::對于Conda,運行Torchserve需要Python >3.8。 對于基于Debian的系統/ MacOS CPU python ./ts_scripts/install_dependencies.py 對…

【Hadoop】高可用集群搭建

知識目錄 一、寫在前面💕二、Zookeeper安裝?三、Hadoop配置?四、Hadoop HA自動模式?五、HA腳本分享?七、結語💕 一、寫在前面💕 大家好!這篇文章是我在搭建Hdfs的HA(高可用)時寫下的詳細筆記與感想,希望能幫助到大…

Notes數據直接在Excel中統計

大家好,才是真的好。 我希望你看過前面兩篇內容《Domino REST API安裝和運行》和《Domino REST API安裝和運行》,因為今天我們正是使用REST API方式在Excel中查詢和統計Notes數據。 不過首先你得知道一個OData協議,全名Open Data Protocol(…

五花八門客戶問題(BUG) - 用好strace2

目錄 前言 strace與gdb的沖突 細看strace 前言 上文通過strace trace它自個看到了strace的原理:確實是調用了ptrace函數實現的。今天我們再細看一看。 strace與gdb的沖突 既然它兩底層都是用ptrace,那么一定不能同時用在同一個進程上。實例驗證: [root]# strace sleep…

布隆過濾器,Redis之 bitmap,場景題【如果微博某個大V發了一條消息,怎么統計有多少人看過了】

文章目錄 一、什么是 bitmap1-1、Bitmap 相關命令二、bitmap 和 set 對比2-1、數據準備2-2、內存對比2-3、性能對比三、布隆過濾器3-1、理論主要作用如何將數據放到過濾器內呢?注意事項布隆過濾器 有兩個重要的參數3-2、代碼實現3-3、Java中的hash函數最近面試,面試官問了一個…

Windows系統Java開發環境安裝

總結一下Java軟件開發工程師常見的環境的安裝,僅限Windows環境。 以下下載鏈接均來自官網,網絡條件自己克服。 目錄 1. JDKJDK Oracle 官網下載地址配置系統環境變量 2. Mavenapache maven 官網地址本地倉庫和中央倉庫配置配置系統環境變量 3. GitGit 官…

springboot3 liquibase SQL執行失敗自動回滾,及自動打tag

一&#xff1a; 自動執行回滾&#xff0c; 已執行成功的忽略&#xff0c;新sql執行失敗則執行新sql文件中的回滾sql pom.xml <dependency> <groupId>org.liquibase</groupId> <artifactId>liquibase-core</artifactId> <version>4.25.0&…

【工廠方法】設計模式項目實踐

前言 以采集數據處理邏輯為例&#xff0c;數據采集分為不同種類如&#xff1a;MQTT、MODBUS、HTTP等&#xff0c;不同的采集數據有不同的解析處理邏輯。但總體解析處理步驟是固定的。可以使用工廠方法設計模式簡化代碼&#xff0c;讓代碼變得更加優雅。 代碼實踐 抽象類 總體…

分布式環境下的session 共享-基于spring-session組件和Redis實現

1、問題概述 不是所有的項目都是單機模式的&#xff0c;當一個項目服務的局域比較廣&#xff0c;用戶體量比較大&#xff0c;數據量較大的時候&#xff0c;我們都會將項目部署到多臺服務器上&#xff0c;這些個服務器都是分布在不同的區域&#xff0c;這樣實現了項目的負載和并…

Redis有序集合對象

一.編碼 有序集合的編碼可以是ziplist或者skiplist。 ziplist編碼的有序集合對象使用壓縮列表作為底層實現&#xff0c;每一個集合元素使用緊挨在一起的兩個壓縮列表節點來保存。第一個節點保存元素的成員(member)&#xff0c;而第二個元素則保存元素的分值(score)。 127.0.0.…

鴻蒙app獲取文本控件按鈕控件_修改控件名稱_按鈕觸發事件_提示信息顯示

鴻蒙app獲取文本控件按鈕控件_修改控件名稱_按鈕觸發事件_ 點擊啟動&#xff1a;提示信息顯示 package com.example.myapplication.slice;import com.example.myapplication.ResourceTable; import ohos.aafwk.ability.AbilitySlice; import ohos.aafwk.content.Intent; impor…

12.1電梯控制器——文檔記錄

《數字邏輯》實驗報告 實驗名稱 項目三 電梯控制器設計 一、實驗目的 設計一個多樓層的電梯控制器系統&#xff0c;并能在開發板上模擬電梯運行狀態。可以利用按鍵作為呼叫按鍵&#xff0c;數碼管顯示電梯運行時電梯所在樓層&#xff0c;led燈顯示樓層叫梯狀態。 二、實…

太良心了!微軟面向初學者,開源機器學習、數據科學、AI、LLM

大家好&#xff0c;推薦幾個質量上乘且完全免費的微軟開源課程&#xff0c;由粉絲小伙伴梳理&#xff0c;分享給大家。 文末可以加我們粉絲群 面向初學者的機器學習課程 ML for beginners banner 地址&#xff1a;https://microsoft.github.io/ML-For-Beginners/#/ 學習經典…

[Linux] Web基礎知識與http協議

一、HTML 1.1 HTML 的概念 HTML被稱為超文本標記語言。 它是規范和標準. 它通過標記符號來標記網頁中出現的各個部分。網頁文件本身就是一種文本文件。 通過向文本文件添加標記&#xff0c;您可以告訴瀏覽器如何顯示其中的內容。 HTML命令可以描述文本、圖形、動畫、聲音、表格…

講解把一個文件夾里面的內容復制到另一個文件夾中的操作

&#x1f38a;專欄【Java小練習】 &#x1f354;喜歡的詩句&#xff1a;天行健&#xff0c;君子以自強不息。 &#x1f386;音樂分享【如愿】 &#x1f384;歡迎并且感謝大家指出小吉的問題&#x1f970; 文章目錄 &#x1f354;需求?思路?代碼?效果 &#x1f384;如果要復制…

Vue3:表格單元格內容由:圖標+具體內容 構成

一、背景 在Vue3項目中&#xff0c;想讓單元格的內容是由 &#xff1a;圖標具體內容組成的&#xff0c;類似以下效果&#xff1a; 二、圖標 Element-Plus 可以在Element-Plus里面找是否有符合需求的圖標iconfont 如果Element-Plus里面沒有符合需求的&#xff0c;也可以在這…