Sbatch, Salloc提交任務相關

  1. salloc

申請計算節點,然后登錄到申請到的計算節點上運行指令;
salloc的參數與sbatch相同,該部分先介紹一個簡單的使用案例;隨后介紹一個GPU的使用案例;最后介紹一個跨節點使用案例;
首先是一個簡單的例子;
申請一個節點6個核心,并跳轉到該節點上運行程序;

在這里插入圖片描述在這里插入圖片描述2. Slurm 作業調度系統使用指南
在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述在這里插入圖片描述

4.1 參數說明以下所有參數在 srun, sbatch, salloc 中均可以使用。更多參數見srun --help, sbatch --help, salloc --help。-c, --cpu-per-task=NCPUs        #指定每個進程使用核數,不指定默認為1
-e, --error=error_filename      #指定錯誤文件輸出
-J, --job-name=JOBNAME          #指定作業名稱
--mail-type=END/FAIL/ALL        #郵件提醒,可選:END,FAIL,ALL
--mail-user=mail_address        #通知郵箱地址
-n, --ntask=NTASKs #指定總進程數;不使用cpus-per-task,可理解為進程數即為核數 
--ntasks-per-node=N #指定每個節點進程數/核數,使用-n參數后變為每個節點最多運行的進程數
-N, --nodes=N                   #指定節點數量
-o, --output=out_filename       #指定輸出文件輸出
-p, --partion=debug             #指定分區
-t, --time=dd-hh:mm:ss          #作業最大運行時間
-w, --nodelist=node[1,2]        #指定優先使用節點,不可與避免節點沖突
-x, --exclude=node[3,5-6]       #指定避免使用節點,不可與優先節點沖突
--mem-per-cpu=MB                #指定計算cpu最大占用內存大小

4.2 交互模式 Srun
交互式作業提交,提交命令后,等待作業執行完成之后返回命令行窗口。
Demo of srun

srun -J JOBNAME -p debug -N 2 -c 1 -n 32 --ntasks-per-node=16 -w node[3,4] -x node[1,5-6] --time=dd-hh:mm:ss --output=file_name --error=file_name --mail-user=address --mail-type=ALL mpirun -n 64 ./iPic3D ./inputfile/test.inp

同 Demo of sbatch
4.3 批處理模式 Sbatch
批處理作業是指用戶編寫作業腳本,指定資源需求約束,提交后臺執行作業。提交批處理作業的命令為 sbatch,用戶提交命令即返回命令行窗口,但此時作業在進入調度狀態,在資源滿足要求時,分配完計算結點之后,系統將在所分配的第一個計算結點(而不是登錄結點)上加載執行用戶的作業腳本。批處理作業的腳本為一個文本文件,腳本第一行以 “#!” 字符開頭,并制定腳本文件的解釋程序,如 sh,bash。
運行 sbatch filename 來提交任務;計算開始后,工作目錄中會生成以 slurm 開頭的.out 文件為輸出文件(不指定輸出的話)。
Demo of sbatch
保存在運行程序目錄下即可,文件名隨意(可以無后綴,內容文本格式即可);作業提交命令sbatch filename

#!/bin/bash                     %指定運行shell
#提交單個作業
#SBATCH --job-name=JOBNAME      %指定作業名稱
#SBATCH --partition=debug       %指定分區
#SBATCH --nodes=2               %指定節點數量
#SBATCH --cpus-per-task=1       %指定每個進程使用核數,不指定默認為1
#SBATCH -n 32       %指定總進程數;不使用cpus-per-task,可理解為進程數即為核數
#SBATCH --ntasks-per-node=16    %指定每個節點進程數/核數,使用-n參數(優先級更高),變為每個節點最多運行的任務數
#SBATCH --nodelist=node[3,4]    %指定優先使用節點
#SBATCH --exclude=node[1,5-6]   %指定避免使用節點
#SBATCH --time=dd-hh:mm:ss      %作業最大運行時長,參考格式填寫
#SBATCH --output=file_name      %指定輸出文件輸出
#SBATCH --error=file_name       %指定錯誤文件輸出
#SBATCH --mail-type=ALL         %郵件提醒,可選:END,FAIL,ALL
#SBATCH --mail-user=address     %通知郵箱地址source /public/home/user/.bashrc   #導入環境變量文件mpirun -n 32 ./iPic3D ./inputfiles/test.inp #運行命令

同 Demo of srun
4.4 分配模式 Salloc
結點資源搶占命令。該命令支持用戶在提交作業前,搶占所需計算資源(此時開始計算所用機時)。需請求資源,然后在獲取節點后登錄到計算節點。目前作者使用設備可直接登錄計算節點,暫未使用。 sacct 命令也未啟用,暫無說明,有需要可在文末參考網頁查看。
5. Scontrol
5.1 信息查看

scontrol show job JOBID         #查看作業的詳細信息
scontrol show node              #查看所有節點詳細信息
scontrol show node node-name    #查看指定節點詳細信息
scontrol show node | grep CPU   #查看各節點cpu狀態
scontrol show node node-name | grep CPU #查看指定節點cpu狀態

5.2 更新作業
在任務開始前卻發現作業的屬性寫錯了(例如提交錯了分區,修改名字),取消了重新排隊似乎很不劃算。如果作業恰好 沒在運行,我們是可以通過 scontrol 命令來更新作業的屬性

scontrol update jobid=JOBID ... #...為下面參數
reqnodelist=<nodes>
reqcores=<count>
name=<name>
nodelist=<nodes>
excnodelist=<nodes>
numcpus=<min_count-max_count>
numnodes=<min_count-max_count>
numtasks=<count>
starttime=yyyy-mm-dd
partition=<name>
timelimit=d-h:m:s
mincpusnode=<count>
minmemorycpu=<megabytes>
minmemorynode=<megabytes>

作業調度系統 · 北京大學高性能計算使用指南
SLURM 使用參考
Slurm 作業調度系統 — 上海交大超算平臺用戶手冊 文檔
SLURM使用基礎教程 - 曙光先進計算
Slurm User Guide for Great Lakes | ITS Advanced Research Computing

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/213140.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/213140.shtml
英文地址,請注明出處:http://en.pswp.cn/news/213140.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于Java健身房課程管理系統

基于Java健身房課程管理系統 功能需求 1、課程信息管理&#xff1a;系統需要能夠記錄和管理所有課程的詳細信息&#xff0c;包括課程名稱、教練信息、課程時間、課程地點、課程容量等。管理員和教練可以添加、編輯和刪除課程信息。 2、會員信息管理&#xff1a;系統需要能夠…

無服務器監控工具的演變:提高效率和性能

無服務器計算的興起改變了應用程序的構建和部署方式&#xff0c;提供了無與倫比的可擴展性&#xff0c;減少了基礎設施管理并提高了成本效率。隨著無服務器架構變得越來越流行&#xff0c;對有效監控工具的需求對于確保最佳性能和可靠性變得至關重要。 在本文中&#xff0c;我…

Go開發運維:Go服務發布到K8S集群

目錄 一、實驗 1.Go服務發布到k8s集群 二、問題 1.如何從Harbor拉取鏡像 一、實驗 1.Go服務發布到k8s集群 &#xff08;1&#xff09;linux機器安裝go(基于CentOS 7系統) yum install go -y &#xff08;2&#xff09;查看版本 go version &#xff08;3&#xff09;創…

【參天引擎】華為參天引擎內核架構專欄開始更新了,多主分布式數據庫的特點,類oracle RAC國產數據開始出現了

cantian引擎的介紹 ?專欄內容&#xff1a; 參天引擎內核架構 本專欄一起來聊聊參天引擎內核架構&#xff0c;以及如何實現多機的數據庫節點的多讀多寫&#xff0c;與傳統主備&#xff0c;MPP的區別&#xff0c;技術難點的分析&#xff0c;數據元數據同步&#xff0c;多主節點的…

Python 中 4 個高效的技巧(建議收藏)

今天我想和大家分享 4 個省時的 Python 技巧&#xff0c;可以節省 10~20% 的 Python 執行時間。 反轉列表 Python 中通常有兩種反轉列表的方法&#xff1a;切片或 reverse() 函數調用。這兩種方法都可以反轉列表&#xff0c;但需要注意的是內置函數 reverse() 會更改原始列表…

【數據結構】C語言結構體詳解

目錄 前言 一、結構體的定義 二、定義結構體變量 三、結構體變量的初始化 四、使用typedef聲明新數據類型名 五、指向結構體變量的指針 總結 &#x1f308;嗨&#xff01;我是Filotimo__&#x1f308;。很高興與大家相識&#xff0c;希望我的博客能對你有所幫助。 &#x1f4a1…

做題筆記:SQL Sever 方式做牛客SQL的題目--查詢每天刷題通過數最多的前二名用戶

----查詢每天刷題通過數最多的前二名用戶id和刷題數 現有牛客刷題表questions_pass_record&#xff0c;請查詢每天刷題通過數最多的前二名用戶id和刷題數&#xff0c;輸出按照日期升序排序&#xff0c;查詢返回結果名稱和順序為&#xff1a; date|user_id|pass_count 表單創建…

Spring JDBC和事務管理

Spring JDBC是Spring框架用來處理關系型數據庫的模塊&#xff0c;對JDBC的API進行了封裝。 Spring JDBC的核心類為JdbcTemplate&#xff0c;提供數據CRUD方法 Spring JDBC使用步驟 Maven工程引入依賴spring-jdbc <dependency><groupId>org.springframework<…

springboot 整合nacos

Spring Boot整合Nacos 大家好&#xff0c;我是微賺淘客系統3.0的小編&#xff0c;也是冬天不穿秋褲&#xff0c;天冷也要風度的程序猿&#xff01;今天&#xff0c;我將帶領大家探索一個讓微服務架構更加便捷的利器——Spring Boot整合Nacos。在當今快速發展的互聯網時代&#…

應用安全:JAVA反序列化漏洞之殤

應用安全:JAVA反序列化漏洞之殤 概述 序列化是讓Java對象脫離Java運行環境的一種手段&#xff0c;可以有效的實現多平臺之間的通信、對象持久化存儲。Java 序列化是指把 Java 對象轉換為字節序列的過程便于保存在內存、文件、數據庫中&#xff0c;ObjectOutputStream類的 wri…

MYSQL創建用戶以及解決MYSQL新建數據庫看不到相關數據庫信息的解決方案

MYSQL創建用戶以及解決MYSQL新建數據庫看不到相關數據庫信息的解決方案 首先 我們在root用戶下&#xff0c;創建一個mysql用戶賬戶 如創建一個test用戶 密碼123456 命令如下&#xff1a; CREATE USER ‘test’‘localhost’ IDENTIFIED BY ‘123456’; 創建了一個db1的數據庫 …

唯創知音WTN6040F-8S語音芯片在空氣消毒機中的應用:提升用戶體驗與健康保障

在現代生活中&#xff0c;空氣質量成為人們越來越關注的問題。空氣消毒機作為一種能夠凈化空氣、殺滅病毒細菌的設備&#xff0c;受到了廣大消費者的青睞。然而&#xff0c;對于很多用戶來說&#xff0c;操作空氣消毒機可能存在一定的困惑和不便。為了解決這一問題&#xff0c;…

對Spring源碼的學習:Bean實例化流程

目錄 SpringBean實例化流程 Spring的后處理器 Bean工廠后處理器 Bean后處理器 SpringBean實例化流程 Spring容器在進行初始化時&#xff0c;會將xml配置的<bean>的信息封裝成一個BeanDefinition對象&#xff0c;所有的BeanDefinition存儲到一個名為beanDefinitionMa…

Docker容器的可視化管理工具—DockerUI本地部署與遠程訪問

文章目錄 前言1. 安裝部署DockerUI2. 安裝cpolar內網穿透3. 配置DockerUI公網訪問地址4. 公網遠程訪問DockerUI5. 固定DockerUI公網地址 前言 DockerUI是一個docker容器鏡像的可視化圖形化管理工具。DockerUI可以用來輕松構建、管理和維護docker環境。它是完全開源且免費的。基…

【GlobalMapper精品教程】066:shp轉JSON(GeoJson)案例實現

文章目錄 一、JSON與GeoJson的區別二、globalmapper實現shp轉JSON1. 加載shp數據2. shp轉json一、JSON與GeoJson的區別 JSON(JavaScript Object Notation)是一種輕量級的數據交換格式,它基于JavaScript的語法,可以將JavaScript對象中表示的一組數據轉換為字符串,在函數之…

ElasticSearch之cat recovery API

命令樣例如下&#xff1a; curl -X GET "https://localhost:9200/_cat/recovery?vtrue&pretty" --cacert $ES_HOME/config/certs/http_ca.crt -u "elastic:ohCxPHQBEs5*lo7F9"執行結果輸出如下&#xff1a; index shard time type sta…

2023 CCF中國軟件大會(CCF ChinaSoft) “程序語義深度理解前沿進展”論壇成功召開...

2023年12月2日&#xff0c;2023年度CCF中國軟件大會軟件程序語義深度理解前沿進展論壇成功召開。 本次論壇由南京大學卜磊老師和國防科技大學陳振邦老師主持&#xff0c;計算機研究與發展期刊代表侯麗珊老師致辭&#xff0c;旨在反映程序語義理解及其應用相關研究前沿進展與實踐…

Vue之模板語法

模板語法有兩大類&#xff1a; 1.插值語法 2.指令語法 讓我為大家介紹一下吧&#xff01; 一、插值語法 功能:用于解析標簽體內容。 寫法: {{xxx}}&#xff0c;xxx是js表達式&#xff0c;且可以直接讀取到data中的所有屬性。 舉個例子&#xff1a; <!DOCTYPE html> &l…

探索未來新趨勢:鴻蒙系統的嶄新時代

探索未來新趨勢&#xff1a;鴻蒙系統的嶄新時代 隨著科技的不斷發展&#xff0c;操作系統作為計算機和移動設備的核心&#xff0c;扮演著至關重要的角色。近年來&#xff0c;一種備受矚目的操作系統——鴻蒙系統&#xff08;HarmonyOS&#xff09;嶄露頭角&#xff0c;正引領著…

uniapp 微信小程序請求攔截器 接口封裝

前言&#xff1a; 請求攔截器可以在我們需要傳遞請求頭的時候使用&#xff0c;例如&#xff1a;token 也會在當token發生變化的時候給予響應&#xff0c;所以我們做好對應的判斷即可 話不多說&#xff0c;直接進入正題&#xff1a; 1.首先在根目錄創建common文件夾&#xff0c…