用LLama factory時報類似Process 2504721 got signal: 1的解決方法

之前用nohup來遠程跑LLama factory微調腳本,是沒有問題的,但今天發現運行類似下面這個命令時,

nohup llamafactory-cli train examples/train_qlora/qwen_lora.yaml

只要一關閉ssh session,就會終止訓練,報類似:

nohup torch.distributed.elastic.multiprocessing.api.SignalException: Process 2504721 got signal: 1

的錯。解決方法其實也很簡單,參考了一下下面這些網頁:

nohup后臺運行命令,關閉shell后進程會終止_nohup 退出服務器后進程消失-CSDN博客

llamafactory大模型微調單卡轉多卡出現SignalException: Process 3232810 got signal: 1錯誤_torch.distributed.elastic.multiprocessing.api.sign-CSDN博客

針對我上面這個命令,解決方法是,首先輸入:

nohup llamafactory-cli train examples/train_qlora/qwen_lora.yaml &

然后回車,再在終端里輸入exit,然后再關閉ssh session即可。也有朋友說可以用tmux,但是我嫌麻煩就沒有嘗試:

nohup訓練pytorch模型時的報錯以及tmux的簡單使用 - gy77 - 博客園

就簡單總結這么多,主要是現在大模型微調太費事,如果跑了一半出現這種問題真的很讓人崩潰。?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/73840.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/73840.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/73840.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python常用內置時間函數+藍橋杯時間真題

1.time 1.1 time.time() 時間戳指:1970年1月1日開始到現在所經過的秒數 import time print(time.time()) # 輸出可得1970年1月1日開始到執行此代碼所經過的秒數 1.2 time.localtime() 返回一個當前時間的時間對象,具體信息,并且可以單獨…

一個用 C 語言打印出所有三位數水仙花數的程序

水仙花數(Narcissistic number)是指一個三位數,其各位數字的立方和等于該數本身。例如:153 是一個水仙花數,因為 (1^3 5^3 3^3 153)。 以下是一個用 C 語言打印出所有三位數水仙花數的程序: 代碼實現 …

利用 VSCode 配置提升 vibe coding 開發效率

利用 VSCode 配置提升 vibe coding 開發效率 Vibe Coding(氛圍編程)是一種基于AI的編程方法,其核心在于通過自然語言描述軟件需求,再由大規模語言模型(LLM)自動生成代碼,從而實現對傳統手寫編程…

練習題:110

目錄 Python題目 題目 題目分析 需求理解 關鍵知識點 實現思路分析 代碼實現 代碼解釋 函數定義: 計算值的總和: 測試函數: 運行思路 結束語 Python題目 題目 定義一個函數,接受一個字典作為參數,返回字…

處理 Linux 信號:進程控制與異常管理的核心

個人主頁:chian-ocean 文章專欄-Linux 前言: 在 Linux 操作系統中,信號是用于進程間通信的一種機制,能夠向進程發送通知,指示某些事件的發生。信號通常由操作系統內核、硬件中斷或其他進程發送。接收和處理信號是 Li…

通信協議之串口

文章目錄 簡介電平標準串口參數及時序USART與UART過程引腳配置 簡介 點對點,只能兩設備通信只需單向的數據傳輸時,可以只接一根通信線當電平標準不一致時,需要加電平轉換芯片(一般從控制器出來的是信號是TTL電平)地位…

Unity編輯器功能及拓展(1) —特殊的Editor文件夾

Unity中的Editor文件夾是一個具有特殊用途的目錄,主要用于存放與編輯器擴展功能相關的腳本和資源。 一.糾纏不清的UnityEditor 我們Unity中進行游戲構建時,我們經常遇到關于UnityEditor相關命名空間丟失的報錯,這時候,只得將報錯…

工具類-csv文件導入數據庫思路

首先,讓我們來看下數據庫建表語句: CREATE TABLE behavior_reports (id BIGINT PRIMARY KEY AUTO_INCREMENT COMMENT 報告ID,report_type VARCHAR(50) NOT NULL COMMENT 報告類型(daily, weekly, monthly),start_date DATE NOT NULL COMMENT 開始日期,e…

軟件工程之軟件開發模型(瀑布、迭代、敏捷、DevOps)

1. 瀑布模型(Waterfall Model) 定義與流程 瀑布模型是線性順序的開發流程,包含需求分析、設計、編碼、測試、維護等階段,每個階段完成后才能進入下一階段,類似“瀑布流水”逐級推進。 核心特點 嚴格階段劃分&#…

FreeRTOS與RT-Thread內存分配對比分析

一、動態內存分配策略 ?FreeRTOS ?分配算法多樣性:提供5種動態內存管理算法(heap_1至heap_5),覆蓋從簡單到復雜的場景。例如: heap_1:僅支持分配不支持釋放,適用于固定任務棧分配。heap_4&…

202519 | Mybatis-Plus

快速入門 MyBatis-Plus(簡稱 MP)是 MyBatis 的增強工具,它在 MyBatis 的基礎上只做增強不做改變,簡化了開發,提高了效率。以下是 MyBatis-Plus 的快速入門指南,幫助您快速上手使用。 1. 環境準備 JDK&…

Linux C語言調用第三方庫,第三方庫如何編譯安裝

在 Linux 環境下使用 C 語言調用第三方庫時,通常需要先對第三方庫進行編譯和安裝。以下為你詳細介紹一般的編譯安裝步驟,并給出不同類型第三方庫(如使用 Makefile、CMake 構建系統)的具體示例。 一般步驟 1. 獲取第三方庫源碼 …

linux基本命令(1)--linux下的打包命令 -- tar 和gzip

tar 解壓 ,打包 語法:tar [主選項輔選項] 文件或者目錄 使用該命令時,主選項是必須要有的,它告訴tar要做什么事情,輔選項是輔助使用的,可以選用。 主選項: c 創建新的檔案文件。如果用戶想備…

Python 序列構成的數組(對序列使用+和_)

對序列使用和* Python 程序員會默認序列是支持 和 * 操作的。通常 號兩側的序列由 相同類型的數據所構成,在拼接的過程中,兩個被操作的序列都不會被 修改,Python 會新建一個包含同樣類型數據的序列來作為拼接的結果。 如果想要把一個序列…

[ C語言 ] | 從0到1?

目錄 認識計算機語言 C語言 工欲善其事必先利其器 第一個C語言代碼 這一些列 [ C語言 ] ,就來分享一下 C語言 相關的知識點~ 認識計算機語言 我們說到計算機語言,語言,就是用來溝通的工具,計算機語言呢?就是我們…

【通道注意力機制】【SENet】Squeeze-and-Excitation Networks

0.論文摘要 卷積神經網絡建立在卷積操作的基礎上,通過融合局部感受野內的空間和通道信息來提取有意義的特征。為了增強網絡的表示能力,最近的一些方法展示了增強空間編碼的好處。在本研究中,我們專注于通道關系,并提出了一種新穎…

kubernetes Calico(CNI) NetworkPolicy 流量管理 設置networkpolicy 策略 下集

1、kubernetes 網絡策略(網絡隔離策略) Network Policy 是 Kubernetes 中用于控制 Pod 之間網絡通信的一種機制。它通過定義規則,限制哪些 Pod 或外部實體可以與目標 Pod 通信(基于標簽、命名空間、端口等)。Network …

sqlmap基礎命令總結

?注意事項:僅用于授權測試,避免非法使用。 目錄 ?一、基礎命令 ?二、數據庫信息獲取 ?三、繞過 WAF/IDS ?四、文件系統與系統命令 ?五、高級功能與優化 ?六、實戰示例 ?一、基礎命令 ?檢測注入點 sqlmap -u "http://target.com/index.php?id1&…

Unity光線傳播體積(LPV)技術實現詳解

一、LPV技術概述 光線傳播體積(Light Propagation Volumes)是一種實時全局光照技術,通過將場景中的間接光信息存儲在3D網格中,實現動態物體的間接光照效果。 核心優勢: 實時性能:相比傳統光照貼圖,支持動態場景 硬件…

SpringBoot (一) 自動配置原理

目錄 一 自動配置 1:數據源的手動配置 1:SpringBoot的自動配置 二 自動配置的完整流程:(底層) 1. 場景化依賴與Starter機制 2. 主程序入口與注解驅動 3. 自動配置類的加載與篩選 4. 自動配置類的實現邏輯 5. 自動配置的觸發與執行流…