用LLama factory時報類似Process 2504721 got signal: 1的解決方法

用LLama factory時報類似Process 2504721 got signal: 1的解決方法

pingmian/2025/8/31 20:35:16/文章來源:https://blog.csdn.net/qysh123/article/details/146717916

之前用nohup來遠程跑LLama factory微調腳本，是沒有問題的，但今天發現運行類似下面這個命令時，

nohup llamafactory-cli train examples/train_qlora/qwen_lora.yaml

只要一關閉ssh session，就會終止訓練，報類似：

nohup torch.distributed.elastic.multiprocessing.api.SignalException: Process 2504721 got signal: 1

的錯。解決方法其實也很簡單，參考了一下下面這些網頁：

nohup后臺運行命令，關閉shell后進程會終止_nohup 退出服務器后進程消失-CSDN博客

llamafactory大模型微調單卡轉多卡出現SignalException: Process 3232810 got signal: 1錯誤_torch.distributed.elastic.multiprocessing.api.sign-CSDN博客

針對我上面這個命令，解決方法是，首先輸入：

nohup llamafactory-cli train examples/train_qlora/qwen_lora.yaml &

然后回車，再在終端里輸入exit，然后再關閉ssh session即可。也有朋友說可以用tmux，但是我嫌麻煩就沒有嘗試：

nohup訓練pytorch模型時的報錯以及tmux的簡單使用 - gy77 - 博客園

就簡單總結這么多，主要是現在大模型微調太費事，如果跑了一半出現這種問題真的很讓人崩潰。?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/73840.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/73840.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/73840.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

python常用內置時間函數+藍橋杯時間真題

python常用內置時間函數+藍橋杯時間真題

1.time 1.1 time.time() 時間戳指：1970年1月1日開始到現在所經過的秒數 import time print(time.time()) # 輸出可得1970年1月1日開始到執行此代碼所經過的秒數 1.2 time.localtime() 返回一個當前時間的時間對象，具體信息，并且可以單獨…

閱讀更多...

一個用 C 語言打印出所有三位數水仙花數的程序

一個用 C 語言打印出所有三位數水仙花數的程序

水仙花數（Narcissistic number）是指一個三位數，其各位數字的立方和等于該數本身。例如：153 是一個水仙花數，因為 (1^3 5^3 3^3 153)。以下是一個用 C 語言打印出所有三位數水仙花數的程序： 代碼實現 …

閱讀更多...

利用 VSCode 配置提升 vibe coding 開發效率

利用 VSCode 配置提升 vibe coding 開發效率

利用 VSCode 配置提升 vibe coding 開發效率 Vibe Coding（氛圍編程）是一種基于AI的編程方法，其核心在于通過自然語言描述軟件需求，再由大規模語言模型（LLM）自動生成代碼，從而實現對傳統手寫編程…

閱讀更多...

練習題：110

練習題：110

目錄 Python題目題目題目分析需求理解關鍵知識點實現思路分析代碼實現代碼解釋函數定義： 計算值的總和： 測試函數： 運行思路結束語 Python題目題目定義一個函數，接受一個字典作為參數，返回字…

閱讀更多...

處理 Linux 信號：進程控制與異常管理的核心

處理 Linux 信號：進程控制與異常管理的核心

個人主頁：chian-ocean 文章專欄-Linux 前言： 在 Linux 操作系統中，信號是用于進程間通信的一種機制，能夠向進程發送通知，指示某些事件的發生。信號通常由操作系統內核、硬件中斷或其他進程發送。接收和處理信號是 Li…

閱讀更多...

通信協議之串口

通信協議之串口

文章目錄簡介電平標準串口參數及時序USART與UART過程引腳配置簡介點對點，只能兩設備通信只需單向的數據傳輸時，可以只接一根通信線當電平標準不一致時，需要加電平轉換芯片（一般從控制器出來的是信號是TTL電平）地位…

閱讀更多...

Unity編輯器功能及拓展(1) —特殊的Editor文件夾

Unity編輯器功能及拓展(1) —特殊的Editor文件夾

Unity中的Editor文件夾是一個具有特殊用途的目錄，主要用于存放與編輯器擴展功能相關的腳本和資源。一.糾纏不清的UnityEditor 我們Unity中進行游戲構建時，我們經常遇到關于UnityEditor相關命名空間丟失的報錯，這時候，只得將報錯…

閱讀更多...

工具類-csv文件導入數據庫思路

工具類-csv文件導入數據庫思路

首先，讓我們來看下數據庫建表語句： CREATE TABLE behavior_reports (id BIGINT PRIMARY KEY AUTO_INCREMENT COMMENT 報告ID,report_type VARCHAR(50) NOT NULL COMMENT 報告類型(daily, weekly, monthly),start_date DATE NOT NULL COMMENT 開始日期,e…

閱讀更多...

軟件工程之軟件開發模型（瀑布、迭代、敏捷、DevOps）

軟件工程之軟件開發模型（瀑布、迭代、敏捷、DevOps）

1. 瀑布模型（Waterfall Model） 定義與流程瀑布模型是線性順序的開發流程，包含需求分析、設計、編碼、測試、維護等階段，每個階段完成后才能進入下一階段，類似“瀑布流水”逐級推進。核心特點嚴格階段劃分&#…

閱讀更多...

FreeRTOS與RT-Thread內存分配對比分析

FreeRTOS與RT-Thread內存分配對比分析

一、動態內存分配策略 ?FreeRTOS ?分配算法多樣性：提供5種動態內存管理算法（heap_1至heap_5），覆蓋從簡單到復雜的場景。例如： heap_1：僅支持分配不支持釋放，適用于固定任務棧分配。heap_4&…

閱讀更多...

202519 | Mybatis-Plus

202519 | Mybatis-Plus

快速入門 MyBatis-Plus（簡稱 MP）是 MyBatis 的增強工具，它在 MyBatis 的基礎上只做增強不做改變，簡化了開發，提高了效率。以下是 MyBatis-Plus 的快速入門指南，幫助您快速上手使用。 1. 環境準備 JDK&…

閱讀更多...

Linux C語言調用第三方庫，第三方庫如何編譯安裝

Linux C語言調用第三方庫，第三方庫如何編譯安裝

在 Linux 環境下使用 C 語言調用第三方庫時，通常需要先對第三方庫進行編譯和安裝。以下為你詳細介紹一般的編譯安裝步驟，并給出不同類型第三方庫（如使用 Makefile、CMake 構建系統）的具體示例。一般步驟 1. 獲取第三方庫源碼 …

閱讀更多...

linux基本命令(1)--linux下的打包命令 -- tar 和gzip

linux基本命令(1)--linux下的打包命令 -- tar 和gzip

tar 解壓 ，打包語法：tar [主選項輔選項] 文件或者目錄使用該命令時，主選項是必須要有的，它告訴tar要做什么事情，輔選項是輔助使用的，可以選用。主選項： c 創建新的檔案文件。如果用戶想備…

閱讀更多...

Python 序列構成的數組(對序列使用+和_)

Python 序列構成的數組(對序列使用+和_)

對序列使用和* Python 程序員會默認序列是支持和 * 操作的。通常號兩側的序列由相同類型的數據所構成，在拼接的過程中，兩個被操作的序列都不會被修改，Python 會新建一個包含同樣類型數據的序列來作為拼接的結果。如果想要把一個序列…

閱讀更多...

[ C語言 ] | 從0到1？

[ C語言 ] | 從0到1？

目錄認識計算機語言 C語言工欲善其事必先利其器第一個C語言代碼這一些列 [ C語言 ] ，就來分享一下 C語言相關的知識點~ 認識計算機語言我們說到計算機語言，語言，就是用來溝通的工具，計算機語言呢？就是我們…

閱讀更多...

【通道注意力機制】【SENet】Squeeze-and-Excitation Networks

【通道注意力機制】【SENet】Squeeze-and-Excitation Networks

0.論文摘要卷積神經網絡建立在卷積操作的基礎上，通過融合局部感受野內的空間和通道信息來提取有意義的特征。為了增強網絡的表示能力，最近的一些方法展示了增強空間編碼的好處。在本研究中，我們專注于通道關系，并提出了一種新穎…

閱讀更多...

kubernetes Calico（CNI） NetworkPolicy 流量管理設置networkpolicy 策略下集

kubernetes Calico（CNI） NetworkPolicy 流量管理設置networkpolicy 策略下集

1、kubernetes 網絡策略（網絡隔離策略） Network Policy 是 Kubernetes 中用于控制 Pod 之間網絡通信的一種機制。它通過定義規則，限制哪些 Pod 或外部實體可以與目標 Pod 通信（基于標簽、命名空間、端口等）。Network …

閱讀更多...

sqlmap基礎命令總結

sqlmap基礎命令總結

?注意事項:僅用于授權測試，避免非法使用。目錄 ?一、基礎命令 ?二、數據庫信息獲取 ?三、繞過 WAF/IDS ?四、文件系統與系統命令 ?五、高級功能與優化 ?六、實戰示例 ?一、基礎命令 ?檢測注入點 sqlmap -u "http://target.com/index.php?id1&…

閱讀更多...

Unity光線傳播體積(LPV)技術實現詳解

Unity光線傳播體積(LPV)技術實現詳解

一、LPV技術概述光線傳播體積(Light Propagation Volumes)是一種實時全局光照技術，通過將場景中的間接光信息存儲在3D網格中，實現動態物體的間接光照效果。核心優勢： 實時性能：相比傳統光照貼圖，支持動態場景硬件…

閱讀更多...

SpringBoot (一) 自動配置原理

SpringBoot (一) 自動配置原理

目錄一自動配置 1:數據源的手動配置 1:SpringBoot的自動配置二自動配置的完整流程：（底層） 1. 場景化依賴與Starter機制 2. 主程序入口與注解驅動 3. 自動配置類的加載與篩選 4. 自動配置類的實現邏輯 5. 自動配置的觸發與執行流…

閱讀更多...

最新文章