deepspeed huggingface傳入參數 optimizer和lr_scheduler測試

Trainer中

首先:
WarmupDecayLR= --lr_scheduler_type linear
WarmupLR= --lr_scheduler_type constant_with_warmup

1

TrainArgument不傳lr_scheduler_type、optim,warmup_steps=15
ds config文件中定義如下:
在這里插入圖片描述
注意:如果不在TrainArgument傳入warmup_steps,直接在ds config指定的話會報錯,故需要結合使用。

學習率如下:
在這里插入圖片描述

2

TrainArgument不傳lr_scheduler_type、optim,warmup_steps=15
ds config文件中定義如下:
在這里插入圖片描述
學習率如下:
在這里插入圖片描述

3

TrainArgument不傳optim,warmup_steps=15
lr_scheduler_type=constant_with_warmup
ds config文件中定義如下:
在這里插入圖片描述
學習率如下:
在這里插入圖片描述
可以得出:deepspeed中的優化器和學習率策略確實是有優先級的,兩個都定義的情況下會用deepspeed中的。

推薦用法:optim用deepspeed, lr_scheduler用huggingface的 cosine
cosine學習率圖如下:
在這里插入圖片描述

PPOTrainer、RLOOTrainer

trl中的相關trainer是不支持deepspeed配置optimizer 和 lr_scheduler的,需要使用huggingface提供的。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/41848.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/41848.shtml
英文地址,請注明出處:http://en.pswp.cn/web/41848.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LangChain(四)工具調用的底層原理!給大模型按上雙手吧!(新手向)

背景 經過前面三篇的內容,我想大家對于大模型的構建、Langchain的優勢、Chain的構建有了相當程度的理解(雖然只是最簡單的示例,但是足夠有代表性)。 后續Chain的使用將會更加豐富多彩,您會了解Langchain開發的大模型…

14-31 劍和詩人5 - 使用 AirLLM 和分層推理在單個 4GB GPU 上運行 LLama 3 70B

利用分層推理實現大模型語言(LLM) 大型語言模型 (LLM) 領域最近取得了顯著進展,LLaMa 3 70B 等模型突破了之前認為可能實現的極限。然而,這些模型的龐大規模給其部署和實際使用帶來了巨大挑戰,尤其是在資源受限的設備上,例如內存…

怎么壓縮pdf文件的大小?減小PDF文件大小的四種方法

怎么壓縮pdf文件的大小?文件大小不僅影響傳輸速度,還可能涉及存儲空間的管理。當處理大型PDF文件時,可能會面臨電子郵件附件限制或云存儲容量不足的問題。此外,過大的文件在瀏覽和加載時也會導致延遲,影響閱讀體驗。這…

3款自己電腦就可以運行AI LLM的項目

AnythingLLM、LocalGPT和PrivateGPT都是與大語言模型(LLM)相關的項目,它們允許用戶在本地環境中與文檔進行交互,但它們在實現方式和特點上存在一些差異。AnythingLLM使用Pinecone和ChromaDB來處理矢量嵌入,并使用OpenA…

【C語言】return 關鍵字詳解

在C語言中,return是一個關鍵字,用于從函數中返回值或者結束函數的執行。它是函數的重要組成部分,負責將函數的計算結果返回給調用者,并可以提前終止函數的執行。 主要用途和原理: 返回值給調用者: 當函數執…

mysql數據庫創建用戶并授權某個庫的所有權限

這個就直接上語句吧!只是注意要用管理員帳號執行,比如root去執行。 -- 創建新用戶(替換new_user為您的用戶名,password為您的密碼) CREATE USER new_user% IDENTIFIED BY password; -- 授予權限(替換data…

社交媒體數據分析:賦能企業營銷策略的利器

在這個數字化時代,社交媒體不僅是品牌與消費者互動的舞臺,更是企業洞察市場趨勢、優化營銷策略的金礦。本文將探討如何利用社交媒體數據分析賦能企業營銷,通過實戰案例與技巧分享,揭示這把“利器”如何幫助企業精準定位目標受眾、…

【論文閱讀】-- Visual Traffic Jam Analysis Based on Trajectory Data

基于軌跡數據的可視化交通擁堵分析 摘要1 引言2 相關工作2.1 交通事件檢測2.2 交通可視化2.3 傳播圖可視化 3 概述3.1 設計要求3.2 輸入數據說明3.3 交通擁堵數據模型3.4 工作流程 4 預處理4.1 路網處理4.2 GPS數據清理4.3 地圖匹配4.4 道路速度計算4.5 交通擁堵檢測4.6 傳播圖…

架構面試-場景題-單點登錄(SSO)怎么實現的

文章目錄 概述基于Cookie基于Token(OAuth, JWT)集中式認證服務 (CAS, SAML)分布式Session:輕型目錄訪問協議(LDAP)OAuth 2.0/OIDCKerberos 概述 單點登錄(Single Sign-On,簡稱SSO)是一種身份驗證機制,允許…

掌握【Python異常處理】:打造健壯代碼的現代編程指南

目錄 ?編輯 1. 什么是異常? 知識點 示例 小李的理解 2. 常見的內置異常類型 知識點 示例 小李的理解 3. 異常機制的意義 知識點 示例 小李的理解 4. 如何處理異常 知識點 示例 小李的理解 5. 拋出異常 知識點 示例 小李的理解 6. Python內置…

Springboot整合Jsch-Sftp

背景 開發一個基于jsch的sftp工具類&#xff0c;方便在以后的項目中使用。寫代碼的過程記錄下來&#xff0c;作為備忘錄。。。 Maven依賴 springboot依賴 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-par…

codeforces 1633A

文章目錄 1. 題目鏈接2. 題目代碼正確代碼錯誤代碼 3. 題目總結 1. 題目鏈接 Div. 7 2. 題目代碼 正確代碼 #include<iostream> using namespace std; int main(){int testCase;cin >> testCase;while(testCase --){int ingeter;cin >> ingeter;if(!(inget…

SpringBoot彩蛋之定制啟動畫面

寫在前面 在日常開發中&#xff0c;我們經常會看到各種各樣的啟動畫面。例如以下幾種 ① spring項目啟動畫面 ② mybatisplus啟動畫面 ③若依項目啟動畫面 還有很多各式各樣好看的啟動畫面&#xff0c;那么怎么定制這些啟動畫面呢&#xff1f; 一、小試牛刀 ① 新建一個Spr…

Java 8 到 Java 22 新特性詳解

Java 8 到 Java 22 新特性詳解 Java自發布以來一直在不斷演進&#xff0c;添加新特性以提升開發效率和性能。本文將介紹Java 8到Java 22的主要新特性&#xff0c;幫助開發者了解各版本的新功能和改進。 Java 8 (2014) 1. Lambda 表達式 Lambda 表達式允許使用簡潔的語法定義…

SQL 之 concat_ws和concat的區別

concat_ws和concat都是用于連接字符串的函數&#xff0c;但它們在使用上有一些區別&#xff1a; 一、concat、concat_ws函數格式&#xff1a; concat格式&#xff1a; concat&#xff08;參數1,參數2,…參數n&#xff09;&#xff0c;如果要加’分隔符’直接寫在 各參數中間就…

關于微信支付-商戶平臺:查詢訂單提示“查詢失敗:操作失敗,請稍候重試”的分析

目錄 引子 分析 應對 小結 引子 在開發和實施微信 JSAPI 支付的應用后&#xff0c;我們遇到了一些問題&#xff0c;訂單的狀態更新不正常&#xff0c;當然我們首先需要從自身尋找原因和完善解決問題的辦法和方案。在支付的過程中&#xff0c;客戶會給我們一些反饋&#xf…

Open-Sora1.2環境搭建推理測試

引子 前陣子寫了一篇Open-Sora1.0環境搭建&推理測試&#xff08;Open-Sora1.0環境搭建&推理測試_自己搭建sora服務-CSDN博客&#xff0c;感興趣的童鞋&#xff0c;請移步&#xff09;。Open-Sora1.1發布的時候&#xff0c;撇了一眼新聞。后面一轉頭&#xff0c;忘記這…

ARL聯動AWVS實現自動化漏洞掃描

0x01 前言 很多場景下需要大范圍的掃描漏洞和快速排查互聯網暴露面的漏洞&#xff0c;需要使用這種自動化的手段&#xff0c;常規滲透測試的找互聯網暴露面是&#xff0c;域名>子域名>IP>C段>端口&#xff0c;可以手動收集&#xff0c;也可以借助一些網絡搜索引擎…

css中偽元素 :: before的用法

在CSS中&#xff0c;偽元素 ::before 用于在選定元素的內容前插入內容。它常用于添加圖標、文本或裝飾性的元素&#xff0c;而不需要在HTML中實際添加額外的標簽。 以下是一個示例說明 ::before 的用法&#xff1a; <!DOCTYPE html> <html lang"en"> &…

一文解決Postman請求發送難題

標題&#xff1a;【技術深度解析】一文解決Postman請求發送難題 在API開發和測試過程中&#xff0c;Postman作為一款強大的工具&#xff0c;其重要性不言而喻。然而&#xff0c;開發者們時常會遇到Postman無法發送請求的問題&#xff0c;這無疑會嚴重影響開發進度和測試效率。…