Stable Diffusion lora訓練(一)

一、不同維度的LoRA訓練步數建議

  1. 2D風格訓練

    • 數據規模:建議20-50張高質量圖片(分辨率≥1024×1024),覆蓋多角度、多表情的平面風格。
    • 步數范圍:總步數控制在1000-2000步,公式為 總步數 = Repeat × Image × Epoch / Batch_size
    • 示例:Image=30張,Repeat=10,Epoch=5,Batch_size=2 → 750步(偏低,需增加Epoch至10)。
      在這里插入圖片描述
  2. 2.5D風格訓練

    • 數據規模:30-60張圖片,需兼具平面與立體細節(如半厚涂、輕3D渲染)。
    • 步數范圍:推薦1500-3000步,通過提高Epoch(8-12輪)增強細節捕捉能力。
  3. 3D風格訓練

    • 數據規模:50-100張高精度建模圖,需包含光影、材質、多視角特征。
    • 步數范圍:建議15000步左右,搭配Dadaptation優化器動態調整學習率。

二、不同底模的步數適配策略

底模類型適用場景步數調整要點推薦總步數范圍
Pony二次元、輕量化風格降低Epoch(5-8輪),防止過擬合800-1500步
F1厚涂、ACG風格提高Repeat至12-15次以強化質感1200-2500步
SD1.5通用型、人像與場景兼容標準參數(Repeat=10,Epoch=10)1000-2000步
Illustrious高精度3D與寫實風格增大Batch_size(4-6)以加速深度訓練2000-3000步

三、LoRA訓練小技巧

數據預處理優化

  • 使用智能裁剪工具(如ComfyUI)聚焦主體,避免“截肢”或背景干擾。
  • 結合BLIP或WD 1.4 Tagger生成標簽后,手動補充細節描述(如材質、光源)。

參數調優技巧

  • 學習率平衡:Unet學習率設為0.0001-0.001,Text Encoder學習率降低至其1/5-1/10。
  • 正則化圖像:添加5-10張非目標風格圖片(如素描),提升模型泛化性。

硬件適配策略

  • 顯存≤6G時,Batch_size=1,通過提高Repeat或Epoch補償訓練強度。
  • 顯存≥12G時,Batch_size=4-6,結合梯度累積加速收斂。

模型性能評估

  • Loss率監控:保持Loss在0.3-0.5區間,過低(<0.1)可能過擬合。
  • 多輪次保存:每輪訓練保存模型,測試時選擇泛化性與細節平衡的版本。

四、典型訓練方案示例

場景底模Image數量RepeatEpochBatch_size總步數
輕量2D角色訓練Pony25張1062750步
深度3D材質訓練F150張151041875步
通用寫實場景訓練SD1.540張12831280步

總結

  • 訓練步數需根據公式動態調整,優先保證數據質量與標簽精準度。
  • 2D/2.5D場景推薦1000-3000步,3D場景建議提升至1500步以上。
  • 底模選擇上,SD1.5和Illustrious適合通用需求,Pony/F1需針對性優化參數。
  • 結合正則化圖像與學習率平衡策略,可顯著提升模型泛化性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/73017.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/73017.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/73017.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI 生成 PPT 網站介紹與優缺點分析

隨著人工智能技術不斷發展&#xff0c;利用 AI 自動生成 PPT 已成為提高演示文稿制作效率的熱門方式。本文將介紹幾款主流的 AI PPT 工具&#xff0c;重點列出免費使用機會較多的網站&#xff0c;并對各平臺的優缺點進行詳細分析&#xff0c;幫助用戶根據自身需求選擇合適的工具…

使用Systemd管理ES服務進程

Centos中的Systemd介紹 CentOS 中的 Systemd 詳細介紹 Systemd 是 Linux 系統的初始化系統和服務管理器&#xff0c;自 CentOS 7 起取代了傳統的 SysVinit&#xff0c;成為默認的初始化工具。它負責系統啟動、服務管理、日志記錄等核心功能&#xff0c;顯著提升了系統的啟動速…

【一維前綴和與二維前綴和(簡單版dp)】

1.前綴和模板 一維前綴和模板 1.暴力解法 要求哪段區間&#xff0c;我就直接遍歷那段區間求和。 時間復雜度O(n*q) 2.前綴和 ------ 快速求出數組中某一個連續區間的和。 1&#xff09;預處理一個前綴和數組 這個前綴和數組設定為dp&#xff0c;dp[i]表示&#xff1a;表示…

在Windows和Linux系統上的Docker環境中使用的鏡像是否相同

在Windows和Linux系統上的Docker環境中使用的鏡像是否相同&#xff0c;取決于具體的運行模式和目標平臺&#xff1a; 1. Linux容器模式&#xff08;默認/常見場景&#xff09; Windows系統&#xff1a; 當Windows上的Docker以Linux容器模式運行時&#xff08;默認方式&#xf…

植物來源藥用天然產物的合成生物學研究進展-文獻精讀121

植物來源藥用天然產物的合成生物學研究進展 摘要 大多數藥用天然產物在植物中含量低微&#xff0c;提取分離困難&#xff1b;而且這些化合物一般結構復雜&#xff0c;化學合成難度大&#xff0c;還容易造成環境污染。基于合成生物學技術獲得藥用天然產物具有綠色環保和可持續發…

JavaScript |(五)DOM簡介 | 尚硅谷JavaScript基礎實戰

學習來源&#xff1a;尚硅谷JavaScript基礎&實戰丨JS入門到精通全套完整版 筆記來源&#xff1a;在這位大佬的基礎上添加了一些東西&#xff0c;歡迎大家支持原創&#xff0c;大佬太棒了&#xff1a;JavaScript |&#xff08;五&#xff09;DOM簡介 | 尚硅谷JavaScript基礎…

瀏覽器工作原理深度解析(階段二):HTML 解析與 DOM 樹構建

一、引言 在階段一中&#xff0c;我們了解了瀏覽器通過 HTTP/HTTPS 協議獲取頁面資源的過程。本階段將聚焦于瀏覽器如何解析 HTML 代碼并構建 DOM 樹&#xff0c;這是渲染引擎的核心功能之一。該過程可分為兩個關鍵步驟&#xff1a;詞法分析&#xff08;Token 化&#xff09;和…

The Illustrated Stable Diffusion

The Illustrated Stable Diffusion 1. The components of Stable Diffusion1.1. Image information creator1.2. Image Decoder 2. What is Diffusion anyway?2.1. How does Diffusion work?2.2. Painting images by removing noise 3. Speed Boost: Diffusion on compressed…

yarn 裝包時 package里包含sqlite3@5.0.2報錯

yarn 裝包時 package里包含sqlite35.0.2報錯 解決方案&#xff1a; 第一步&#xff1a; 刪除package.json里的sqlite35.0.2 第二步&#xff1a; 裝包&#xff0c;或者增加其他的npm包 第三步&#xff1a; 在package.json里增加sqlite35.0.2&#xff0c;并運行yarn裝包 此…

一個免費 好用的pdf在線處理工具

pdf24 doc2x 相比上面能更好的支持數學公式。但是收費

buu-bjdctf_2020_babystack2-好久不見51

整數溢出漏洞 將nbytes設置為-1就會回繞&#xff0c;變成超大整數 從而實現棧溢出漏洞 環境有問題 from pwn import *# 連接到遠程服務器 p remote("node5.buuoj.cn", 28526)# 定義后門地址 backdoor 0x400726# 發送初始輸入 p.sendlineafter(b"your name…

DHCP 配置

? 最近發現&#xff0c;自己使用虛擬機建立的集群&#xff0c;在斷電關機或者關機一段時間后&#xff0c;集群之間的鏈接散了&#xff0c;并且節點自身的 IP 也發生了變化&#xff0c;發現是 DHCP 的問題&#xff0c;這里記錄一下。 DHCP ? DHCP&#xff08;Dynamic Host C…

股指期貨合約的命名規則是怎樣的?

股指期貨合約的命名規則其實很簡單&#xff0c;主要由兩部分組成&#xff1a;合約代碼和到期月份。 股指期貨合約4個字母數字背后的秘密 股指期貨合約一般來說都是由字母和數字來組合的&#xff0c;包含了品種代碼和到期的時間&#xff0c;下面我們具體來看看。 咱們以“IF23…

OSPF 協議詳解:從概念原理到配置實踐的全網互通實現

什么是OSPF OSPF&#xff08;開放最短路徑優先&#xff09;是由IETF開發的基于鏈路狀態的自治系統內部路由協議&#xff0c;用來代替存在一些問題的RIP協議。與距離矢量協議不同&#xff0c;鏈路狀態路由協議關心網絡中鏈路活接口的狀態&#xff08;包括UP、DOWN、IP地址、掩碼…

深入探究 JVM 堆的垃圾回收機制(二)— 回收

GC Roots 枚舉需要遍歷整個應用程序的上下文&#xff0c;而在進行可達性分析或者垃圾回收時&#xff0c;如果我們還是進行全堆掃描及收集&#xff0c;那么會非常耗時。JVM 將堆分為新生代及老生代&#xff0c;它們的回收頻率及算法不一樣。 1 回收算法 在進行可達性分析時&am…

藍橋杯 之 數論

文章目錄 習題質數找素數 數論&#xff0c;就是一些數學問題&#xff0c;藍橋杯十分喜歡考察&#xff0c;常見的數論的問題有&#xff1a;取模&#xff0c;同余&#xff0c;大整數分解&#xff0c;素數&#xff0c;質因數&#xff0c;最大公約數&#xff0c;最小公倍數等等 素…

Unity Shader編程】之渲染流程之深度及pass詳解

關于透明物體的渲染&#xff0c;首先需要了解以下部分 深度緩沖區深度寫入深度測試pass渲染和深度測試的過程深度測試和顏色混合過程 ** 一&#xff0c;深度緩沖區 ** 深度即物體距離相機的距離&#xff0c;深度寫入即是把物體的距離相機信息記錄下來&#xff0c;寫入一個名…

csv文件格式和excel數據格式有什么區別

CSV&#xff08;Comma-Separated Values&#xff09;和Excel&#xff08;XLS/XLSX&#xff09;數據格式的主要區別如下&#xff1a; 1. 文件格式 CSV&#xff1a;純文本格式&#xff0c;每一行表示一條記錄&#xff0c;字段之間用逗號&#xff08;,&#xff09;或其他分隔符&…

Beans模塊之工廠模塊注解模塊@Qualifier

博主介紹&#xff1a;?全網粉絲5W&#xff0c;全棧開發工程師&#xff0c;從事多年軟件開發&#xff0c;在大廠呆過。持有軟件中級、六級等證書。可提供微服務項目搭建與畢業項目實戰&#xff0c;博主也曾寫過優秀論文&#xff0c;查重率極低&#xff0c;在這方面有豐富的經驗…

C# HTTP 文件上傳、下載服務器

程序需要管理員權限&#xff0c;vs需要管理員打開 首次運行需要執行以下命令注冊URL&#xff08;管理員命令行&#xff09; netsh advfirewall firewall add rule name"FileShare" dirin actionallow protocolTCP localport8000 ipconfig | findstr "IPv4&quo…