Stable Diffusion lora訓練（一）

Stable Diffusion lora訓練（一）

pingmian/2025/9/12 5:17:23/文章來源:https://blog.csdn.net/Liudef06/article/details/146360304

一、不同維度的LoRA訓練步數建議

2D風格訓練
- 數據規模：建議20-50張高質量圖片（分辨率≥1024×1024），覆蓋多角度、多表情的平面風格。
- 步數范圍：總步數控制在1000-2000步，公式為 總步數 = Repeat × Image × Epoch / Batch_size。
- 示例：Image=30張，Repeat=10，Epoch=5，Batch_size=2 → 750步（偏低，需增加Epoch至10）。
2.5D風格訓練
- 數據規模：30-60張圖片，需兼具平面與立體細節（如半厚涂、輕3D渲染）。
- 步數范圍：推薦1500-3000步，通過提高Epoch（8-12輪）增強細節捕捉能力。
3D風格訓練
- 數據規模：50-100張高精度建模圖，需包含光影、材質、多視角特征。
- 步數范圍：建議15000步左右，搭配Dadaptation優化器動態調整學習率。

二、不同底模的步數適配策略

底模類型	適用場景	步數調整要點	推薦總步數范圍
Pony	二次元、輕量化風格	降低Epoch（5-8輪），防止過擬合	800-1500步
F1	厚涂、ACG風格	提高Repeat至12-15次以強化質感	1200-2500步
SD1.5	通用型、人像與場景兼容	標準參數（Repeat=10，Epoch=10）	1000-2000步
Illustrious	高精度3D與寫實風格	增大Batch_size（4-6）以加速深度訓練	2000-3000步

三、LoRA訓練小技巧

數據預處理優化

使用智能裁剪工具（如ComfyUI）聚焦主體，避免“截肢”或背景干擾。
結合BLIP或WD 1.4 Tagger生成標簽后，手動補充細節描述（如材質、光源）。

參數調優技巧

學習率平衡：Unet學習率設為0.0001-0.001，Text Encoder學習率降低至其1/5-1/10。
正則化圖像：添加5-10張非目標風格圖片（如素描），提升模型泛化性。

硬件適配策略

顯存≤6G時，Batch_size=1，通過提高Repeat或Epoch補償訓練強度。
顯存≥12G時，Batch_size=4-6，結合梯度累積加速收斂。

模型性能評估

Loss率監控：保持Loss在0.3-0.5區間，過低（<0.1）可能過擬合。
多輪次保存：每輪訓練保存模型，測試時選擇泛化性與細節平衡的版本。

四、典型訓練方案示例

場景	底模	Image數量	Repeat	Epoch	Batch_size	總步數
輕量2D角色訓練	Pony	25張	10	6	2	750步
深度3D材質訓練	F1	50張	15	10	4	1875步
通用寫實場景訓練	SD1.5	40張	12	8	3	1280步

總結

訓練步數需根據公式動態調整，優先保證數據質量與標簽精準度。
2D/2.5D場景推薦1000-3000步，3D場景建議提升至1500步以上。
底模選擇上，SD1.5和Illustrious適合通用需求，Pony/F1需針對性優化參數。
結合正則化圖像與學習率平衡策略，可顯著提升模型泛化性。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/73017.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/73017.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/73017.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

AI 生成 PPT 網站介紹與優缺點分析

AI 生成 PPT 網站介紹與優缺點分析

隨著人工智能技術不斷發展，利用 AI 自動生成 PPT 已成為提高演示文稿制作效率的熱門方式。本文將介紹幾款主流的 AI PPT 工具，重點列出免費使用機會較多的網站，并對各平臺的優缺點進行詳細分析，幫助用戶根據自身需求選擇合適的工具…

閱讀更多...

使用Systemd管理ES服務進程

使用Systemd管理ES服務進程

Centos中的Systemd介紹 CentOS 中的 Systemd 詳細介紹 Systemd 是 Linux 系統的初始化系統和服務管理器，自 CentOS 7 起取代了傳統的 SysVinit，成為默認的初始化工具。它負責系統啟動、服務管理、日志記錄等核心功能，顯著提升了系統的啟動速…

閱讀更多...

【一維前綴和與二維前綴和（簡單版dp）】

【一維前綴和與二維前綴和（簡單版dp）】

1.前綴和模板一維前綴和模板 1.暴力解法要求哪段區間，我就直接遍歷那段區間求和。時間復雜度O(n*q) 2.前綴和 ------ 快速求出數組中某一個連續區間的和。 1）預處理一個前綴和數組這個前綴和數組設定為dp，dp[i]表示：表示…

閱讀更多...

在Windows和Linux系統上的Docker環境中使用的鏡像是否相同

在Windows和Linux系統上的Docker環境中使用的鏡像是否相同

在Windows和Linux系統上的Docker環境中使用的鏡像是否相同，取決于具體的運行模式和目標平臺： 1. Linux容器模式（默認/常見場景） Windows系統： 當Windows上的Docker以Linux容器模式運行時（默認方式&#xf…

閱讀更多...

植物來源藥用天然產物的合成生物學研究進展-文獻精讀121

植物來源藥用天然產物的合成生物學研究進展-文獻精讀121

植物來源藥用天然產物的合成生物學研究進展摘要大多數藥用天然產物在植物中含量低微，提取分離困難；而且這些化合物一般結構復雜，化學合成難度大，還容易造成環境污染。基于合成生物學技術獲得藥用天然產物具有綠色環保和可持續發…

閱讀更多...

JavaScript |（五）DOM簡介 | 尚硅谷JavaScript基礎實戰

JavaScript |（五）DOM簡介 | 尚硅谷JavaScript基礎實戰

學習來源：尚硅谷JavaScript基礎&實戰丨JS入門到精通全套完整版筆記來源：在這位大佬的基礎上添加了一些東西，歡迎大家支持原創，大佬太棒了：JavaScript |（五）DOM簡介 | 尚硅谷JavaScript基礎…

閱讀更多...

瀏覽器工作原理深度解析（階段二）：HTML 解析與 DOM 樹構建

瀏覽器工作原理深度解析（階段二）：HTML 解析與 DOM 樹構建

一、引言在階段一中，我們了解了瀏覽器通過 HTTP/HTTPS 協議獲取頁面資源的過程。本階段將聚焦于瀏覽器如何解析 HTML 代碼并構建 DOM 樹，這是渲染引擎的核心功能之一。該過程可分為兩個關鍵步驟：詞法分析（Token 化）和…

閱讀更多...

The Illustrated Stable Diffusion

The Illustrated Stable Diffusion

The Illustrated Stable Diffusion 1. The components of Stable Diffusion1.1. Image information creator1.2. Image Decoder 2. What is Diffusion anyway?2.1. How does Diffusion work?2.2. Painting images by removing noise 3. Speed Boost: Diffusion on compressed…

閱讀更多...

yarn 裝包時 package里包含sqlite3@5.0.2報錯

yarn 裝包時 package里包含sqlite3@5.0.2報錯

yarn 裝包時 package里包含sqlite35.0.2報錯解決方案： 第一步： 刪除package.json里的sqlite35.0.2 第二步： 裝包，或者增加其他的npm包第三步： 在package.json里增加sqlite35.0.2，并運行yarn裝包此…

閱讀更多...

一個免費好用的pdf在線處理工具

一個免費好用的pdf在線處理工具

pdf24 doc2x 相比上面能更好的支持數學公式。但是收費

閱讀更多...

buu-bjdctf_2020_babystack2-好久不見51

buu-bjdctf_2020_babystack2-好久不見51

整數溢出漏洞將nbytes設置為-1就會回繞，變成超大整數從而實現棧溢出漏洞環境有問題 from pwn import *# 連接到遠程服務器 p remote("node5.buuoj.cn", 28526)# 定義后門地址 backdoor 0x400726# 發送初始輸入 p.sendlineafter(b"your name…

閱讀更多...

DHCP 配置

DHCP 配置

? 最近發現，自己使用虛擬機建立的集群，在斷電關機或者關機一段時間后，集群之間的鏈接散了，并且節點自身的 IP 也發生了變化，發現是 DHCP 的問題，這里記錄一下。 DHCP ? DHCP（Dynamic Host C…

閱讀更多...

股指期貨合約的命名規則是怎樣的？

股指期貨合約的命名規則是怎樣的？

股指期貨合約的命名規則其實很簡單，主要由兩部分組成：合約代碼和到期月份。股指期貨合約4個字母數字背后的秘密股指期貨合約一般來說都是由字母和數字來組合的，包含了品種代碼和到期的時間，下面我們具體來看看。咱們以“IF23…

閱讀更多...

OSPF 協議詳解：從概念原理到配置實踐的全網互通實現

OSPF 協議詳解：從概念原理到配置實踐的全網互通實現

什么是OSPF OSPF（開放最短路徑優先）是由IETF開發的基于鏈路狀態的自治系統內部路由協議，用來代替存在一些問題的RIP協議。與距離矢量協議不同，鏈路狀態路由協議關心網絡中鏈路活接口的狀態（包括UP、DOWN、IP地址、掩碼…

閱讀更多...

深入探究 JVM 堆的垃圾回收機制（二）— 回收

深入探究 JVM 堆的垃圾回收機制（二）— 回收

GC Roots 枚舉需要遍歷整個應用程序的上下文，而在進行可達性分析或者垃圾回收時，如果我們還是進行全堆掃描及收集，那么會非常耗時。JVM 將堆分為新生代及老生代，它們的回收頻率及算法不一樣。 1 回收算法在進行可達性分析時&am…

閱讀更多...

藍橋杯之數論

藍橋杯之數論

文章目錄習題質數找素數數論，就是一些數學問題，藍橋杯十分喜歡考察，常見的數論的問題有：取模，同余，大整數分解，素數，質因數，最大公約數，最小公倍數等等素…

閱讀更多...

Unity Shader編程】之渲染流程之深度及pass詳解

Unity Shader編程】之渲染流程之深度及pass詳解

關于透明物體的渲染，首先需要了解以下部分深度緩沖區深度寫入深度測試pass渲染和深度測試的過程深度測試和顏色混合過程 ** 一，深度緩沖區 ** 深度即物體距離相機的距離，深度寫入即是把物體的距離相機信息記錄下來，寫入一個名…

閱讀更多...

csv文件格式和excel數據格式有什么區別

csv文件格式和excel數據格式有什么區別

CSV（Comma-Separated Values）和Excel（XLS/XLSX）數據格式的主要區別如下： 1. 文件格式 CSV：純文本格式，每一行表示一條記錄，字段之間用逗號（,）或其他分隔符&…

閱讀更多...

Beans模塊之工廠模塊注解模塊@Qualifier

Beans模塊之工廠模塊注解模塊@Qualifier

博主介紹：?全網粉絲5W，全棧開發工程師，從事多年軟件開發，在大廠呆過。持有軟件中級、六級等證書。可提供微服務項目搭建與畢業項目實戰，博主也曾寫過優秀論文，查重率極低，在這方面有豐富的經驗…

閱讀更多...

C# HTTP 文件上傳、下載服務器

C# HTTP 文件上傳、下載服務器

程序需要管理員權限，vs需要管理員打開首次運行需要執行以下命令注冊URL（管理員命令行） netsh advfirewall firewall add rule name"FileShare" dirin actionallow protocolTCP localport8000 ipconfig | findstr "IPv4&quo…

閱讀更多...

最新文章