《Stable Diffusion繪畫完全指南:從入門到精通的Prompt設計藝術》-配套代碼示例

第一章:模型加載與基礎生成

1.1 基礎模型加載
from diffusers import StableDiffusionPipeline
import torch# 加載SD 1.5基礎模型(FP32精度)
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5",torch_dtype=torch.float32
).to("cuda")# 生成第一張圖片
image = pipe("a cat wearing sunglasses").images[0]
image.save("basic_cat.png")
1.2 半精度優化加載
# 加載SDXL模型(FP16精度 + xformers加速)
pipe = StableDiffusionXLPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0",torch_dtype=torch.float16,use_xformers=True
).to("cuda")# 生成高分辨率圖片
image = pipe("cyberpunk city at night, 8k").images[0]
image.save("cyber_city.png")
1.3 低顯存設備適配
# CPU卸載模式(顯存<6GB適用)
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5",torch_dtype=torch.float16
)
pipe.enable_model_cpu_offload()  # 動態加載模型到顯存image = pipe("watercolor landscape").images[0]
image.save("low_vram_image.png")

第二章:Prompt工程優化

2.1 結構化Prompt模板
template = """
(cute corgi:1.3) wearing {glasses|hat|scarf},  # 主體
Studio Ghibli style, soft shading,            # 風格
in a flower field at sunset,                   # 環境
4k resolution, bokeh effect                    # 畫質
[blurry, low quality]                          # 負面提示
"""image = pipe(template.format("sunglasses")).images[0]
image.save("styled_corgi.png")
2.2 動態權重控制
# 使用數值權重調整元素重要性
prompt = """
(a beautiful castle:1.5) on a cliff,
(medieval style:0.8) with (futuristic elements:0.6),
intricate details, 8k cinematic lighting
"""image = pipe(prompt, guidance_scale=7).images[0]
image.save("hybrid_castle.png")
2.3 多語言Prompt融合
# 中英混合Prompt(需CLIP多語言支持)
prompt = """
A girl in 漢服 (hanfu:1.2) standing by 西湖 (West Lake),
水墨畫風格 (ink wash painting style), ultra detailed
"""image = pipe(prompt).images[0]
image.save("hanfu_girl.png")

第三章:高級控制技術

3.1 ControlNet姿勢控制
from diffusers import ControlNetModel, StableDiffusionControlNetPipeline
from PIL import Image# 加載OpenPose ControlNet
controlnet = ControlNetModel.from_pretrained("lllyasviel/sd-controlnet-openpose",torch_dtype=torch.float16
)
pipe = StableDiffusionControlNetPipeline.from_pretrained("runwayml/stable-diffusion-v1-5",controlnet=controlnet,torch_dtype=torch.float16
).to("cuda")# 輸入姿勢圖
pose_image = Image.open("pose_ref.png")
image = pipe("dancing woman", image=pose_image).images[0]
image.save("controlled_dance.png")
3.2 LoRA風格疊加
from diffusers import StableDiffusionXLPipeline
import torch# 加載基礎模型
pipe = StableDiffusionXLPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0",torch_dtype=torch.float16
).to("cuda")# 加載動漫LoRA
pipe.load_lora_weights("lora/anime_style_xl.safetensors")image = pipe("a warrior in armor").images[0]
image.save("anime_warrior.png")
3.3 多ControlNet聯合控制
# 同時使用Canny邊緣和深度圖控制
controlnets = [ControlNetModel.from_pretrained("lllyasviel/sd-controlnet-canny", torch_dtype=torch.float16),ControlNetModel.from_pretrained("lllyasviel/sd-controlnet-depth", torch_dtype=torch.float16)
]pipe = StableDiffusionControlNetPipeline.from_pretrained("runwayml/stable-diffusion-v1-5",controlnet=controlnets,torch_dtype=torch.float16
).to("cuda")# 輸入多控制圖
canny_img = Image.open("edge.png")
depth_img = Image.open("depth.png")
image = pipe("futuristic car", image=[canny_img, depth_img]).images[0]
image.save("multi_control_car.png")

第四章:性能優化

4.1 TensorRT加速
from diffusers import DiffusionPipeline
import torch_tensorrt# 轉換模型為TensorRT格式
pipe = DiffusionPipeline.from_pretrained(...)
trt_unet = torch_tensorrt.compile(pipe.unet,inputs=[torch.randn(1,4,64,64).to("cuda")],enabled_precisions={torch.float16}
)
pipe.unet = trt_unet# 加速生成
image = pipe("speed test image").images[0]
4.2 批處理生成
# 一次生成4張不同提示的圖片
prompts = ["a red rose","a blue rose", "a golden rose","a black rose"
]images = pipe(prompt=prompts, num_images_per_prompt=1).images
for idx, img in enumerate(images):img.save(f"rose_{idx}.png")
4.3 緩存優化
from diffusers import StableDiffusionPipeline
import torch# 啟用KV緩存加速
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5",torch_dtype=torch.float16,enable_sequential_cpu_offload=True,enable_kv_caching=True  # 關鍵優化
).to("cuda")# 第一次生成較慢(編譯緩存)
image = pipe("warmup image").images[0]# 后續生成加速30%
image = pipe("optimized image").images[0]

第五章:商業化生產

5.1 批量產品圖生成
product_data = [{"name": "sneakers", "color": "neon green"},{"name": "backpack", "color": "matte black"},{"name": "watch", "color": "rose gold"}
]for product in product_data:prompt = f"""Professional product photo of {product['color']} {product['name']},studio lighting, 8k resolution, product design award winner"""image = pipe(prompt).images[0]image.save(f"{product['name']}_{product['color']}.png")
5.2 自動質量檢測
from transformers import CLIPModel, CLIPProcessor# 加載CLIP模型
clip_model = CLIPModel.from_pretrained("openai/clip-vit-base-patch32")
clip_processor = CLIPProcessor.from_pretrained("openai/clip-vit-base-patch32")def quality_check(image, target_prompt):inputs = clip_processor(text=target_prompt, images=image, return_tensors="pt")outputs = clip_model(**inputs)similarity = outputs.logits_per_image.item()return similarity > 25  # 閾值根據實際情況調整if quality_check(image, prompt):image.save("approved.png")
else:print("Quality check failed!")
5.3 多尺寸適配生成
resolutions = [(512,512), (768,768), (1024,1024)]for w, h in resolutions:pipe = StableDiffusionPipeline.from_pretrained(...)image = pipe(prompt, width=w,height=h,target_size=(w,h)).images[0]image.save(f"output_{w}x{h}.png")

第六章:故障排查

6.1 顯存監控
import nvidia_sminvidia_smi.nvmlInit()
handle = nvidia_smi.nvmlDeviceGetHandleByIndex(0)def print_mem_usage():info = nvidia_smi.nvmlDeviceGetMemoryInfo(handle)print(f"Used VRAM: {info.used//1024**2} MB")print_mem_usage()  # 生成前后調用檢測
6.2 異常處理
try:image = pipe("problematic prompt").images[0]
except torch.cuda.OutOfMemoryError:print("顯存不足!嘗試啟用--medvram")pipe.enable_model_cpu_offload()image = pipe("problematic prompt").images[0]
6.3 采樣調試
# 記錄采樣過程
pipe = StableDiffusionPipeline.from_pretrained(...)
pipe.set_progress_bar_config(leave=True)  # 顯示詳細進度# 生成并保存中間步驟
for i in range(pipe.scheduler.config.num_train_timesteps):image = pipe(prompt, callback_on_step_end=lambda step, t, latents: latents.save(f"step_{step}.pt"))

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895769.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895769.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895769.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【DL】淺談深度學習中的知識蒸餾 | 輸出層知識蒸餾

目錄 一 核心概念與背景 二 輸出層知識蒸餾 1 教師模型訓練 2 軟標簽生成&#xff08;Soft Targets&#xff09; 3 學生模型訓練 三 擴展 1 有效性分析 2 關鍵影響因素 3 變體 一 核心概念與背景 知識蒸餾&#xff08;Knowledge Distillation, KD&#xff09;是一種模…

嵌入式學習第十六天--stdio(二)

文件打開 open函數 #include <fcntl.h> int open(const char *pathname&#xff0c;int flags); int open(const char *pathname&#xff0c;int flags&#xff0c;mode_t mode); 功能: 打開或創建文件 參數: pathname //打開的文件名 flags //操作…

對話智面創始人陶然:一是初心和心態,二是堅持和心力

隨著經濟全球化的加深和市場競爭的日益激烈&#xff0c;企業迅速發展成為了每一個企業家的夢想。然而&#xff0c;要實現企業的快速發展并保持競爭力&#xff0c;企業戰略的人力資源管理起著至關重要的作用。 企業的核心競爭力是“人才”的競爭&#xff0c;無論是研發、銷售、…

mybatis使用typeHandler實現類型轉換

使用mybatis作為操作數據庫的orm框架&#xff0c;操作基本數據類型時可以通過內置的類型處理器完成java數據類型和數據庫類型的轉換&#xff0c;但是對于擴展的數據類型要實現與數據庫類型的轉換就需要自定義類型轉換器完成&#xff0c;比如某個實體類型存儲到數據庫&#xff0…

Qt開發①Qt的概念+發展+優點+應用+使用

目錄 1. Qt的概念和發展 1.1 Qt的概念 1.2 Qt 的發展史&#xff1a; 1.3 Qt 的版本 2. Qt 的優點和應用 2.1 Qt 的優點&#xff1a; 2.2 Qt 的應用場景 2.3 Qt 的應用案例 3. 搭建 Qt 開發環境 3.1 Qt 的開發工具 3.2 Qt SDK 的下載和安裝 3.3 Qt 環境變量配置和使…

mac安裝Pyspark并連接Mysql

安裝Scala, apache-spark, Hadoop brew install scala brew install apache-spark brew install hadoop pip install pyspark注意不要自己另外安裝jdk, 會造成版本對不上報錯。因為安裝apache-spark的過程中會自動安裝openjdk。 配置環境變量 JAVA_HOME/opt/homebrew/Cellar…

【Go語言快速上手】第二部分:Go語言進階之網絡編程

文章目錄 前言&#xff1a;網絡編程一、TCP/UDP 編程&#xff1a;net 包的使用1. TCP 編程1.1 TCP 服務器1.2 TCP 客戶端 2. UDP 編程2.1 UDP 服務器2.2 UDP 客戶端 二、HTTP 編程&#xff1a;net/http 包的使用&#xff0c;編寫 HTTP 服務器和客戶端2.1 HTTP 服務器2.2 HTTP 客…

王炸 用AI+飛書 分解 一鍵生成 項目計劃表模版

效果圖&#xff1a; 各字段設置&#xff1a; 以下是一個使用 AI&#xff08;DeepSeeker&#xff09; 飛書多維表格分解項目待辦模板的示例&#xff0c;你可以根據實際情況進行調整和優化&#xff1a; 列表中需要選擇對象&#xff0c;且選擇輸出結果&#xff08;記得控制字符長度…

從月牙定理看古希臘數學的奇妙突破

文章目錄 每日一句正能量前言古希臘人的 “化圓為方” 之夢&#xff08;一&#xff09;幾何作圖的基本規則&#xff08;二&#xff09;化圓為方問題的起源與發展&#xff08;三&#xff09;化圓為方的意義 月牙面積定理的誕生&#xff08;一&#xff09;希波克拉底的生平與成就…

實戰:vLLM多機多卡部署大模型

兩臺服務器 1. Docker容器中使用GPU 必須確保已安裝并配置 NVIDIA Docker。你可以安裝 nvidia-docker 來確保 GPU 驅動能夠被 Docker 使用 #安裝 nvidia-docker&#xff1a; sudo apt-get install nvidia-docker2#然后重啟 Docker&#xff1a; sudo systemctl restart docke…

LLM中種子(Seed)作用是什么:多樣性

LLM中種子(Seed)作用是什么:多樣性 目錄 LLM中種子(Seed)作用是什么:多樣性作用舉例不同種子的區別設置不同種子的原因在LLM(大語言模型)中,種子(Seed)用于初始化隨機數生成器,發揮著確保結果可重復性的關鍵作用,具體如下: 作用 當大語言模型生成文本時,很多操…

neo4j二進制部署

neo4j二進制部署 下載所需組件 jdk 17 neo4j 5.2.0 配置文件 server.default_listen_address0.0.0.0環境變量 export JAVA_HOME/usr/local/jdk-17.0.13 export CLASSPATH.:${JAVA_HOME}/jre/lib/rt.jar:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar export PATH$…

Win10環境使用零訊ZeroNews內網穿透實現Deepseek對外服務

Win10環境使用零訊ZeroNews內網穿透實現Deepseek對外服務 前言 之前筆者已經在Win10環境搭建好了Ollama、DeepSeek、Open WebUI、Dify等組件&#xff0c;成功實現了私有化部署及內網訪問&#xff1a; https://lizhiyong.blog.csdn.net/article/details/145505686 https://l…

spconv 安裝測試

pip install spconv 報錯: File "/usr/local/lib/python3.10/dist-packages/torch/nn/modules/module.py", line 1736, in _wrapped_call_impl return self._call_impl(*args, **kwargs) File "/usr/local/lib/python3.10/dist-packages/torch/nn/modules/mod…

MySQL 查詢緩存技術深度解析

在現代數據庫管理系統中&#xff0c;查詢性能優化是提升應用響應速度和用戶體驗的關鍵環節。MySQL 作為一款廣泛使用的開源關系型數據庫&#xff0c;提供了查詢緩存功能&#xff0c;用于緩存查詢結果&#xff0c;從而在后續相同的查詢請求時能夠快速返回結果&#xff0c;減少數…

halcon 條形碼、二維碼識別、opencv識別

一、條形碼 函數介紹 create_bar_code_model * 1.創建條碼讀取器的模板 * 參數一&#xff1a;通用參數的名稱&#xff0c;針對條形碼模型進行調整。默認值為空 * 參數二&#xff1a;針對條形碼模型進行調整 * 參數三&#xff1a;條形碼模型的句柄。 create_bar_code_model (…

一個簡潔高效的Flask用戶管理示例

Flask-Login 是 Flask 的用戶管理擴展&#xff0c;提供 用戶身份驗證、會話管理、權限控制 等功能。 適用于&#xff1a; ? 用戶登錄、登出 ? 記住用戶&#xff08;“記住我” 功能&#xff09; ? 限制未登錄用戶訪問某些頁面 ? 用戶會話管理 1. 安裝 Flask-Login pi…

HashSet 的底層原理(簡單易懂)

在 Java 集合框架中&#xff0c;HashSet 是一個非常常用的集合類&#xff0c;它提供了快速的元素查找和插入操作。那么&#xff0c;HashSet 的底層是如何實現這些高效操作的呢&#xff1f;本文將深入探討 HashSet 的底層原理。 一、HashSet 的基本概念 HashSet 是基于哈希表的…

【學習資源】時間序列數據分析方法(2)-mWDN和AutoEncoder

接著上次的【學習資源】時間序列數據分析方法&#xff08;1&#xff09;-CSDN博客&#xff0c;本次介紹mWDN和AutoEncoder 解決時序數據分類的方法。介紹模型原理、應用場景和參考代碼。也從模型性能、訓練效率、模型復雜度、計算復雜度、可解釋性、適應性和泛化能力、健壯性、…

[LeetCode力扣hot100]-鏈表

相交鏈表 160. 相交鏈表 - 力扣&#xff08;LeetCode&#xff09; 思路就是遍歷兩個鏈表&#xff0c;有相同的部分就可以視為相交。 但是長度不一樣&#xff0c;比如兩個會相交的鏈表&#xff0c;headA 的長度為 a c&#xff0c;headB 的長度為 b c&#xff0c;其中 c 是公…