ComfyUI——舒服地讓大模型為我所用

主頁:ComfyUI | 用AI生成視頻、圖像、音頻

https://github.com/comfyanonymous/ComfyUI

安裝環境

我的環境是mac,芯片為M4pro。首先從github中下載工程,clone失敗就直接下載zip壓縮包。在model文件夾中,可以看到很多大名鼎鼎的模型,如lora,controlnet。

其中一個依賴環境是av,PyAV?是一個強大的庫,用于處理視頻和音頻流(基于 FFmpeg)。PyAV 依賴 FFmpeg,如果系統未安裝 FFmpeg,可能會報錯。Conda 會自動處理 FFmpeg 依賴

conda install -c conda-forge av
OMP: Error #15: Initializing libomp.dylib, but found libomp.dylib already initialized.
OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program.

使用命令:find / -name "libomp.dylib" 2>/dev/null
發現虛擬環境下有很多個:

I/lib/libomp.dylib/anaconda3/envs/comfUI/lib/python3.12/site-packages/torch/lib/libomp.dylib/anaconda3/envs/comfUI/lib/python3.12/site-packages/skimage/.dylibs/libomp.dylib

但是更改環境變量也沒解決;

import os
os.environ['DYLD_LIBRARY_PATH'] = f"{os.environ['CONDA_PREFIX']}/lib"

最終是靠conda重新安裝torch解決。

conda uninstall numpy scipy mkl torch # 卸載可能依賴 MKL 的包
conda install numpy scipy mkl  torch # 重新安裝(conda 會自動處理依賴)

requirements.txt中的comfyui-frontend-package則需要pip安裝

下載模型

打開網頁就可以看到一個可視化的工作流。工作流有一些模板可以瀏覽。

這幾個模板其實就是一些jpg,只不過在圖片的metadata里面保存了真正決定workflow的JSON。

點擊Lora會加載工作流,剛開始會彈出提示框,缺少模型,不過沒關系,可以點擊下載就好了:

下載需要科學上網。三個模型都以safetensors結尾。下載好的?dreamshaper_8.safetensors??and 放到ComfyUI/models/checkpoints下,?blindbox_V1Mix?and?MoXinV1放到ComfyUI/models/loras文件夾下。dreamshaper是stable diffusion的checkpoint model,是很大的模型,所以看大小有2.13GB,而Lora只有151.1MB。

可以看到這個工作流同時使用了兩個Lora,模板自帶的notes解釋了為什么需要兩個lora:blindbox_V1Mix?and?MoXinV1,因為這樣可以得到更balance的結果:

?blindbox_V1Mix?and?MoXinV1.blend

大模型除了dreamshaper,還有Stable diffusion v1.4,Stable diffusion v1.5,Realistic Vision,majicMIX realistic,Deliberate v2,F222等。dreamshaper生成的是近似于AnythingV5(屬于SDXL模型)的漫畫和majicMIX realistic逼真之間的形象:

啟動

模型準備好之后就可以運行了,會比較慢,網頁的標簽頁上會顯示進度。

這是我生成的一幅圖:

對應的提示詞是:

upperbody shot, 1girl,solo,chibi,long hairs, happy, laugh, hugging a teddy bear, looking at viewers, dancing stand, cute, soft color, flowers in background, many flowers, among flowers, best quality, highres, delicate details,

上半身特寫,一位女孩,單人,Q版(或“迷你角色”/“簡筆畫風格可愛小人”,根據“chibi”具體語境調整),長發,面帶笑容,開懷大笑,抱著泰迪熊,注視著觀眾,舞姿站立,可愛,柔和色調,背景有花朵,繁花似錦,置身花叢,最佳畫質,高分辨率,細節精致

對比之下,生成的數目不對,手里的也不是泰迪熊。

除了正向的提示詞,還有負向的:

(worst quality, low quality:1.4), (bad anatomy), text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry, deformed face

在提示詞之外,還可以控制圖像尺寸,采樣器,步數等參數:

reference:

1.怎么使用Stable diffusion中的models-騰訊云開發者社區-騰訊云

2.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/918182.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/918182.shtml
英文地址,請注明出處:http://en.pswp.cn/news/918182.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Visual Studio】使用VS調試(Debug)

確保在Debug模式下而不是Release 打斷點(break point) 直接在有代碼的行前單擊,會出現紅色的點(再次單擊會取消);或者光標停留在某行,按F9 這意味著程序當執行到這一行時會終止 在打完斷點后點擊”本地Windows調試器“或者按F5 往下翻會有代碼…

B2.0:對硬件學習的一些個人心得感悟

對于硬件學習,所有人都會迷茫的找不到學習的路徑和方向,都是自我摸索或者老師帶領或者其他情況,而我倒是沒有機會接觸到現實的老師帶我領進這個門,自然走的彎路比較多,所以引申出這篇文章,來聊聊硬件學習的…

Cursor設置

一:設置 Port: 7890TUN Mode:開啟二:Editor Settings值為http://127.0.0.1:7890三:Cursor 測試一下

Windows下使用PyInstaller打包PyQt項目

在 Windows 環境下,使用 PyQt 開發的項目可以通過多種工具打包成 可執行文件(.exe),以下是幾種常見的方法及詳細步驟:1. 使用 PyInstallerPyInstaller 是最常用的 Python 打包工具,支持 PyQt5/PyQt6/PySide…

AI大語言模型在生活場景中的應用日益廣泛,主要包括四大類需求:文本處理、信息獲取、決策支持和創意生成。

一、AI大語言模型生活應用全景圖(Mermaid流程圖)graph TDA[生活小事需求] --> B{需求分類}B --> C[文本處理類]B --> D[信息獲取類]B --> E[決策支持類]B --> F[創意生成類]C --> C1[郵件寫作]C --> C2[內容潤色]C --> C3[文檔總…

物奇路由器Wi-Fi芯片榮膺2025中國創新IC-強芯領航獎,并亮相第五屆RISC-V中國峰會

近日,第五屆中國集成電路設計創新大會在蘇州舉辦,物奇攜多款高性能網絡通信與終端人工智能芯片亮相展會,其中首顆路由器Wi-Fi6芯片WQ9301憑借獨特的架構創新和領先的性能優勢,在國產IC強芯評選中脫穎而出,榮膺2025中國…

【已解決】npm install報錯

~/autodl-tmp/App/magic_conch_frontend# npm install報錯內容:WARN EBADENGINE Unsupported engine { npm WARN EBADENGINE package: vitejs/plugin-vue5.1.4, npm WARN EBADENGINE required: { node: ^18.0.0 || >20.0.0 }, npm WARN EBADENGINE current: { no…

IPC總結

IPC 是 Inter-Process Communication(進程間通信)的縮寫,指的是操作系統中不同進程之間傳遞數據、交換信息或同步行為的機制。由于進程在內存中擁有獨立的地址空間,無法直接訪問彼此的內存,因此需要通過操作系統提供的…

java之父-新特性

目錄 一.函數式接口Functional Interface 1. Supplier接口 --供給型接口 2. Consumer接口 --消費型接口 3.Function接口 --轉換型接口 4. Predicate接口--斷言型接口 5. Comparator接口--比較器接口 一.函數式接口Functional Interface 只有一個抽象方法的接口&#xff…

GPT-5的多模態能力如何?

GPT-5的多模態能力如何?概述問題1-非整點鬧鐘問題2-數數問題一問題3-數數問題二小結概述 2025年,8月8日凌晨,OpenAI 發布了 GPT-5,讓我們看看其多模態能力如何,用之前大模型無法解決的題目測試,數數問題時…

多模態RAG賽題實戰--Datawhale AI夏令營

參考自科大訊飛AI大賽(多模態RAG方向) - Datawhale 賽題意義: 我們正處在一個信息爆炸的時代,但這些信息并非以整潔的純文本形式存在。它們被封裝在各種各樣的載體中:公司的年度財報、市場研究報告、產品手冊、學術論…

SQL Server 創建 PostgreSQL 數據庫 鏈接服務器指南

SQL Server 創建 PostgreSQL 數據庫 鏈接服務器指南SQL Server 創建 PostgreSQL 數據庫 鏈接服務器指南一、準備工作二、創建鏈接服務器三、測試連接四、常見問題解決五、注意事項SQL Server 創建 PostgreSQL 數據庫 鏈接服務器指南 一、準備工作 安裝 PostgreSQL ODBC 驅動&a…

李宏毅深度學習教程 第16-18章 終身學習+網絡壓縮+可解釋性人工智能

【2025版】44、第十四節 機器終身學習 一 為什么今日的人工智能A_嗶哩嗶哩_bilibili 【2025版】42、第十三節 神經網絡壓縮 一 類神經網絡剪枝PruA_嗶哩嗶哩_bilibili 【2025版】30、第九節 機器學習的可解釋性 上 – 為什么神經網絡可以正_嗶哩嗶哩_bilibili 目錄 1. 終生…

LiveQing視頻RTMP推流視頻點播服務功能-云端錄像支持按時間段下載錄像時間段下載視頻mp4

LiveQing視頻RTMP推流視頻點播服務功能-云端錄像支持按時間段下載錄像時間段下載視頻mp41、云端錄像2、配置云端錄像3、查看云端錄像3、列表模式4、時間段下載5、時間段下載接口6、RTMP推流視頻直播和點播流媒體服務1、云端錄像 LiveQing 支持服務器集中錄像,將rtm…

Spark在什么情況下CBO才會判斷失誤,如何避免

在 Spark 中,CBO(基于成本的優化器,Cost-Based Optimizer)通過分析表的統計信息(如行數、列基數、數據分布等)計算不同執行計劃的“成本”,并選擇成本最低的計劃。但在以下場景中,CB…

【第12話:感知算法基礎4】圖像分割:深度學習圖像分割模型介紹入門及常用模型詳解

深度學習圖像分割模型介紹入門及常用模型詳解 圖像分割是計算機視覺的核心任務,旨在將圖像劃分為語義區域。隨著深度學習的發展,分割模型在精度和效率上取得重大突破。以下按技術演進順序詳解主流模型:1. FCN(全卷積網絡&#xff…

AI 大模型企業級應用落地挑戰與解決方案

引言:AI 大模型的企業價值與落地困境近年來,以 GPT-4、Claude 3、文心一言為代表的大語言模型(LLM)展現出驚人的自然語言理解與生成能力,吸引了眾多企業的關注。據 Gartner 預測,到 2025 年,40%…

微服務如何保證系統高可用?

今天我們來探討一個綜合性但至關重要的話題:給你一個微服務應用,你該如何系統性地保證其高可用性?在互聯網技術崗的面試中,高并發、高可用和大數據通常被視為衡量候選人經驗的三大黃金標準。但說實話,是否擁有真正的高…

推理路徑的動態調控:讓大模型學會“恰到好處”的思考

當前大型語言模型(LLM)通過思維鏈(CoT)提升復雜任務推理能力,但研究表明其推理路徑存在嚴重冗余——例如反復驗證或無效思維跳躍,導致計算資源浪費和“幻覺”增加。論文:Test-time Prompt Inter…

springboot 2.4跨域變化和swagger結合的問題

前言 最近升級老項目,springboot2.2升級2.x最新版,升級項目本身升級很正常,畢竟springboot升級3.x以下,升級3.x需要spring6.x,需要jdk17.但是升級的項目在自測時正常,一旦真正測試就報跨域問題了。排查才發…