ComfyUI+阿里Wan2.1+內網穿透技術:本地AI視頻生成系統搭建實戰

文章目錄

    • 前言
    • 1.軟件準備
      • 1.1 ComfyUI
      • 1.2 文本編碼器
      • 1.3 VAE
      • 1.4 視頻生成模型
    • 2.整合配置
    • 3. 本地運行測試
    • 4. 公網使用Wan2.1模型生成視頻
      • 4.1 創建遠程連接公網地址
    • 5. 固定遠程訪問公網地址
    • 總結

前言

各位技術愛好者,今天為您帶來一組創新性的AI應用方案!我們將演示如何在Windows系統中搭建ComfyUI運行環境,并成功整合阿里巴巴最新研發的Wan2.1開源模型。通過簡單的文本輸入操作,即可激活個人計算機的AI創作能力,實現專業級視頻生成效果。特別值得一提的是,結合cpolar內網穿透技術,您可突破網絡限制實現遠程控制,完全無需配置公網IP地址或部署云端服務器。

近期,阿里巴巴推出重磅開源項目——Wan 2.1創新模型。這款完全免費的解決方案具備驚人的運行效率,即便在普通PC端也能流暢執行。其生成的視頻內容質量可與主流商業模型相媲美,無論是文本生成動態影像還是靜態圖像轉化動畫,Wan 2.1都能提供專業級的處理能力,助您快速掌握前沿AI技術應用。

image-20250328170652107

1.軟件準備

1.1 ComfyUI

首先訪問ComfyUI的Github下載對應操作系統版本,本例使用Windows系統進行演示,全部所需軟件資源鏈接我會放在文章末尾。

ComfyUI Github:https://github.com/comfyanonymous/ComfyUI

image-20250328115533255

選擇免安裝版本(本例以適用于N卡的免安裝版本0.3.27為例演示)

image-20250328115623927

下載后解壓到已定義路徑,然后繼續下載其他軟件:

image-20250328131010965

1.2 文本編碼器

現在需要下載文本編碼器,大家可以根據顯卡內存進行選擇,本例中以fp8量化版進行演示,適用于低于8G的顯卡,如果顯卡內存高于12G,可以選擇fp16這個,生成后的視頻精度會更高。

文本編碼器下載地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

image-20250328134032601

1.3 VAE

然后需要下載VAE,點擊download即可:

image-20250328134119724

VAE下載地址:split_files/vae/wan_2.1_vae.safetensors · Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

1.4 視頻生成模型

最后還需要下載Wan2.1視頻生成模型,如果顯卡配置較好,可以選擇最完整的32G的模型。本例中以相對顯卡要求較低的wan2.1_t2v_1.3B_fp16.safetensors模型進行演示:

image-20250328134504175

注意:建議使用 fp16 版本而不是 bf16 版本,因為它們會產生更好的結果。

質量等級(從高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn

視頻生成模型下載地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

2.整合配置

現在要把上邊準備好的編碼器、模型等整合到ComfyUI中,然后導入工作流文件,就能使用它來生成視頻了。

首先,把文本編碼器 umt5_xxl_fp8_e4m3fn_scaled.safetensors 放入 ComfyUI/models/text_encoders/

image-20250328135303505

image-20250328135816803

第二步,將VAE文件 wan_2.1_vae.safetensors 放入 ComfyUI/models/vae/

image-20250328140305746

第三步,將 Wan 2.1 模型 放入ComfyUI/models/diffusion_models/

image-20250328140453169

最后一步,下載文字轉視頻所需的 Json 格式的工作流,右鍵另存為到桌面即可,稍后打開ComfyUI時拖入。

下載地址:comfyanonymous.github.io/ComfyUI_examples/wan/text_to_video_wan.json

image-20250328140802142

3. 本地運行測試

現在我們回到解壓后的ComfyUI根目錄,雙擊運行腳本:

image-20250328140956450

啟動中:(啟動后這個服務窗口也不要關)

image-20250328141131576

啟動完畢后,會自動在瀏覽器打開ComfyUI的使用界面, 或者在網址欄輸入 http://127.0.0.1:8188 也可以:

image-20250328141326584

image-20250328141419401

然后,將剛才下載好的 Json 格式的工作流文件直接拖入這個界面即可:

image-20250328141609344

image-20250328141649403

使用文生視頻前,可以先右鍵保存動畫模塊,在模式中選擇Always,這樣以后生成的視頻都會被自動保存下來:

image-20250328143630913

然后在編輯器中輸入提示詞(中英文都可以),點擊運行即可啟動文生視頻工作流:

image-20250328142250430

例:一個小男孩在海邊提足球

image-20250328143946700

默認生成的視頻參數是832*480,如果需要修改可以在這里對寬度和高度進行調整:

image-20250328145040115

默認視頻長度是33,如果需要修改可以在這里調整,更長的時長也需要更多的時間來生成視頻:

image-20250328150414291

外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳

4. 公網使用Wan2.1模型生成視頻

現在我們已經在本地成功部署了Wan2.1模型,并通過ComfyUI工作流來使用文字生成視頻了,但如果我們部署的這臺電腦配置不錯,使用這款大模型毫無壓力,要是我們出門時,或者是想團隊多人使用,打算遠程調用這臺電腦上部署的大模型應該怎么辦呢?

很簡單,我們只需要安裝Cpolar內網穿透工具就能輕松實現公網環境遠程訪問本地部署的服務!通過它,我們可以免去復雜得本地部署過程,只需要一個公網地址就可以隨時隨地訪問到ComfyUI中來使用Wan2.1模型來生成視頻了。也無需自己注冊域名購買云服務器,下面是安裝cpolar步驟:

cpolar官網地址: https://www.cpolar.com

點擊進入cpolar官網,點擊免費使用注冊一個賬號,并下載最新版本的Cpolar。

img

登錄成功后,點擊下載Cpolar到本地并安裝(一路默認安裝即可)本教程選擇下載Windows版本。

image-20240319175308664

Cpolar安裝成功后,在瀏覽器上訪問http://localhost:9200,使用cpolar賬號登錄,登錄后即可看到Cpolar web 配置界面,結下來在web 管理界面配置即可。

img

4.1 創建遠程連接公網地址

登錄cpolar web UI管理界面后,點擊左側儀表盤的隧道管理——創建隧道:

  • 隧道名稱:可自定義,本例使用了: wan21 注意不要與已有的隧道名稱重復
  • 協議:http
  • 本地地址:8188
  • 域名類型:隨機域名
  • 地區:選擇China Top
  • 高級:Http Auth:user:123(本例中用戶名user 密碼123)

點擊保存

image-20250328151828884

創建成功后,打開左側在線隧道列表,可以看到剛剛通過創建隧道生成了兩個公網地址,接下來就可以在其他電腦(異地)上,使用任意一個地址在瀏覽器中訪問即可。

image-20250328151931960

如下圖所示,輸入設置的用戶名user及密碼123(也可以不設置高級,就無需用戶名密碼直接登入,安全起見,建議配置密碼,避免他人蹭顯卡算力_

image-20250328152127049

可以看到成功實現使用公網地址異地遠程訪問本地部署的ComfyUI使用Wan2.1大模型!

image-20250328152237587

需要注意的是首次登錄,默認顯示的工作流可能不是我們剛才使用的工作流配置,點擊左邊菜單欄中的隊列,在之前保存過的視頻中,右鍵加載工作流,即可遠程使用對應的工作流來生成視頻啦!

image-20250328152609754

小結

為了方便演示,我們在上邊的操作過程中使用了cpolar生成的HTTP公網地址隧道,其公網地址是隨機生成的。這種隨機地址的優勢在于建立速度快,可以立即使用,然而,它的缺點是網址是隨機生成,這個地址在24小時內會發生隨機變化,更適合于臨時使用。

如果有長期遠程訪問本地部署的ComfyUI使用Wan2.1大模型或者其他本地服務的需求,但又不想每天重新配置公網地址,還想地址好看又好記,那我推薦大家選擇使用固定的二級子域名方式來遠程訪問,帶寬會更快,使用cpolar在其他用途還可以保留多個子域名,支持多個cpolar在線進程。(根據cpolar套餐而定)

5. 固定遠程訪問公網地址

由于以上使用cpolar所創建的隧道使用的是隨機公網地址,24小時內會隨機變化,不利于長期遠程訪問。因此我們可以為其配置二級子域名,該地址為固定地址,不會隨機變化。

注意需要將cpolar套餐升級至基礎套餐或以上,且每個套餐對應的帶寬不一樣。【cpolar.cn已備案】

登錄cpolar官網,點擊左側的預留,選擇保留二級子域名,地區選擇china top,然后設置一個二級子域名名稱,自定義即可,然后填寫備注信息,點擊保留。

image-20250328153007281

保留成功后復制保留的二級子域名地址:mywan21

image-20250328153056392

登錄cpolar web UI管理界面,點擊左側儀表盤的隧道管理——隧道列表,找到所要配置的隧道wan21,點擊右側的編輯

image-20250328153132963

修改隧道信息,將保留成功的二級子域名配置到隧道中

  • 域名類型:選擇二級子域名
  • Sub Domain:填寫保留成功的二級子域名
  • 地區: China TOP

點擊更新

image-20250328153226764

更新完成后,打開在線隧道列表,此時可以看到隨機的公網地址已經發生變化,地址名稱也變成了保留和固定的二級子域名名稱。

image-20250328153300357

最后,我們使用固定的公網地址訪問 ComfyUI 可以看到訪問成功,一個永久不會變化的遠程訪問方式即設置好了,同樣需要輸入在高級中配置的用戶名和密碼登錄。

image-20250328153357978

image-20250328153538574

總結

通過本次技術實踐,相信各位已經掌握了基于公網地址實現遠程操控本地Wan2.1模型的核心要領。這個創新性解決方案不僅支持通過專屬訪問通道與協作團隊實時共享,更能顯著提升跨地域協作效率。對于獨立開發者而言,該系統同樣具備卓越的遠程接入能力,可無縫適配各類終端設備。

本方案完整整合了ComfyUI平臺、Wan2.1模型及cpolar內網穿透技術三重優勢,構建出完整的AI創作生態體系。這套工具組合徹底解決了AI創作的時空限制,讓高質量視頻生成突破物理環境約束,實現真正的全天候、全場景創作自由。

使用軟件資源鏈接:https://pan.baidu.com/s/1N46hOSsSsVr848cWXxTVzA?pwd=6666

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83165.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83165.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83165.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

n8n:技術團隊的智能工作流自動化助手

在當前數字化時代,自動化已經成為提高效率和減輕人工工作負擔的一大推動力。今天,我們要為大家介紹一款極具潛力的開源項目——n8n,它不僅擁有廣泛的應用場景,還具備內置AI功能,能夠完全滿足技術團隊的高效工作需求。n8n的出現,為技術團隊提供了自由編程與快速自動化構建…

1,QT的編譯教程

目錄 整體流程: 1,新建project文件 2,編寫源代碼 3,打開QT的命令行窗口 4,生成工程文件(QT_demo.pro) 5,生成Make file 6,編譯工程 7,運行編譯好的可執行文件 整體流程: 1,新建project文件 新建文本文件,后綴改為.cpp 2,編寫源代碼

深度學習論文: FastVLM: Efficient Vision Encoding for Vision Language Models

深度學習論文: FastVLM: Efficient Vision Encoding for Vision Language Models FastVLM: Efficient Vision Encoding for Vision Language Models PDF: https://www.arxiv.org/abs/2412.13303 PyTorch代碼: https://github.com/shanglianlm0525/CvPytorch PyTorch代碼: https…

十一、【核心功能篇】測試用例管理:設計用例新增編輯界面

【核心功能篇】測試用例管理:設計用例新增&編輯界面 前言準備工作第一步:創建測試用例相關的 API 服務 (src/api/testcase.ts)第二步:創建測試用例編輯頁面組件 (src/views/testcase/TestCaseEditView.vue)第三步:配置測試用例…

三、web安全-信息收集

1、信息搜集的重要性 (1)明確攻擊面 信息搜集能讓滲透測試人員清晰地勾勒出目標系統的邊界,包括其網絡拓撲結構、開放的服務端口、運行的軟件系統等。例如,通過信息搜集發現目標企業除了對外提供官網服務外,還有一個…

生活小記啊

最近生活上的事情還是蠻多的,想到哪寫到哪。 工作 三月的某個周六,正在加班寫技術方案,大晚上寫完了聽到調動通知,要去新的團隊了。 還是蠻不舍的,看著產品從無到有,一路走過來,傾注了不少感…

vue-08(使用slot進行靈活的組件渲染)

使用slot進行靈活的組件渲染 作用域slot是 Vue.js 中的一種強大機制,它允許父組件自定義子組件內容的呈現。與僅向下傳遞數據的常規 props 不同,作用域 slot 為父級提供了一個模板,然后子級可以填充數據。這提供了高度的靈活性和可重用性&am…

MySQL索引與性能優化入門:讓查詢提速的秘密武器【MySQL系列】

本文將深入講解 MySQL 索引的底層原理、常見類型、使用技巧,并結合 EXPLAIN 工具分析查詢執行計劃,配合慢查詢日志識別瓶頸,逐步建立起系統的 MySQL 查詢優化知識體系。適合有一定基礎、希望在數據量增長或面試中脫穎而出的開發者閱讀。 一、…

C 語言開發中常見的開發環境

目錄 1.Dev-C 2.Visual Studio Code 3.虛擬機 Linux 環境 4.嵌入式 MCU 專用開發環境 1.Dev-C 使用集成的 C/C 開發環境(適合基礎學習),下載鏈接Dev-C下載 - 官方正版 - 極客應用 2.Visual Studio Code 結合 C/C 擴展 GCC/MinGW 編譯器&#xff0c…

STM32G4 電機外設篇(二) VOFA + ADC + OPAMP

目錄 一、STM32G4 電機外設篇(二) VOFA ADC OPAMP1 VOFA1.1 VOFA上位機顯示波形 2 ADC2.1 用ADC規則組對板載電壓和電位器進行采樣 3 OPAMP(運放)3.1 結合STM32內部運放和ADC來完成對三相電流的采樣3.2 運放電路分析 附學習參考…

再見Notepad++,你好Notepad--

Notepad-- 是一款國產開源的輕量級、跨平臺文本編輯器,支持 Window、Linux、macOS 以及國產 UOS、麒麟等操作系統。 除了具有常用編輯器的功能之外,Notepad-- 還內置了專業級的代碼對比功能,支持文件、文件夾、二進制文件的比對,支…

跳動的愛心

跳動的心形圖案&#xff0c;通過字符打印和延時效果模擬跳動&#xff0c;心形在兩種大小間交替跳動。 通過數學公式生成心形曲線 #include <stdio.h> #include <windows.h> // Windows 系統頭文件&#xff08;用于延時和清屏&#xff09; void printHeart(int …

2.2HarmonyOS NEXT高性能開發技術:編譯優化、內存管理與并發編程實踐

HarmonyOS NEXT高性能開發技術&#xff1a;編譯優化、內存管理與并發編程實踐 在HarmonyOS NEXT全場景設備開發中&#xff0c;高性能是跨端應用體驗的核心保障。本章節聚焦ArkCompiler編譯優化、內存管理工具及多線程并發編程三大技術模塊&#xff0c;結合實戰案例解析底層實現…

C# 類和繼承(使用基類的引用)

使用基類的引用 派生類的實例由基類的實例和派生類新增的成員組成。派生類的引用指向整個類對象&#xff0c;包括 基類部分。 如果有一個派生類對象的引用&#xff0c;就可以獲取該對象基類部分的引用&#xff08;使用類型轉換運算符把 該引用轉換為基類類型&#xff09;。類…

如何在騰訊云 OpenCloudOS 上安裝 Docker 和 Docker Compose

從你提供的 /etc/os-release 文件內容來看&#xff0c;你的服務器運行的是 OpenCloudOS 9.2。這是一個基于 CentOS 和 RHEL 的開源操作系統&#xff0c;因此它屬于 CentOS/RHEL 系列。 關鍵信息總結 操作系統名稱&#xff1a;OpenCloudOS版本&#xff1a;9.2ID&#xff1a;op…

趨勢直線指標

趨勢直線副圖和主圖指標&#xff0c;旨在通過技術分析工具幫助交易者識別市場趨勢和潛在的買賣點。 副圖指標&#xff1a;基于KDJ指標的交易策略 1. RSV值計算&#xff1a; - RSV&#xff08;未成熟隨機值&#xff09;反映了當前收盤價在過去一段時間內的相對位置。通過計算當前…

FEMFAT許可分析的數據可視化方法

隨著企業對FEMFAT軟件使用的增加&#xff0c;如何有效地管理和分析許可數據成為了關鍵。數據可視化作為一種強大的工具&#xff0c;能夠幫助企業直觀地理解FEMFAT許可的使用情況&#xff0c;從而做出更明智的決策。本文將介紹FEMFAT許可分析的數據可視化方法&#xff0c;并探討…

AMBER軟件介紹

AMBER軟件介紹 AMBER&#xff08;Assisted Model Building with Energy Refinement&#xff09;是一套廣泛應用于分子動力學&#xff08;MD&#xff09;模擬和生物分子結構分析的軟件工具集&#xff0c;尤其在蛋白質、核酸、多糖等生物大分子的模擬中表現突出。以下是關于AMBE…

GoogLeNet網絡模型

GoogLeNet網絡模型 誕生背景 在2014年的ImageNet圖像識別挑戰賽中&#xff0c;一個GoogLeNet的網絡架構大放異彩&#xff0c;與VGG不同的是&#xff0c;VGG用的是3*3的卷積&#xff0c;而GoogLeNet從1*1到7*7的卷積核都用&#xff0c;也就是使用不同大小的卷積核組合。 網絡…

Free2AI:企業智能化轉型的加速器

隨著數字化與智能化的深度交融&#xff0c;企業的競爭舞臺已悄然轉變為數據處理能力和智能服務水平的競技場。Free2AI以其三大核心功能——智能數據采集、多格式文檔解析、智能FAQ構建&#xff0c;為企業鋪設了一條從數據洞察到智能服務的全鏈路升級之路&#xff0c;成為推動企…