Stand-In 是一個輕量級、即插即用的身份保護視頻生成框架,只需要上傳一張人物照片,加上一段提示詞,即可生成高度一致性的高保真人物視頻,人臉相似度和自然都幾乎達到100%還原水平。
Stand-In 能把任何一張人臉(甚至動漫角色、寵物)無縫“貼”到 AI 生成的視頻里,只要你有一張圖、一句話,Stand-In 就能把它變成會動的、長得像的視頻。
Stand-In 支持保持身份的文本到視頻生成,非人類主體保留視頻生成,保持身份的風格化視頻生成以及視頻人臉交換和姿態引導視頻生成(使用 VACE)等。
應用領域
人像定制短片:上傳自拍,一句話生成“我在海邊跳舞”的 5 秒視頻。
虛擬主播/數字人:讓 2D 動漫角色或 3D 形象開口說話。
影視級幻臉:把參考視頻里的主角換成指定演員,省時省預算。
風格化創作:宮崎駿風、賽博朋克風……換了臉還能換畫風。
非人類角色:貓狗、吉祥物也能當主角,保持原樣“出鏡”。
使用教程:(建議N卡,顯存16G起。支持50系顯卡)
下載壓縮包和ComfyUI文件夾,解壓后,將ComfyUI拷貝到ComfyUI_Stand-In目錄下。
雙擊啟動,點擊左側工作流(文件夾圖標),選擇Stand-In.json導入工作流,上傳自己的人物圖片,填寫提示詞,運行即可。
當前版本對顯卡要求較高,只適合體驗。但生成效果是真的好,有類似需求的可以先體驗,等后有量化版本會第一時間更新。
實測RTX4080需要搭配共享顯存,生成5s視頻需要15分鐘左右。RTX4090生成5s視頻需要7分鐘左右。
下面是我實測的效果以及官方示例
下載地址:點此下載