Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos

Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free Videos

bicheng/2025/8/21 16:11:32/文章來源:https://blog.csdn.net/weixin_44994838/article/details/139268775

清華深&港科&深先進&Tencent AAAI24
https://github.com/mayuelala/FollowYourPose

問題引入

本文的任務是根據文本來生成高質量的角色視頻，并且可以通過pose來控制任務的姿勢；
當前缺少video-pose caption數據集，所以提出一個兩階段的訓練，可以利用image-pose數據和pose free video數據；
第一階段首先使用pose-image pair來訓練pose encoder，第二階段使用pose free video來訓練時序模塊；

methods

將任務分解為兩個子問題，首先image-pose pair數據來實現pose控制，視頻數據來實現幀間的一致性；
訓練階段1Pose-Controllable Text-to-Image Generation：pose encoder模塊 $E_p$
訓練階段2Video Generation via Pose-free Videos：時序模塊；

實驗

Laion-Pose訓練第一階段，HDVILA第二階段；

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/17702.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/17702.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/17702.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Java的上下轉型與多態

Java的上下轉型與多態

上下轉型首先，定義一個父類Person // 父類 class Person {public void run(){System.out.println("person 中的 run");}public void eat(){System.out.println("Person 中的 eat");}}接著定義一個繼承自父類的子類Student: // 子類 class S…

閱讀更多...

拿捏數據結構- 鏈式二叉樹

拿捏數據結構- 鏈式二叉樹

鏈式二叉樹的概念： 鏈式二叉樹解決的是非完全二叉樹解決不了的問題什么意思呢，簡單的說就是，鏈式二叉樹可以是下面三種二叉樹但是非鏈式二叉樹只能是前兩種鏈式二叉樹的存儲節點結構：首先定義一個結構體或類來表示二叉樹的節…

閱讀更多...

機器學習-7-機器學習中常用的可視化方式總結

機器學習-7-機器學習中常用的可視化方式總結

參考通透！！監督學習和無監督學習全總結！參考機器學習中的可視化 1 監督學習和無監督學習監督學習和無監督學習，它們之間的主要區別在于訓練數據的標簽信息是否提供。 1.1 概述一、監督學習(Supervised Learning)： (1)標簽信息：監督學習使用帶有標簽的訓練數據。這…

閱讀更多...

單元測試的實現方式

單元測試的實現方式

單元測試的實現方式包括：人工靜態檢查、動態執行跟蹤人工靜態檢查人工靜態檢查是一種單元測試實現方式，它主要依賴開發人員的人工代碼審查和靜態分析工具來識別潛在的代碼問題。代碼審查：開發人員通過仔細檢查代碼來發現潛在的問題。他…

閱讀更多...

不怕YOLOv10高歌猛進，我有YOLOv8穩扎穩打

不怕YOLOv10高歌猛進，我有YOLOv8穩扎穩打

YOLOv10 出來有幾天時間了，這次我沒有選擇第一時間出文章解析，如此頻繁的發布數字版本的 YOLO 著實讓人頭疼，雖然數字的更新并非舊版技術的過時， 但是這肯定會讓很多在校同學增加很多焦慮情緒。這里還是請大家辯證看待。 v10 這次…

閱讀更多...

解密消息隊列的復制魔法：RocketMQ vs Kafka

解密消息隊列的復制魔法：RocketMQ vs Kafka

解密消息隊列的復制魔法：RocketMQ vs Kafka 今天我們來聊聊一個在消息隊列世界中至關重要的主題：消息復制。消息復制不僅能防止消息丟失，還能確保系統的高可用性。即使某個節點宕機了，其他節點依然可以繼續工作。那么&#xff0c…

閱讀更多...

區間選點問題-貪心-C++

區間選點問題-貪心-C++

問題： 給定 𝑁 個閉區間 [ai,bi]，請你在數軸上選擇盡量少的點，使得每個區間內至少包含一個選出的點。輸出選擇的點的最小數量。位于區間端點上的點也算作區間內。輸入格式第一行包含整數 𝑁，表示區間數…

閱讀更多...

CSS文本粒子動畫特效之愛心粒子文字特效-Canvas

CSS文本粒子動畫特效之愛心粒子文字特效-Canvas

1. 效果圖 2.完整代碼 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><style>body,html {margin: 0;paddin…

閱讀更多...

order by工作過程和優化

order by工作過程和優化

工作過程 order by 是由優化器決定的，如果優化器認為filesort速度快，那么走filesort排序，如果優化器認為索引速度快，那么走索引排序。

閱讀更多...

有一個3x4的矩陣，求矩陣中所有元素中的最大值。要求用函數處理

有一個3x4的矩陣，求矩陣中所有元素中的最大值。要求用函數處理

解此題的算法已在之前的文章中介紹，詳見：https://mp.csdn.net/mp_blog/creation/editor/139181787 編寫程序： 運行結果：

閱讀更多...

常用的字符串方法

常用的字符串方法

length() 返回字符串的長度。 let str "HelloWorld"; console.log(str.length); // 10charAt() 返回指定位置的字符。參數：位置索引。 let str "HelloWorld"; console.log(str.charAt(5)); // Wconcat() 連接字符串。參數：一…

閱讀更多...

昵稱生成器

昵稱生成器

package mainimport ("math/rand" )// 隨機昵稱形容詞 var nicheng_tou []string{"迷你的", "鮮艷的", "飛快的", "真實的", "清新的", "幸福的", "可耐的", "快樂的", "冷…

閱讀更多...

卷徑計算(PID輸出補償法 SCL源代碼)

卷徑計算(PID輸出補償法 SCL源代碼)

卷徑計算有很多方法，這里我們提供另一個思路，這里我們采用的是通過速度控制間接控制張力通過線速度和系統卷徑我們可以計算出我們的速度前饋量(主速度)。具體收放卷前饋量計算可以參考下面文章鏈接：收放卷前饋量計算FC(梯形圖+SCL代碼)-CSDN博客文章瀏覽閱讀584次。這篇博…

閱讀更多...

【數據分析面試】55. 尋找雙詞組 (Python)

【數據分析面試】55. 尋找雙詞組 (Python)

題目： 尋找雙詞組 （Python） 編寫一個名為 find_bigrams 的函數，該函數接收一個句子或段落的字符串，并按順序返回其所有雙詞組的列表。注意： 雙詞組是指連續的兩個單詞。示例： 輸入&#x…

閱讀更多...

JavaScript（ES6）入門

JavaScript（ES6）入門

ES6 1、介紹 ECMAScript 6（簡稱ES6）是于2015年6月正式發布的JavaScript 語言的標準，正式名為ECMAScript 2015（ES2015）。它的目標是使得JavaScript語言可以用來編寫復雜的大型應用程序，成為企業級開發語言。…

閱讀更多...

Dolphinscheduler不重啟加載Oracle驅動

Dolphinscheduler不重啟加載Oracle驅動

轉載自劉茫茫看山問題背景某天我們的租戶反饋數據庫連接缺少必要的驅動，我們通過日志查看確實是缺少部分數據庫的驅動，因為DolphinScheduler默認只帶了Oracle和MySQL的驅動，并且需要將pom文件中的test模式去掉才可以在打包的時候引入。我…

閱讀更多...

Unity Dotween 定位點的制作

Unity Dotween 定位點的制作

目錄前言一、動畫預覽二、動畫拆分三、素材準備四、曲線 OutCirc詳解五、速度分類詳解六、代碼七、組件和設置八、作者的話前言我答應我的粉絲接下來更新Dotween系列，但是我一直沒想好，從哪里開始講。 Dotween的安裝我就跳過了&…

閱讀更多...

QtCreator調試運行工程報錯，無法找到相關庫的的解決方案

QtCreator調試運行工程報錯，無法找到相關庫的的解決方案

最新在使用國產化平臺做qt應用開發時，總是遇到qtcreator內調試運行找不到動態庫的問題，為什么會出現這種問題呢？明明編譯的時候能夠正常通過，運行或者調試的時候找不到相關的庫呢？先說結論，排除庫本身的問…

閱讀更多...

Flutter 中的 AnimatedList 小部件：全面指南

Flutter 中的 AnimatedList 小部件：全面指南

Flutter 中的 AnimatedList 小部件：全面指南在Flutter中，AnimatedList是一個專門用于展示和管理一個有序列表的組件，它可以對列表中的項進行添加、移除和重新排序操作，并且這些操作都伴隨著動畫效果。這使得AnimatedList非常適合…

閱讀更多...

精釀啤酒：品質與口感在消費者選擇中的權重分析

精釀啤酒：品質與口感在消費者選擇中的權重分析

在啤酒市場中，消費者選擇的影響因素眾多，其中品質與口感是兩個核心要素。對于Fendi club啤酒而言，品質與口感的權重分析在消費者選擇中顯得尤為重要。品質是消費者選擇啤酒的首要因素。隨著消費者對啤酒認知的提高，他們對品質的…

閱讀更多...

最新文章