AI視頻領域的DeepSeek—阿里萬相2.1圖生視頻

讓我們一同深入探索萬相 2.1 ,本文不僅介紹其文生圖和文生視頻的使用秘籍,還將手把手教你如何利用它實現圖生視頻。

如下為生成的視頻效果(我錄制的GIF動圖)

如下為輸入的圖片

目錄

1.阿里巴巴全面開源旗下視頻生成模型萬相2.1模型

2.手把手教你圖生視頻


1.阿里巴巴全面開源旗下視頻生成模型萬相2.1模型

2月25日晚,阿里巴巴宣布全面開源旗下視頻生成模型萬相2.1模型。據介紹,此次開源基于Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在Github、HuggingFace和魔搭社區下載體驗。

通義萬相是阿里云通義系列AI繪畫創作大模型,可輔助人類進行圖片創作,于2023年7月7日正式上線。在2024年9月19日的阿里云棲大會上,阿里發布了通義萬相視頻生成大模型。該模型可以生成影視級高清視頻,而且更能聽懂中國話,被外界稱為“最懂中國風”的視頻大模型。今年1月初,通義萬相視頻生成模型宣布升級至2.1版,憑借著優秀的表現,在權威評測榜單VBench中登上榜首。

阿里云旗下視覺生成基座模型萬相2.1(Wan)重磅開源,此次開源采用最寬松的Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在Github、HuggingFace和魔搭社區下載體驗。

據介紹,14B萬相模型在指令遵循、復雜運動生成、物理建模、文字視頻生成等方面表現突出,在權威評測集VBench中,萬相2.1以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外模型,穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成高質量視頻,適用于二次模型開發和學術研究。

萬相2.1以總分86.22%的成績穩居VBench榜單第一

在算法設計上,萬相基于主流DiT架構和線性噪聲軌跡Flow Matching范式,研發了高效的因果3D VAE、可擴展的預訓練策略等。以3D VAE為例,為了高效支持任意長度視頻的編碼和解碼,萬相在3D VAE的因果卷積模塊中實現了特征緩存機制,從而代替直接對長視頻端到端的編解碼過程,實現了無限長1080P視頻的高效編解碼。此外,通過將空間降采樣壓縮提前,在不損失性能的情況下進一步減少了29%的推理時內存占用。

阿里通義萬相2.1文生圖和文生視頻可以查看如下鏈接

快速高效使用——阿里通義萬相2.1的文生圖、文生視頻功能-CSDN博客https://archie.blog.csdn.net/article/details/146015609?spm=1001.2014.3001.5502接下來手把手教你圖生視頻

2.手把手教你圖生視頻

首先登錄如下云服務器

https://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51ehttps://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51e進入后,點擊頁面上欄中的“應用市場”。

點擊阿里萬相2.1圖生視頻的部署按鈕?

在彈出的窗口中,選擇GPU型號4090?

等待 創建空間成功

然后點擊快速啟動應用?

跳轉到如下界面?

?1)創建工作流模板,工作流 >> 瀏覽模板

選擇480P模板

?2)上傳圖片

輸入想要生成的視頻信息?, 點擊最下方的執行

3)查看隊列,視頻生成中,需等待幾分鐘

?4)查看生成視頻

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/897179.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/897179.shtml
英文地址,請注明出處:http://en.pswp.cn/news/897179.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

驅動 AI 邊緣計算新時代!高性能 i.MX 95 應用平臺引領未來

智慧浪潮崛起:AI與邊緣計算的時代 正悄然深植于我們的日常生活之中,無論是火熱的 ChatGPT 與 DeepSeek 語言模型,亦或是 Meta 智能眼鏡,AI 技術已經無形地影響著我們的生活。這股變革浪潮并未停歇,而是進一步催生了更高…

如何快速判斷IP是否為代理

1.探究IP地址的地理分布 代理IP的所在位置,往往與用戶實際所在地不吻合。可以通過運用WHOIS查詢工具或在線IP地址定位服務,輸入所需查詢的IP,即可獲得其地理位置信息。 若該信息顯示的位置并非用戶所在城市或顯示為知名代理服務器節點&…

從CL1看生物計算機的創新突破與發展前景:技術、應用與挑戰的多維度剖析

一、引言 1.1 研究背景與意義 隨著科技的飛速發展,計算機技術已經成為推動現代社會進步的核心力量之一。從最初的電子管計算機到如今的大規模集成電路計算機,計算機的性能得到了極大的提升,應用領域也不斷拓展。然而,傳統計算機…

AI革命先鋒:DeepSeek與藍耘通義萬相2.1的無縫融合引領行業智能化變革

云邊有個稻草人-CSDN博客 目錄 引言 一、什么是DeepSeek? 1.1 DeepSeek平臺概述 1.2 DeepSeek的核心功能與技術 二、藍耘通義萬相2.1概述 2.1 藍耘科技簡介 2.2 藍耘通義萬相2.1的功能與優勢 1. 全鏈條智能化解決方案 2. 強大的數據處理能力 3. 高效的模型…

zabbix圖表中文顯示方框

問題: zabbix安裝完成后,查看圖形,下方中文顯示為方框 思路: 替換字體文件,或者修改配置文件指向中文可以正常顯示的字體文件 方案: 查找資料確認影響因素 通過資料查詢得知,使用的字體文…

【Linux-網絡】HTTP的清風與HTTPS的密語

🎬 個人主頁:誰在夜里看海. 📖 個人專欄:《C系列》《Linux系列》《算法系列》 ?? 道阻且長,行則將至 目錄 📚 引言 📚 一、HTTP 📖 1.概述 📖 2.URL &#x1f5…

通過數據庫網格架構構建現代分布式數據系統

在當今微服務驅動的世界中,企業在跨分布式系統管理數據方面面臨著越來越多的挑戰。數據庫網格架構已成為應對這些挑戰的強大解決方案,它提供了一種與現代應用架構相匹配的分散式數據管理方法。本文將探討數據庫網格架構的工作原理,以及如何使…

RangeError: Radix must be an integer between 2 and 36

🤍 前端開發工程師、技術日更博主、已過CET6 🍨 阿珊和她的貓_CSDN博客專家、23年度博客之星前端領域TOP1 🕠 牛客高級專題作者、打造專欄《前端面試必備》 、《2024面試高頻手撕題》、《前端求職突破計劃》 🍚 藍橋云課簽約作者、…

荊為好的專欄推薦

🤟致敬讀者 🟩感謝閱讀🟦笑口常開🟪生日快樂?早點下班 📘博主相關 🟧博主信息🟨博客首頁🟫專欄推薦🟥活動信息 文章目錄 專欄推薦特別篇1. 后端專欄推薦2. 云原生專欄…

Bean 的生命周期主要包括以下階段:

Bean 的生命周期主要包括以下階段: 定義 :在配置文件或注解中定義 Bean,包括其類、作用域等信息。 實例化 :Spring 容器根據定義創建 Bean 的實例。 屬性賦值 :容器為 Bean 設置配置的屬性值。 初始化 :…

計算機基礎:二進制基礎06,用八進制來計數

專欄導航 本節文章分別屬于《Win32 學習筆記》和《MFC 學習筆記》兩個專欄,故劃分為兩個專欄導航。讀者可以自行選擇前往哪個專欄。 (一)WIn32 專欄導航 上一篇:計算機基礎:二進制基礎05,八進制簡介 回…

圖論-腐爛的橘子

994.腐爛的橘子 在給定的 m x n 網格 grid 中,每個單元格可以有以下三個值之一:值 0 代表空單元格; 值 1 代表新鮮橘子; 值 2 代表腐爛的橘子。 每分鐘,腐爛的橘子 周圍 4 個方向上相鄰 的新鮮橘子都會腐爛。返回 直到…

TypeError: Cannot create property ‘xxx‘ on string ‘xxx‘

🤍 前端開發工程師、技術日更博主、已過CET6 🍨 阿珊和她的貓_CSDN博客專家、23年度博客之星前端領域TOP1 🕠 牛客高級專題作者、打造專欄《前端面試必備》 、《2024面試高頻手撕題》、《前端求職突破計劃》 🍚 藍橋云課簽約作者、…

嵌入式硬件設計SPI時需要注意什么?

嵌入式硬件設計SPI時需要注意什么? 1. 硬件設計注意事項 關鍵點注意事項1. 信號完整性- 縮短SCK、MOSI、MISO的走線長度,避免反射干擾。- 使用屏蔽線或差分信號(高速場景)。- 阻抗匹配(特別是高頻信號,如50Ω端接)。2. 電源與地線- 電源去耦:每個SPI芯片的VCC附近放置0…

git-filter-repo 清除大文件教程

git filter-repo 是一個用于過濾和清理 Git 倉庫歷史的工具,它可以高效地批量修改提交歷史中的文件內容、刪除文件、重命名文件以及進行其他歷史重構操作。相較于 git filter-branch,它通常更快且更易于使用。 以下是一個基本示例,說明如何使…

STM32之軟件SPI

SPI傳輸更快,最大可達80MHz,而I2C最大只有3.4MHz。輸入輸出是分開的,可以同時輸出輸入。是同步全雙工。僅支持一主多從。SS是從機選擇線。每個從機一根。SPI無應答機制的設計。 注意:所有設備需要共地,時鐘線主機輸出&…

Git清理本地殘留的、但已經在服務器上被刪除的分支

要篩選出已經被服務器刪除的本地分支,并在本地刪除這些分支,可以按照以下步驟進行操作: 步驟 1: 獲取遠程分支信息,確保本地的遠程分支信息是最新的: git fetch -p步驟 2: 列出本地分支和遠程分支: git …

DeepSeek 掌舵創意方向+即夢 AI 繪制夢幻藍圖,引領創作潮流

我的個人主頁 我的專欄: 人工智能領域、java-數據結構、Javase、C語言,希望能幫助到大家!!! 點贊👍收藏? 前言 在當今數字化浪潮洶涌澎湃的時代,人工智能已然成為推動各領域變革與創新的核心驅…

elasticsearch商業產品

Elasticsearch商業產品介紹 在當今數字化時代,數據如同石油一樣珍貴。而要從海量的數據中提取有價值的信息,則需要強大的工具。這就是Elasticsearch商業產品的用武之地。Elasticsearch是一款開源的搜索引擎,它能夠快速地存儲、搜索和分析大規…

DeepSeek本地接口調用(Ollama)

前言 上篇博文,我們通過Ollama搭建了本地的DeepSeek模型,本文主要是方便開發人員,如何通過代碼或工具,通過API接口調用本地deepSeek模型 前文:DeepSeek-R1本地搭建_deepseek 本地部署-CSDN博客 注:本文不僅…