阿里萬相,正式開源

大家好,我是小悟。

阿里萬相正式開源啦。這就像是AI界突然開啟了一扇通往寶藏的大門,而且還是免費向所有人敞開的那種。

你想想看,在這個科技飛速發展的時代,AI就像是擁有神奇魔法的魔法師,不斷地給我們帶來各種意想不到的驚喜。而阿里萬相,就是這個魔法師團隊里的新星。

2 月 25 日晚間,阿里云旗下的視覺生成基座模型萬相2.1(Wan)正式開源啦。這消息一出來,就像是在平靜的湖面上投下了一顆重磅炸彈,瞬間在科技界引起了軒然大波。

圖片

阿里萬相這次開源,可是誠意滿滿。它采用了最寬松的Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源。

這就好比是一個慷慨的美食家,把自己精心準備的美味佳肴毫無保留地端了出來,大家可以盡情品嘗。

它還支持文生視頻和圖生視頻任務哦。你沒聽錯,只要你有想法,無論是寫一段生動的文字描述,還是上傳一張創意滿滿的圖片,萬相都能像變魔術一樣,為你生成炫酷的視頻。

說到這,你可能會問,這個萬相到底有多厲害呢?那可真是不容小覷。14B萬相模型在指令遵循、復雜運動生成、物理建模、文字視頻生成等方面那表現,簡直可以用“驚艷”來形容。

圖片

在權威評測集VBench中,萬相2.1以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外模型,穩居榜首位置。這就好比是在一場激烈的賽跑比賽中,它像一陣風一樣,把其他選手遠遠地甩在了后面。

而1.3B版本也毫不遜色,它的測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型。這就好比是一個小個子選手,憑借著自己的實力,和那些身材高大的選手一較高下,還取得了不俗的成績。

更讓人驚喜的是,這個1.3B版本能在消費級顯卡運行,僅需8.2GB顯存就可以生成高質量視頻。這對于很多人來說,簡直是一個福音。

以后,無論你是專業的AI開發者,還是業余的編程愛好者,甚至是只是對視頻生成好奇的小伙伴,都可以用自己電腦里的顯卡,體驗一下萬相的神奇魔力。

圖片

阿里萬相之所以這么厲害,是因為它的團隊在算法設計上可是下了大功夫的。它基于主流DiT架構和線性噪聲軌跡Flow Matching范式,研發了高效的因果3D VAE、可擴展的預訓練策略等一系列黑科技。

就拿3D VAE來說吧,為了實現高效支持任意長度視頻的編碼和解碼,萬相在3D VAE的因果卷積模塊中實現了特征緩存機制。

這就好比是在一條繁忙的公路上,增加了一個高效的調度中心,讓車輛的通行變得更加順暢,從而代替了直接對長視頻端到端的編解碼過程,實現了無限長1080P視頻的高效編解碼。

而且通過將空間降采樣壓縮提前,在不損失性能的情況下進一步減少了29%的推理時內存占用。這就像是一個精明的管家,把資源管理得井井有條,讓一切都有條不紊地運行。

萬相團隊的實驗結果也充分證明了它的實力。在運動質量、視覺質量、風格和多目標等14個主要維度和26個子維度測試中,萬相均達到了業界領先表現,并且斬獲5項第一。

圖片

這就好比是在一場選美比賽中,它憑借自己的才華和魅力,贏得了評委們的一致認可。特別是在復雜運動和物理規律遵循上的表現上大幅提升。

它能穩定展現各種復雜的人物肢體運動,像旋轉、跳躍、轉身、翻滾等動作,都能做得栩栩如生。還能精準還原碰撞、反彈、切割等復雜真實物理場景,仿佛給虛擬世界裝上了真實的物理引擎。

阿里從2023年開始,就堅定地走上了大模型開源路線。就像是一個有遠見的探險家,發現了一條充滿希望的道路,然后毫不猶豫地帶著大家一起前行。

自2023年8月起,阿里云相繼開源了Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大語言、多模態、數學和代碼等全模態,多次登上國內外權威榜單,已成為全球開源社區最重要的模型系列。

圖片

阿里云千問(Qwen)衍生模型數量已超過10萬個,是全球最大的AI模型家族。這一次萬相的正式開源,無疑是給這個龐大的AI模型家族注入了新的活力。

從應用角度看,萬相模型可以說是“百變精靈”。它可生成影視級高清視頻,能應用于影視創作、動畫設計、廣告設計等領域。

想象一下,你的創意和萬相的強大功能相結合,說不定能創造出令人驚嘆的作品。就像電影導演們有了一個神奇的助手,能夠更加輕松地實現他們的奇思妙想。動畫設計師們也能借助萬相的力量,讓他們的角色和場景更加生動逼真。

隨著萬相的開源,阿里云也實現了全模態、全尺寸大模型的開源。這就好比是一個商業帝國已經建立了一個全方位的武器庫,里面各種強大的武器應有盡有,等待著大家去發掘和利用。

全球的開發者們都可以在Github、HuggingFace和魔搭社區下載體驗這個強大的工具,發揮自己的創造力。

對于廣大開發者來說,阿里萬相正式開源是一個絕佳的機會。你可以參與到這個充滿創新和挑戰的領域中來,用自己的智慧和代碼,探索AI的無限可能。

圖片

您的一鍵三連,是我更新的最大動力,謝謝

山水有相逢,來日皆可期,謝謝閱讀,我們再會

我手中的金箍棒,上能通天,下能探海

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71275.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71275.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71275.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

算法之數據結構

目錄 數據結構 數據結構與算法面試題 數據結構 《倚天村 ? 圖解數據結構》 | 小傅哥 bugstack 蟲洞棧 ?數據結構基礎知識體系詳解? | Java 全棧知識體系 線性數據結構 | JavaGuide 數據結構與算法面試題 數據結構與算法面試題 | 小林coding

零基礎學習之——深度學習算法介紹01

第一節.基礎骨干網絡 物體分類是計算機視覺(computer vision,CV)中最經典的、也是目前研究得最為透徹的一 個領域,該領域的開創者也是深度學習領域的“名人”級別的人物,例如 Geoffrey Hinton、Yoshua Bengio 等。物…

弧度與角度之間的轉換公式

Radian 弧度的英語 簡稱 Rad Degree 角度的英語 簡稱 Deg 角度轉弧度 RadDeg*180/π CogMuisc.DegToRad(double degress) DegRad/180*π CogMuisc.RadToDeg(double radians) 總結: 角度大 弧度小 弧度轉角度 肯定要乘以一個大于1的數 那就是…

css之英文換行樣式

在 CSS 中,要實現英文文本自動換行但不從單詞中間斷開的效果,可以使用 word-wrap 或 overflow-wrap 屬性。以下是相關的 CSS 屬性和它們的配置: 使用 overflow-wrap 或 word-wrap /* This property is used to handle word breaking */ .wo…

40歲開始學Java:Java中單例模式(Singleton Pattern),適用場景有哪些?

在Java中,單例模式(Singleton Pattern)用于確保一個類只有一個實例,并提供全局訪問點。以下是詳細的實現方式、適用場景及注意事項: 一、單例模式的實現方式 1. 餓漢式(Eager Initialization) …

【前端基礎】3、HTML的常用元素(h、p、img、a、iframe、div、span)、不常用元素(strong、i、code、br)

HTML結構 一個HTML包含以下部分&#xff1a; 文檔類型聲明html元素 head元素body元素 例&#xff08;CSDN&#xff09;&#xff1a; 一、文檔類型聲明 HTML最一方的文檔稱為&#xff1a;文檔類型聲明&#xff0c;用于聲明文檔類型。即&#xff1a;<!DOCTYPE html>…

文本挖掘+情感分析+主題建模+K-Meas聚類+詞頻統計+詞云(景區游客評論情感分析)

本文通過情感分析技術對景區游客評論進行深入挖掘,結合數據預處理、情感分類和文本挖掘,分析游客評價與情感傾向。利用樸素貝葉斯和SVM等模型進行情感預測,探討滿意度與情感的關系。通過KMeans聚類和LDA主題分析,提取游客關心的話題,提供優化建議,為未來研究提供方向。 …

【實戰 ES】實戰 Elasticsearch:快速上手與深度實踐-2.2.2線程池配置與寫入限流

&#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 文章大綱 Elasticsearch批量寫入性能調優&#xff1a;2.2.2 線程池配置與寫入限流深度實踐1. 線程池核心機制解析1.1 Elasticsearch線程池架構1.2 Bulk線程池工作模型 2. 寫入場景線程…

VSCode 與 Vim 插件 的 復制粘貼等快捷鍵沖突,優先使用 VSCode 的快捷鍵

VSCode 與 Vim 插件 的 復制粘貼等快捷鍵沖突&#xff0c;優先使用 VSCode 的快捷鍵 在 VSCode 中&#xff0c;如果你發現 Vim 插件&#xff08;如 VSCodeVim 擴展&#xff09;與 VSCode 的默認復制粘貼快捷鍵&#xff08;CtrlC / CtrlV&#xff09;沖突&#xff0c;并且你想優…

tsconfig.json 配置清單

tsconfig.json 配置清單 基礎結構 {"compilerOptions": {// 編譯選項},"include": [// 指定需要編譯的文件或目錄],"exclude": [// 指定不需要編譯的文件或目錄],"extends": "./base-tsconfig.json","files": […

springboot可以同時處理多少個請求

源碼 ServerProperties Tomcat 配置 參數解析 必須要先建立連接&#xff0c;再用線程處理。 比如max-connection最大連接數&#xff0c;accept-count相當于隊列容量。總連接數二者和 min-spare-treads 核心線程數默認10&#xff0c;max-threads最大線程數默認200。 正常…

Spring 三級緩存 vs 二級緩存:深度解析循環依賴的終極解決方案

目錄 一. 循環依賴的本質矛盾 1. 什么是循環依賴&#xff1f; 2. 矛盾的核心 二. 三級緩存架構解析 三級緩存工作流程圖?編輯 三、為什么必須三級緩存&#xff1f; 1. 二級緩存的致命缺陷 2. 三級緩存的精妙設計 四、場景推演&#xff1a;三級緩存如何解決代理問題 …

視頻流暢播放相關因素

視頻播放的流暢度是一個綜合性問題&#xff0c;涉及從視頻文件本身到硬件性能、網絡環境、軟件優化等多個環節。以下是影響流暢度的關鍵因素及優化建議&#xff1a; 一、視頻文件本身 1. 分辨率與幀率 1.問題&#xff1a;高分辨率&#xff08;如4K&#xff09;或高幀率&#…

金融項目實戰

測試流程 測試流程 功能測試流程 功能測試流程 需求評審制定測試計劃編寫測試用例和評審用例執行缺陷管理測試報告 接口測試流程 接口測試流程 需求評審制定測試計劃分析api文檔編寫測試用例搭建測試環境編寫腳本執行腳本缺陷管理測試報告 測試步驟 測試步驟 需求評審 需求評…

LeetCode 25 - K 個一組翻轉鏈表

LeetCode 25 - K 個一組翻轉鏈表 這道題是一個典型的鏈表操作題&#xff0c;考察我們對鏈表的精確操作&#xff0c;包括反轉鏈表、分組處理、遞歸和迭代的結合應用等。還可以通過變體問題延伸到優先隊列操作、歸并、分塊等&#xff0c;這使得它成為面試中的高頻考題之一。 題目…

Leetcode 54: 螺旋矩陣

Leetcode 54: 螺旋矩陣 是一道經典的矩陣遍歷模擬題目&#xff0c;要求我們以螺旋順序遍歷一個二維數組。這個問題在面試中非常經典&#xff0c;考察模擬、數組操作以及邏輯清晰度。掌握本題的高效解法可以迅速給面試官留下好印象。 適合面試的解法&#xff1a;邊界法&#xff…

abseil-cpp:環境搭建

參考: https://abseil.io/docs/cpp/quickstart-cmake abseil-cpp.git/dd4c89b abseil-cpp.git/20240722.1 1. clone代碼倉庫、編譯 git clone https://github.com/abseil/abseil-cpp.git /app/abseil-cpp/ #/app/abseil-cpp/.git/config git checkout 20240722.1git rev-pa…

Storm實時流式計算系統(全解)——下

storm編程案例-網站訪問來源實時統計-需求 storm編程-網站訪問來源實時統計-代碼實現 根據以上條件可以只寫一個類&#xff0c;我們只需要寫2個方法和一個main&#xff08;&#xff09;&#xff0c;一個讀取/發射&#xff08;spout&#xff09;。 一個拿到數據統計后發到redis…

什么是SYN洪范攻擊?

文章目錄 一、什么是SYN洪范攻擊&#xff1f;二、SYN泛洪攻擊原理2.1 TCP 三次握手過程2.2 SYN攻擊過程 三、防御措施 一、什么是SYN洪范攻擊&#xff1f; SYN洪泛攻擊&#xff08;SYN Flood&#xff09;發生在OSI第四層&#xff0c;是一種基于?TCP協議三次握手漏洞?的DoS&a…

【嵌入式】MQTT

MQTT 文章目錄 MQTT安裝簡介MQTT客戶端代碼 安裝 安裝Paho MQTT C庫: sudo apt-get install libpaho-mqtt3-dev頭文件包含&#xff1a; #include "MQTTClient.h"編譯選項&#xff1a; gcc -o $ $^ -lpaho-mqtt3c簡介 MQTT協議全稱是&#xff08;Message Queuing…