??每周跟蹤AI熱點新聞動向和震撼發展 想要探索生成式人工智能的前沿進展嗎?訂閱我們的簡報,深入解析最新的技術突破、實際應用案例和未來的趨勢。與全球數同行一同,從行業內部的深度分析和實用指南中受益。不要錯過這個機會,成為AI領域的領跑者。點擊訂閱,與未來同行! 訂閱:https://rengongzhineng.io/
Stability AI最近宣布推出Stable Diffusion 3(簡稱SD3),這是該公司最新、最強大的圖像生成AI模型。雖然具體細節還未充分披露,但顯然這是為了抵御OpenAI和Google最近宣布的競爭對手所帶來的熱潮的嘗試。
雖然我們很快就會提供更技術性的分析,但目前你需要知道的是,SD3基于一種新的架構,能夠在各種硬件上運行(盡管仍然需要較強的硬件支持)。SD3目前還未發布,但你可以在這里登記等待名單。
SD3采用了更新版的“擴散變換器”,這是一種在2022年首創但在2023年進行了修訂并現在達到可擴展性的技術。OpenAI引人注目的視頻生成器Sora似乎也是基于類似原理工作的(論文的共同作者Will Peebles后來共同領導了Sora項目)。SD3還采用了“流匹配”,這是另一種新技術,同樣在不增加太多開銷的情況下提高了質量。
模型套件的范圍從8億參數(低于常用的SD 1.5)到80億參數(超過SD XL),旨在運行在各種硬件上。你可能仍然需要一塊強大的GPU和一個用于機器學習工作的設置,但你不像通常使用OpenAI和Google模型那樣限于API。(就其本身而言,Anthropic并沒有公開專注于圖像或視頻生成,因此它實際上不是這次討論的一部分。)
在X(前身為Twitter)上,Stable Diffusion的負責人Emad Mostaque指出,新模型能夠進行多模態理解,以及視頻輸入和生成,這些都是他的競爭對手在他們的API驅動的競爭者中強調的功能。這些能力仍然是理論上的,但聽起來似乎沒有技術障礙阻止它們被包含在未來的發布中。
當然,比較這些模型是不可能的,因為它們都還沒有真正發布,我們所依賴的只是競爭性的聲明和精心挑選的示例。但Stable Diffusion有一個明確的優勢:它作為進行任何類型的圖像生成的首選模型在時代潮流中的存在,方法或內容上幾乎沒有內在的限制。(的確,一旦越過了安全機制,SD3幾乎肯定會開啟AI生成色情內容的新時代。)
Stable Diffusion似乎想成為你不可或缺的白牌生成AI,而不是你不確定是否需要的精品生成AI。為此,該公司也在升級其工具,以降低使用門檻,盡管與公告的其余部分一樣,這些改進留給了想象。
有趣的是,該公司在公告中將安全放在了首位,聲明:
我們已經采取并繼續采取合理步驟,防止惡意行為者濫用Stable Diffusion 3。安全從我們開始訓練模型時就啟動,并在測試、評估和部署過程中持續進行。為了這次早期預覽,我們引入了許多安全措施。通過持續與研究人員、專家和我們的社區合作,我們期望在模型公開發布時以誠信進一步創新。
這些安全措施到底是什么?毫無疑問,預覽將在一定程度上闡明它們,然后公開發布會進一步完善,或根據你對這些事情的看法而被審查。我們很快會知道更多,并且與此同時,我們將深入技術細節,以更好地理解這一新一代模型背后的理論和方法。