Stable Diffusion 3正式發布，旨在鞏固其在AI圖像領域相對于Sora和Gemini的領先地位

??每周跟蹤AI熱點新聞動向和震撼發展想要探索生成式人工智能的前沿進展嗎？訂閱我們的簡報，深入解析最新的技術突破、實際應用案例和未來的趨勢。與全球數同行一同，從行業內部的深度分析和實用指南中受益。不要錯過這個機會，成為AI領域的領跑者。點擊訂閱，與未來同行！訂閱：https://rengongzhineng.io/

Stability AI最近宣布推出Stable Diffusion 3（簡稱SD3），這是該公司最新、最強大的圖像生成AI模型。雖然具體細節還未充分披露，但顯然這是為了抵御OpenAI和Google最近宣布的競爭對手所帶來的熱潮的嘗試。

雖然我們很快就會提供更技術性的分析，但目前你需要知道的是，SD3基于一種新的架構，能夠在各種硬件上運行（盡管仍然需要較強的硬件支持）。SD3目前還未發布，但你可以在這里登記等待名單。

SD3采用了更新版的“擴散變換器”，這是一種在2022年首創但在2023年進行了修訂并現在達到可擴展性的技術。OpenAI引人注目的視頻生成器Sora似乎也是基于類似原理工作的（論文的共同作者Will Peebles后來共同領導了Sora項目）。SD3還采用了“流匹配”，這是另一種新技術，同樣在不增加太多開銷的情況下提高了質量。

模型套件的范圍從8億參數（低于常用的SD 1.5）到80億參數（超過SD XL），旨在運行在各種硬件上。你可能仍然需要一塊強大的GPU和一個用于機器學習工作的設置，但你不像通常使用OpenAI和Google模型那樣限于API。（就其本身而言，Anthropic并沒有公開專注于圖像或視頻生成，因此它實際上不是這次討論的一部分。）

在X（前身為Twitter）上，Stable Diffusion的負責人Emad Mostaque指出，新模型能夠進行多模態理解，以及視頻輸入和生成，這些都是他的競爭對手在他們的API驅動的競爭者中強調的功能。這些能力仍然是理論上的，但聽起來似乎沒有技術障礙阻止它們被包含在未來的發布中。

當然，比較這些模型是不可能的，因為它們都還沒有真正發布，我們所依賴的只是競爭性的聲明和精心挑選的示例。但Stable Diffusion有一個明確的優勢：它作為進行任何類型的圖像生成的首選模型在時代潮流中的存在，方法或內容上幾乎沒有內在的限制。（的確，一旦越過了安全機制，SD3幾乎肯定會開啟AI生成色情內容的新時代。）

Stable Diffusion似乎想成為你不可或缺的白牌生成AI，而不是你不確定是否需要的精品生成AI。為此，該公司也在升級其工具，以降低使用門檻，盡管與公告的其余部分一樣，這些改進留給了想象。

有趣的是，該公司在公告中將安全放在了首位，聲明：

我們已經采取并繼續采取合理步驟，防止惡意行為者濫用Stable Diffusion 3。安全從我們開始訓練模型時就啟動，并在測試、評估和部署過程中持續進行。為了這次早期預覽，我們引入了許多安全措施。通過持續與研究人員、專家和我們的社區合作，我們期望在模型公開發布時以誠信進一步創新。

這些安全措施到底是什么？毫無疑問，預覽將在一定程度上闡明它們，然后公開發布會進一步完善，或根據你對這些事情的看法而被審查。我們很快會知道更多，并且與此同時，我們將深入技術細節，以更好地理解這一新一代模型背后的理論和方法。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/715848.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/715848.shtml
英文地址，請注明出處：http://en.pswp.cn/news/715848.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！