2023 Unite 大會關于“Muse“ AI 大模型訓練

Unity Muse 借助強大的 AI 能力幫助你探索、構思和迭代,其中包括紋理和精靈兩項功能,可將自然語言和視覺輸入轉化為可用資產。

將 AI 引入 Unity Editor 中的 Muse 提供了更快將想法轉化為實物的選項。您可以調整并使用文本提示、圖案、顏色和草圖,將其轉化為真實且項目準備就緒的輸出。

為了提供有用、負責任和尊重其他創作者版權的輸出,我們挑戰自己在 Muse 的精靈和紋理生成 AI 模型訓練方法上進行創新。

在本文中,我們分享了 Muse 如何生成結果,解構我們的模型訓練方法,并介紹我們的兩個新基礎模型。

訓練AI模型

在我們推出Muse的Texture和Sprite功能的同時,我們還創新了兩個專有的擴散模型,每個模型都從零開始,在Unity擁有或授權的專用數據上進行訓練。

擴展我們的自有內容庫

為了增強我們數據集的規模和多樣性,我們采用了一種關鍵技術——數據增強,使我們能夠從原始 Unity 擁有的數據樣本中產生許多變異。這極大地豐富了我們的訓練集,并提高了模型從有限樣本中進行泛化的能力。我們還使用了一些技術,如幾何變換、色彩空間調整、噪聲注入和生成模型(如穩定擴散)的樣本變異,以人工擴展我們的數據集。

最近,穩定擴散模型因為最初是在從互聯網上抓取的數據上進行訓練而引發了倫理擔憂。在構建 Muse 的紋理和精靈功能過程中,我們盡量減少對預訓練模型的依賴,從零開始在 Unity 擁有并負責任地策展的原始數據集上訓練潛在的擴散模型架構。通過將穩定擴散模型作為數據增強技術的一部分,我們能夠安全地利用這個模型,將原始的 Unity 擁有的資產庫擴展為一個強大且多樣化的輸出庫,這些輸出具有獨特性、原創性,且不包含任何受版權保護的藝術風格。在此基礎上,我們還采取了額外的緩解措施,如下所述。支撐 Muse 紋理和精靈功能的潛在擴散模型的訓練數據集并未包含從互聯網上抓取的任何數據。

以下是一些通過上述增強技術擴展的內容示例。

一個原始數據樣本(左上角)以及通過混合多種增強技術獲得的結果合成變異,包括基于擾動的技術(從上到下:色彩空間調整)和基于生成的技術(從左到右)

在增強現有數據后,我們仍在許多主題上發現了空白,需要填補。為了實現這一目標,我們在自己的內容上訓練了穩定擴散模型,直到其行為發生顯著變化。然后,我們使用這些派生模型,根據預過濾的主題列表創建了全新的合成數據。這個主題列表經過人類審查和額外的大型語言模型(LLM)自動過濾,以確保我們不會試圖創建任何違反我們指導原則和目標的合成圖像:一個完全不含可識別的藝術風格、受版權保護的材料和潛在有害內容的數據集。

結果是兩個大型數據集,包括增強和完全合成的圖像,我們對此有很高的信心,認為這兩個數據集中不會包含不想要的概念。然而,盡管我們非常有信心,但我們仍然希望添加更多的過濾以確保模型的安全性。

額外的數據過濾以確保安全且有用的輸出

由于我們的主要任務是確保安全、隱私和使我們的工具不會產生負面影響,因此我們開發了四個獨立的分類器模型,它們負責對數據集進行額外的過濾。這些模型有助于確保數據集中的所有內容都符合我們的人工智能指導原則,以及對圖像質量的額外檢查。

這四個評審模型共同負責確定合成圖像:

  • 不包含任何可識別的人類特征
  • 不包含任何非通用的藝術風格
  • 不包含任何知識產權的人物或標志
  • 質量可以達到可接受水平

如果一張圖像沒有通過四個評審模型中的任何一個所要求的高置信度閾值,那么它將被丟棄在我們的數據集中。我們決定采取謹慎的立場,并使我們的模型傾向于拒絕,以便只有具有最高置信度的圖像才能通過過濾器并進入最終數據集。

Muse Modle:Photo-Real-Unity-Texture-1 和 Photo-Real-Unity-Sprite-1

在 2023 Unite?活動中,我們宣布了 Muse 的紋理和精靈功能的早期訪問。驅動這些工具的第一個模型的內部版本分別稱為 Photo-Real-Unity-Texture-1 和 Photo-Real-Unity-Sprite-1。這些模型僅具有基本的裝飾理解,主要專注于照片寫實風格。

此外,如果您想讓模型匹配您項目中現有的風格,可以通過向我們風格訓練系統提供少量您自己的參考資產來教導我們的模型以創建特定藝術風格的內容。這將創建一個與主模型協同工作的較小二次模型,以引導其輸出。這個小二次模型對于您或您組織來說是私有的,因為它是由訓練師訓練的,我們永遠不會使用這個內容來訓練我們的主模型。

由于我們的模型專注于照片寫實風格,因此我們無需在無數不同的風格上訓練主模型。這種架構使我們在保持對負責任的人工智能承諾的同時,為您提供了深入的藝術控制。

今天,這些模型只是開始。我們期望 Muse 能夠繼續變得更聰明,并提供更好的輸出,我們將通過模型改進路線圖來引導這些模型走上這一道路。

Photo-Real-Unity-Texture-1 roadmap

目前,我們的紋理模型在各個方面都非常出色。它掌握了許多概念,您可以在紋理模型中自由混合完全無關的概念,并獲得美麗的結果,如“金屬史萊姆”或“藍色水晶玻璃巖石”,如上所示。

盡管模型在當前狀態下非常出色,但在學習它對不同提示和輸入方式的反應后,我們發現使用單個單詞提示可能難以實現高級材料概念。除了基本的提示準確性外,我們還計劃通過添加新的指導模型方式來為您提供更多控制。

在未來,我們計劃添加顏色選擇器、額外的預制指導圖案、改進的自定義指導圖案創建系統,以及其他新的視覺輸入方法,我們目前正在實驗。

展望未來,我們 Photo-Real-Unity-Texture-1 的主要關注點是確定任何弱的材料概念,并通過頻繁的模型重訓練來繼續提高整體質量和能力。您通過內置評分系統提供的反饋對于幫助我們構建最好的工具至關重要,因為它可以幫助我們確定模型能力的薄弱環節。結合我們頻繁的訓練計劃,我們正在快速改進模型,使其更易于使用并對材料世界更加了解。

Photo-Real-Unity-Sprite-1 roadmap

類似于 Photo-Real-Unity-Texture-1,我們的基礎精靈模型整體上非常出色,并知道許多概念。由于該工具目前尚未具備內置動畫功能,我們選擇將初期努力集中在最常見靜態精靈概念的質量最大化上。您可以在上面的圖片中看到基礎模型的原始輸出。在正常使用中,這些輸出將由用戶訓練的模型引導,以匹配特定的藝術風格。

雖然靜態物體已經非常可靠,但我們仍在努力改進動物和人類的解剖學準確性。在這些類型的主題上,您可能會獲得很好的結果,但可能會遇到四肢過多或缺失,或者面部扭曲的情況。這是我們對負責任的人工智能的承諾和嚴格限制可使用數據所導致的結果。我們非常重視隱私和安全,即使這意味著在初期早期訪問版本中某些主題的質量會受到影響。

這是我們致力于負責任的人工智能并對可用數據設置嚴格限制所導致的結果。我們非常重視隱私和安全,即使在初期早期訪問版本中某些主題的質量受到影響,也在所不惜。

您可能會遇到生成的Sprite完全空白的情況。這是因為我們的視覺內容審核過濾器。在 Photo-Real-Unity-Sprite-1 的輸出過濾方面,我們選擇在初期啟動時過于謹慎,因此,某些藝術風格可能會引發審核過濾器的誤報。我們計劃隨著時間的推移,在收到您的反饋并改進內容過濾后,放寬限制。

我們期待著在獲取反饋并繼續負責任地收集更多數據后,所有主題的質量都會迅速提高。我們打算對 Photo-Real-Unity-Sprite-1 進行與 Photo-Real-Unity-Texture-1 類似的嚴格訓練計劃。

統一負責任的AI開發之路

Unity Muse 是我們在負責任和尊重的方式下,利用生成式AI為社區帶來更大創意控制的第一步。我們以用戶為中心打造這個產品,并計劃根據您的反饋不斷進行改進和優化。

我們認識到生成式AI對創意行業可能產生的影響,并對此非常重視。我們花費了很長時間開發這些工具,以確保我們不是在取代創作者,而是提升他們的能力。我們相信,世界上有越多創作者,世界就會變得越好,而 Unity Muse 和其背后驅動的模型,正是我們支持這一使命的持續努力。

請關注未來關于 Unity Muse 和 AI 開發的更多信息。如果您對這些產品有任何疑問,請查看我們網站上的 FAQ,或訪問 Discussions與我們直接交流。

如果您是從 Unite 2023 過來的,我們將在未來幾周內分享活動的錄像。您可以在這里找到完整的報道。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/167060.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/167060.shtml
英文地址,請注明出處:http://en.pswp.cn/news/167060.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

周總結2023-11-24

文章目錄 前言:工作:學習:生活: 前言: 保持激情,日日向上,激發內驅力。 工作: 1117上周未完成的計劃: 數模轉換模塊的數據處理分析HAL庫的學習IMU知識點匯總 1124本…

【采坑分享】導出文件流responseType:“blob“如何提示報錯信息

目錄 前言: 采坑之路 總結: 前言: 近日,項目中踩了一個坑分享一下經驗,也避免下次遇到方便解決。項目基于vue2axioselement-ui,業務中導出按鈕需要直接下載接口中的文件流。正常是沒有問題,但…

為什么在Pycharm中使用Pandas畫圖,卻不顯示?

問題描述: 在 Pycharm 中使用 Pandas 的 plot() 方法畫圖,卻不顯示圖像,源代碼如下: import pandas as pd import numpy as np# 從文件中讀取數據 starbucks pd.read_csv(./file_csv/directory.csv)# 按照國家分組,…

想問問各位大佬,網絡安全這個專業普通人學習會有前景嗎?

網絡安全是一個非常廣泛的領域,涉及到許多不同的崗位。這些崗位包括安全服務、安全運維、滲透測試、web安全、安全開發和安全售前等。每個崗位都有自己的要求和特點,您可以根據自己的興趣和能力來選擇最適合您的崗位。 滲透測試/Web安全工程師主要負責模…

對 .NET程序2G虛擬地址緊張崩潰 的最后一次反思

一:背景 1. 講故事 最近接連遇到了幾起 2G 虛擬地址緊張 導致的程序崩潰,基本上 90% 都集中在醫療行業,真的很無語,他們用的都是一些上古的 XP,Windows7 x86,我也知道技術人很難也基本無法推動硬件系統和…

抖音獲客策略:讓你的品牌在短視頻平臺一鳴驚人!

一、背景介紹 隨著移動互聯網的快速發展,抖音作為一款流行的短視頻平臺,已經成為越來越多企業的獲客渠道。抖音用戶規模龐大,日活用戶數量不斷增長,為企業提供了廣闊的市場空間。本文將介紹抖音獲客策略,幫助企業更好…

UNETR++:深入研究高效和準確的3D醫學圖像分割

論文:https://arxiv.org/abs/2212.04497 代碼:GitHub - Amshaker/unetr_plus_plus: UNETR: Delving into Efficient and Accurate 3D Medical Image Segmentation 機構:Mohamed Bin Zayed University of Artificial Intelligence1, Univers…

哦?是嗎|兜兜轉轉,最后還是選擇了蓋雅排班系統

在之前發布的和「人效案例集」中,我們為大家呈現了很多關于人效提升的理論方法,以及各家企業的人效提升提升實踐。 回過頭來,我們發現:排班管理滲透于人效九宮格之中,也因此成為很多企業人效提升的一個重要中介&#x…

深度學習八股文:混合精度訓練過程出nan怎么辦

其實如果是FP32的訓練,基本的調試方法還是差不多,這里就講一下混合精度訓練過程中的nan。 混合精度訓練使用較低的數值精度(通常是半精度浮點數,例如FP16)來加速模型訓練,但在一些情況下,可能會…

盤點43個Python登錄第三方源碼Python愛好者不容錯過

盤點43個Python登錄第三方源碼Python愛好者不容錯過 學習知識費力氣,收集整理更不易。 知識付費甚歡喜,為咱碼農謀福利。 項目名稱 bnuz中國電信校園網模擬登錄,python selenium BNUZ教務系統認證爬蟲Python語言實現,你可以用…

NX二次開發UF_CSYS_create_temp_csys 函數介紹

文章作者:里海 來源網站:https://blog.csdn.net/WangPaiFeiXingYuan UF_CSYS_create_temp_csys Defined in: uf_csys.h int UF_CSYS_create_temp_csys(const double csys_origin [ 3 ] , tag_t matrix_id, tag_t * csys_id ) overview 概述 Creates …

win10 tensorrt源碼編譯onnx

直接利用官方源碼,如下圖,trtexec源碼在TensorRT安裝目錄下,雙擊trtexec.sln文件,使用vs2019打開源碼工程。 如下圖,以yolov8為例子,編譯成功項目之后,設置命令行參數: --onnxd:/yo…

便攜式工業RFID讀寫器怎么選?

便攜式工業RFID讀寫器在物流、零售、制造等行業都有著極為廣泛的應用。企業利用RFID手持終端設備,可以將采集到的物品信息自動傳輸到中央信息系統,實現數據的實時交換和共享。目前市面上RFID手持終端品牌、型號眾多,ANDEAWELL作為國內物聯網產…

案例精選|聚銘網絡流量智能分析審計系統加強南京市溧水區人社局信息安全防護能力

一字排開的社保綜合服務窗口、實時滾動的數“智”人社大屏、便捷快速的社保卡自助服務機……每位到溧水市民中心人社大廳進行業務辦理的市民對高效的社保服務經辦效率贊嘆不已。 黨的二十大報告提出,健全覆蓋全民、統籌城鄉、公平統一、安全規范、可持續的多層次社…

淺談Linux bash腳本----截取字符串

# 用于刪除左起第一個匹配內容,即截取右側內容 ## 用于刪除右起第一個匹配內容,即截取右側內容 % 用于刪除右起第一個匹配內容,即截取左側內容 %% 用于刪除左起第一個匹配內容,即截取左側內容 舉例 file/dir1/dir2/dir3/…

GPT2-chitchat項目運行

git clone https://github.com/yangjianxin1/GPT2-chitchat.git把項目拉下來 下載模型文件: 從[模型分享]中下載模型文件,例如 model_epoch40_50w。 將模型文件放到正確的位置: 將下載的模型文件夾 model_epoch40_50w 放到項目的 model 目錄…

深入理解數據結構:隊列的實現及其應用場景

文章目錄 🍂前言🍂隊列的基本概念和特性🍂隊列的實現方式?🌱順序隊列?🌱鏈式隊列 🍂隊列的基本操作及示例代碼?🥑創建隊列?🥑判空操作?🥑入隊操作?🥑出…

GEE:APP中的遙感圖像下載接口設計

作者:CSDN @ _養樂多_ 本文將詳細介紹如何通過Google Earth Engine(GEE)的用戶界面(ui)模塊創建一個下載按鈕,以觸發遙感圖像下載的操作。通過按鈕的點擊事件,我們生成了包含特定參數的圖像下載鏈接,實現了一鍵式遙感圖像下載功能,使整個過程更加智能和直觀。 此外,…

java操作富文本插入到word模板

最近項目有個需求,大致流程是前端保存富文本(html的代碼)到數據庫,后臺需要將富文本代碼轉成帶格式的文字,插入到word模板里,然后將word轉成pdf,再由前端調用接口下載pdf文件! 1、思…

代碼隨想錄算法訓練營第30天|回溯總結 332. 重新安排行程

回溯是遞歸的副產品,只要有遞歸就會有回溯,所以回溯法也經常和二叉樹遍歷,深度優先搜索混在一起,因為這兩種方式都是用了遞歸。 回溯法就是暴力搜索,并不是什么高效的算法,最多再剪枝一下。 回溯算法能解…