轉:
近日,人工智能領域迎來了一項革命性的突破。Transformer 論文作者之一的 Llion Jones 與前谷歌研究人員 David Ha 共同創立的人工智能公司 Sakana AI,聯合MIT、OpenAI、瑞士AI實驗室IDSIA等機構的研究人員,共同提出了一種名為“自動化人工生命搜索”( Automated Search for Artificial Life, ASAL)的新算法。
這一創新技術使得AI能夠自主發現全新的人造生命體,而無需繁瑣的手工設計過程,標志著人工生命(Artificial Life, ALife)研究邁入了一個全新的里程碑。
什么是人工生命?
人工生命聽起來很科幻,最早源于數學家約翰?何頓?康威在 1970?年提出的著名的“生命游戲”便是一種模擬人工生命系統,其中定義的規則可讓其中的“細胞”像生命體一樣運作。
人工生命是一個跨學科領域,結合了計算科學、生物學、復雜系統科學以及物理學等多個領域的知識,致力于研究生命的本質及其起源、演化和行為。它旨在通過模擬生命的行為、特性和演化過程來理解生命的本質,探索的范圍不僅限于地球上的生物形式,還包括可能的外星生命或完全虛構的生命形式。
下圖為 ASAL 其中一位作者 Phillip Isola 的推文以及他分享的一種人工生命。
通過計算機模擬,科學家們正在探索一個更宏大的命題——可能存在的生命形式。然而,過去的人工生命模擬往往依賴于復雜的手工設計,每一個細微的規則都需要研究者精心制定。這不僅限制了研究的效率,也阻礙了新生命形式的發現。
ALife的研究揭示了推動和加速人工智能進步的重要洞見,特別是對于涌現現象、進化機制和智能本質的理解。如果用AI加速人工生命的發現,人類就能更好地理解這些核心原則,從而啟發未來的AI系統。
ASAL算法的創新之處
ASAL算法的出現,徹底改變了這一現狀。該算法利用三種視覺-語言基礎模型,能夠自動搜索并發現模擬空間中最有趣、最具開放式的人造生命體:
-
監督式目標搜索(Supervised?Target):搜索能產生指定目標事件或事件序列的模擬,有助于發現任意世界或與我們自己的世界相似的世界。
-
開放式搜索(Open-Endedness):在基礎模型的表征空間中搜索會隨時間不斷提供新變化的模擬,由此可以發現對人類觀察者來說總是很有趣的世界。
-
闡明(Illumination)搜索:搜索一組相關的多樣化模擬,從而展現對我們來說非常陌生的世界。
人工生命基質(substrate),記為 S,其包含任何一組相關的人工生命模擬(例如,所有 Lenia 模擬的集合)。這些模擬可能在初始狀態、轉換規則或兩者上有所不同。S 由?θ?參數化,它定義的單個模擬具有三個分量:
-
初始狀態分布?Init_θ
-
前向動態階躍函數?Step_θ
-
渲染函數,Render_θ,作用是將狀態轉換為圖像
雖然通常而言,并不需要參數化和搜索渲染函數,但當狀態值難以先驗地解讀時,就很有必要了。將這些項串到一起,可定義一個?θ?函數,它對初始狀態 s_0?進行采樣,運行 T 步模擬,并將最終狀態渲染為圖像:
最后,還有另外兩個函數 VLM_img (?)?和 VLM_txt (?),它們的作用是通過視覺?–?語言基礎模型嵌入圖像和自然語言文本,以及相應的內積???,??,以促進該嵌入空間的相似性測量。
監督式目標
人工生命的一個重要目標是找到能讓所需事件或事件序列發生的模擬。這樣的發現將使研究者能夠找到與我們自己的世界相似的世界,或測試某些反事實的進化軌跡在給定基質中是否可能,從而深入了解某些生命形式的可行性。
為此,ASAL 會搜索一種模擬,該模擬會產生與基礎模型表示中的目標自然語言相匹配的圖像。研究者可以控制在每個時間步驟應用哪個提示(如果有的話)。
開放式
人工生命的一大挑戰是尋找開放式模擬。找到這樣的世界才能復現現實世界中永無止境的有趣新奇事物的爆發。
盡管開放性是主觀的且難以定義,但正確表示空間的新穎性(novelty)可以體現開放性的一般概念。這樣一來,可將測量開放性的主觀性外包給表征函數的構建。在本文中,視覺?–?語言基礎模型表征充當了人類表征的代理。
闡明
人工生命的另一個關鍵目標是自動闡明不同現象構成的整個空間,而這些現象是從基質涌現出來的。基于此,可以讓我們了解「生命的可能模樣」。因此,闡明是描繪和分類整體基質的第一步。
為了實現這一目標,ASAL 會搜索一組模擬并且這些模擬產生的圖像與基礎模型表征中的最近鄰相距甚遠。該團隊發現最近鄰多樣性比基于方差的多樣性能實現更好的闡明。
研究者只需定義模擬空間的搜索范圍,ASAL便能自動探索出各種新奇的生命形式。
ASAL算法的創新之處在于其將基礎模型應用于人工生命模擬搜索,自動化了規則設計和現象探索的過程。這不僅促進了新型人工生命體的自動發現,還為復雜性和開放性等現象提供了新的分析工具。研究者表示,通過利用AI加速人工生命的發現,我們可以加速對涌現、進化和智能的理解——這些核心原則將啟發下一代AI系統的發展。
此外,ASAL算法的應用還具有深遠的意義。它不僅推動了人工生命研究的進步,還為探索可能存在的生命形式提供了新的途徑。通過計算機模擬,科學家們可以探索更宏大、更復雜的生命現象,從而加深對生命本質的理解。
實驗驗證ASAL真的可以
在實驗中,ASAL算法展現了其強大的搜索能力。研究人員利用Boids、Particle Life、生命游戲(Game of Life)、Lenia和神經元胞自動機(Neural Cellular Automata)等多種人工生命基質,驗證了ASAL的有效性。
-
Boids:模擬的是 N 個「鳥狀物體(boids)」在 2D 歐幾里得空間中的移動情況。所有 boids 都共享權重一樣的神經網絡,其會根據局部參考系中 K 個近鄰 boids 向左或向右操縱每個 boid。該基質是神經網絡的權重空間。
-
粒子生命:模擬 N 個粒子,這些粒子又可分為 K 類;它們在一個 2D 歐幾里得空間運動。該基質是 K × K 相互作用矩陣的空間,β?參數確定了粒子之間的距離。初始狀態是隨機采樣的,粒子會自組織形成動態模式。
-
類生命的元胞自動機(CA:將康威生命游戲泛化到所有在 2D 柵格中運作的二元狀態元胞自動機,其中狀態轉換僅取決于活著的 Moore 鄰居的數量和細胞的當前狀態。該基質有 2^18 = 262,144 種可能的模擬。
-
Lenia:將康威生命游戲推廣到連續空間和時間,允許更高的維度、多個核和多個通道。該團隊使用了 LeniaBreeder 代碼庫,它定義了基質,其中動態維度為 45 個,初始狀態維度為 32 × 32 × 3 = 3,072 個。其搜索空間以 Bert Wang-Chak Chan 2020?年在論文《Lenia and expanded universe》中找到的解為中心。
-
神經元胞自動機(NCA):通過神經網絡表示局部轉換函數來參數化任何連續元胞自動機。該基質是神經網絡的權重空間。
在每種基質中,ASAL都發現了以前從未見過的生命形式,并擴展了人工生命中涌現結構的邊界。
搜索目標模擬
其中包括單個目標和隨時間變化的目標序列。
對于單個目標,以下動圖定性地展示 ASAL 的良好效果,可以找到與指定提示詞匹配的模擬。
對于時間目標,下圖表明可以找到能產生遵循一系列提示詞的軌跡的模擬。通過指定所需的進化軌跡并使用約束基質,ASAL 可以識別體現所需進化過程本質的更新規則。例如,當提示詞序列為「一個細胞」然后是「兩個細胞」時,相應的更新規則本質上就是實現自我復制。
搜索開放式模擬
下圖(Fig.5)??展示了 ASAL 在類生命元胞自動機的開放式模擬中的潛力。
根據 3 式中的開放式指標,著名的康威生命游戲位列最開放的元胞自動機(CA)的前 5%。
Fig.5a 表明,最開放的 CA 表現了處于混沌邊緣的非平凡動態模式,因為它們既沒有穩定也沒有爆發。
Fig.5b 則描繪了三個 CA 在 CLIP 空間中隨模擬時間的軌跡。由于基礎模型的表征與人類表征相關,因此通過基礎模型的表征空間在軌跡中產生新穎性也會為人類觀察者產生一系列新穎性。
Fig.5c 則可視化了所有類生命元胞自動機,從中可以看到涌現出的有意義的結構:最開放的 CA 緊密地靠在模擬主島外的一個小島上。
闡明整體基質
該團隊使用了 Lenia 和 Boids 基質來研究公式 4 中的闡明算法的有效性。基礎模型是 CLIP 。他們定制了一個用于搜索的遺傳算法:在每一代,隨機選擇父母,創建變異的孩子,然后保留最多樣化的解子集。
下面的 2 個「Simulation Atlas」展示了生成的模擬集。
此可視化凸顯了按視覺相似性組織的行為的多樣性。使用 Lenia 時,ASAL 發現了許多前所未見的生命形式,這些生命形式類似于按顏色和形狀組織的細胞和細菌。使用 Boids 時,ASAL 重新發現了群集行為(flocking behavior),以及其他行為,例如蛇行、分組、盤旋和其它變體。
量化人工生命
基礎模型不僅有助于搜索有趣現象,而且還可以量化以前只能進行定性分析的現象。圖 7 展示了量化這些復雜系統的涌現行為的不同方法。
在上圖?中,對兩個 Boids 模擬之間的參數進行線性插值。這個中間模擬缺乏任一模擬的特征并且顯得無序,表明了 boids 參數空間的非線性、混沌性質。重要的是,現在可以通過測量中間模擬的最終狀態與兩個原始模擬的 CLIP 相似性來為這種定性觀察提供定量支持。
上圖?則評估了粒子生命中粒子數量對其表示某些生命形式的能力的影響。在這種情況下,如果搜索「一只毛毛蟲(a caterpillar)」,則可發現只有在模擬中至少有 1000?個粒子時才能找到它們,這符合 1972 年的「更多即不同(more is different)」的觀察結果。
在上圖中,通過單獨掃描每個參數并測量 CLIP 提示詞對齊分數的結果標準偏差,量化了粒子生命中每個模擬參數的重要性。在確定最重要的參數后,便對應上了綠色和黃色粒子之間的相互作用強度,這對于毛毛蟲的形成至關重要。
上圖 給出了對于 Lenia 模擬,CLIP 向量隨模擬時間的變化速度。當模擬定性地看起來已成靜態時,該指標恰好穩定,因此這可提供有用的模擬停止條件。
結語
值得一提的是,Sakana AI此前已經推出了“世界上首個用于自動化科學研究和開放式發現的AI系統”——AI Scientist(人工智能科學家)。該系統能夠獨立進行科學研究,無需人類插手,甚至能夠一口氣產出多篇學術論文。
這一研究成果一經發布便引起了廣泛關注。許多人認為這是釋放AI力量、重新定義人工生命的一項驚人工作。有研究者表示自己多年來一直在嘗試類似的事,但Sakana AI的工作是一個更加精彩的版本。
此外,還有人提出疑問:這項研究是否可以用來觀察意識的誕生?盡管目前還沒有明確的答案,但毫無疑問,隨著技術的發展,我們將逐漸揭開更多關于生命和意識的秘密。
論文標題:Automating the Search for Artificial Life with Foundation Models
論文地址:https://arxiv.org/pdf/2412.17799
在線論文:https://pub.sakana.ai/asal/
項目代碼:https://github.com/SakanaAI/asal/