AI首次自主發現人工生命

轉:

近日,人工智能領域迎來了一項革命性的突破。Transformer 論文作者之一的 Llion Jones 與前谷歌研究人員 David Ha 共同創立的人工智能公司 Sakana AI,聯合MIT、OpenAI、瑞士AI實驗室IDSIA等機構的研究人員,共同提出了一種名為“自動化人工生命搜索”( Automated Search for Artificial Life, ASAL)的新算法。

圖片

這一創新技術使得AI能夠自主發現全新的人造生命體,而無需繁瑣的手工設計過程,標志著人工生命(Artificial Life, ALife)研究邁入了一個全新的里程碑。

什么是人工生命?

人工生命聽起來很科幻,最早源于數學家約翰?何頓?康威在 1970?年提出的著名的“生命游戲”便是一種模擬人工生命系統,其中定義的規則可讓其中的“細胞”像生命體一樣運作。

人工生命是一個跨學科領域,結合了計算科學、生物學、復雜系統科學以及物理學等多個領域的知識,致力于研究生命的本質及其起源、演化和行為。它旨在通過模擬生命的行為、特性和演化過程來理解生命的本質,探索的范圍不僅限于地球上的生物形式,還包括可能的外星生命或完全虛構的生命形式。

下圖為 ASAL 其中一位作者 Phillip Isola 的推文以及他分享的一種人工生命。

圖片

圖片

通過計算機模擬,科學家們正在探索一個更宏大的命題——可能存在的生命形式。然而,過去的人工生命模擬往往依賴于復雜的手工設計,每一個細微的規則都需要研究者精心制定。這不僅限制了研究的效率,也阻礙了新生命形式的發現。

ALife的研究揭示了推動和加速人工智能進步的重要洞見,特別是對于涌現現象、進化機制和智能本質的理解。如果用AI加速人工生命的發現,人類就能更好地理解這些核心原則,從而啟發未來的AI系統。

ASAL算法的創新之處

ASAL算法的出現,徹底改變了這一現狀。該算法利用三種視覺-語言基礎模型,能夠自動搜索并發現模擬空間中最有趣、最具開放式的人造生命體:

圖片

  • 監督式目標搜索(Supervised?Target):搜索能產生指定目標事件或事件序列的模擬,有助于發現任意世界或與我們自己的世界相似的世界。

  • 開放式搜索(Open-Endedness):在基礎模型的表征空間中搜索會隨時間不斷提供新變化的模擬,由此可以發現對人類觀察者來說總是很有趣的世界。

  • 闡明(Illumination)搜索:搜索一組相關的多樣化模擬,從而展現對我們來說非常陌生的世界。

人工生命基質(substrate),記為 S,其包含任何一組相關的人工生命模擬(例如,所有 Lenia 模擬的集合)。這些模擬可能在初始狀態、轉換規則或兩者上有所不同。S 由?θ?參數化,它定義的單個模擬具有三個分量:

  • 初始狀態分布?Init_θ

  • 前向動態階躍函數?Step_θ

  • 渲染函數,Render_θ,作用是將狀態轉換為圖像

雖然通常而言,并不需要參數化和搜索渲染函數,但當狀態值難以先驗地解讀時,就很有必要了。將這些項串到一起,可定義一個?θ?函數,它對初始狀態 s_0?進行采樣,運行 T 步模擬,并將最終狀態渲染為圖像:

圖片

最后,還有另外兩個函數 VLM_img (?)?和 VLM_txt (?),它們的作用是通過視覺?–?語言基礎模型嵌入圖像和自然語言文本,以及相應的內積???,??,以促進該嵌入空間的相似性測量。

監督式目標

人工生命的一個重要目標是找到能讓所需事件或事件序列發生的模擬。這樣的發現將使研究者能夠找到與我們自己的世界相似的世界,或測試某些反事實的進化軌跡在給定基質中是否可能,從而深入了解某些生命形式的可行性。

為此,ASAL 會搜索一種模擬,該模擬會產生與基礎模型表示中的目標自然語言相匹配的圖像。研究者可以控制在每個時間步驟應用哪個提示(如果有的話)。

圖片

開放式

人工生命的一大挑戰是尋找開放式模擬。找到這樣的世界才能復現現實世界中永無止境的有趣新奇事物的爆發。

盡管開放性是主觀的且難以定義,但正確表示空間的新穎性(novelty)可以體現開放性的一般概念。這樣一來,可將測量開放性的主觀性外包給表征函數的構建。在本文中,視覺?–?語言基礎模型表征充當了人類表征的代理。

圖片

闡明

人工生命的另一個關鍵目標是自動闡明不同現象構成的整個空間,而這些現象是從基質涌現出來的。基于此,可以讓我們了解「生命的可能模樣」。因此,闡明是描繪和分類整體基質的第一步。

為了實現這一目標,ASAL 會搜索一組模擬并且這些模擬產生的圖像與基礎模型表征中的最近鄰相距甚遠。該團隊發現最近鄰多樣性比基于方差的多樣性能實現更好的闡明。

圖片

研究者只需定義模擬空間的搜索范圍,ASAL便能自動探索出各種新奇的生命形式。

圖片

ASAL算法的創新之處在于其將基礎模型應用于人工生命模擬搜索,自動化了規則設計和現象探索的過程。這不僅促進了新型人工生命體的自動發現,還為復雜性和開放性等現象提供了新的分析工具。研究者表示,通過利用AI加速人工生命的發現,我們可以加速對涌現、進化和智能的理解——這些核心原則將啟發下一代AI系統的發展。

此外,ASAL算法的應用還具有深遠的意義。它不僅推動了人工生命研究的進步,還為探索可能存在的生命形式提供了新的途徑。通過計算機模擬,科學家們可以探索更宏大、更復雜的生命現象,從而加深對生命本質的理解。

實驗驗證ASAL真的可以

在實驗中,ASAL算法展現了其強大的搜索能力。研究人員利用Boids、Particle Life、生命游戲(Game of Life)、Lenia和神經元胞自動機(Neural Cellular Automata)等多種人工生命基質,驗證了ASAL的有效性。

  • Boids:模擬的是 N 個「鳥狀物體(boids)」在 2D 歐幾里得空間中的移動情況。所有 boids 都共享權重一樣的神經網絡,其會根據局部參考系中 K 個近鄰 boids 向左或向右操縱每個 boid。該基質是神經網絡的權重空間。

  • 粒子生命:模擬 N 個粒子,這些粒子又可分為 K 類;它們在一個 2D 歐幾里得空間運動。該基質是 K × K 相互作用矩陣的空間,β?參數確定了粒子之間的距離。初始狀態是隨機采樣的,粒子會自組織形成動態模式。

  • 類生命的元胞自動機(CA:將康威生命游戲泛化到所有在 2D 柵格中運作的二元狀態元胞自動機,其中狀態轉換僅取決于活著的 Moore 鄰居的數量和細胞的當前狀態。該基質有 2^18 = 262,144 種可能的模擬。

  • Lenia:將康威生命游戲推廣到連續空間和時間,允許更高的維度、多個核和多個通道。該團隊使用了 LeniaBreeder 代碼庫,它定義了基質,其中動態維度為 45 個,初始狀態維度為 32 × 32 × 3 = 3,072 個。其搜索空間以 Bert Wang-Chak Chan 2020?年在論文《Lenia and expanded universe》中找到的解為中心。

  • 神經元胞自動機(NCA):通過神經網絡表示局部轉換函數來參數化任何連續元胞自動機。該基質是神經網絡的權重空間。

在每種基質中,ASAL都發現了以前從未見過的生命形式,并擴展了人工生命中涌現結構的邊界。

搜索目標模擬

其中包括單個目標和隨時間變化的目標序列。

對于單個目標,以下動圖定性地展示 ASAL 的良好效果,可以找到與指定提示詞匹配的模擬。

圖片

對于時間目標,下圖表明可以找到能產生遵循一系列提示詞的軌跡的模擬。通過指定所需的進化軌跡并使用約束基質,ASAL 可以識別體現所需進化過程本質的更新規則。例如,當提示詞序列為「一個細胞」然后是「兩個細胞」時,相應的更新規則本質上就是實現自我復制。

圖片

搜索開放式模擬

下圖(Fig.5)??展示了 ASAL 在類生命元胞自動機的開放式模擬中的潛力。

圖片

圖片

根據 3 式中的開放式指標,著名的康威生命游戲位列最開放的元胞自動機(CA)的前 5%。

Fig.5a 表明,最開放的 CA 表現了處于混沌邊緣的非平凡動態模式,因為它們既沒有穩定也沒有爆發。

Fig.5b 則描繪了三個 CA 在 CLIP 空間中隨模擬時間的軌跡。由于基礎模型的表征與人類表征相關,因此通過基礎模型的表征空間在軌跡中產生新穎性也會為人類觀察者產生一系列新穎性。

Fig.5c 則可視化了所有類生命元胞自動機,從中可以看到涌現出的有意義的結構:最開放的 CA 緊密地靠在模擬主島外的一個小島上。

闡明整體基質

該團隊使用了 Lenia 和 Boids 基質來研究公式 4 中的闡明算法的有效性。基礎模型是 CLIP 。他們定制了一個用于搜索的遺傳算法:在每一代,隨機選擇父母,創建變異的孩子,然后保留最多樣化的解子集。

下面的 2 個「Simulation Atlas」展示了生成的模擬集。

圖片

此可視化凸顯了按視覺相似性組織的行為的多樣性。使用 Lenia 時,ASAL 發現了許多前所未見的生命形式,這些生命形式類似于按顏色和形狀組織的細胞和細菌。使用 Boids 時,ASAL 重新發現了群集行為(flocking behavior),以及其他行為,例如蛇行、分組、盤旋和其它變體。

量化人工生命

基礎模型不僅有助于搜索有趣現象,而且還可以量化以前只能進行定性分析的現象。圖 7 展示了量化這些復雜系統的涌現行為的不同方法。

圖片

在上圖?中,對兩個 Boids 模擬之間的參數進行線性插值。這個中間模擬缺乏任一模擬的特征并且顯得無序,表明了 boids 參數空間的非線性、混沌性質。重要的是,現在可以通過測量中間模擬的最終狀態與兩個原始模擬的 CLIP 相似性來為這種定性觀察提供定量支持。

圖片

上圖?則評估了粒子生命中粒子數量對其表示某些生命形式的能力的影響。在這種情況下,如果搜索「一只毛毛蟲(a caterpillar)」,則可發現只有在模擬中至少有 1000?個粒子時才能找到它們,這符合 1972 年的「更多即不同(more is different)」的觀察結果。

圖片

在上圖中,通過單獨掃描每個參數并測量 CLIP 提示詞對齊分數的結果標準偏差,量化了粒子生命中每個模擬參數的重要性。在確定最重要的參數后,便對應上了綠色和黃色粒子之間的相互作用強度,這對于毛毛蟲的形成至關重要。

圖片

上圖 給出了對于 Lenia 模擬,CLIP 向量隨模擬時間的變化速度。當模擬定性地看起來已成靜態時,該指標恰好穩定,因此這可提供有用的模擬停止條件。

結語

值得一提的是,Sakana AI此前已經推出了“世界上首個用于自動化科學研究和開放式發現的AI系統”——AI Scientist(人工智能科學家)。該系統能夠獨立進行科學研究,無需人類插手,甚至能夠一口氣產出多篇學術論文。

這一研究成果一經發布便引起了廣泛關注。許多人認為這是釋放AI力量、重新定義人工生命的一項驚人工作。有研究者表示自己多年來一直在嘗試類似的事,但Sakana AI的工作是一個更加精彩的版本。

圖片

此外,還有人提出疑問:這項研究是否可以用來觀察意識的誕生?盡管目前還沒有明確的答案,但毫無疑問,隨著技術的發展,我們將逐漸揭開更多關于生命和意識的秘密。

論文標題:Automating the Search for Artificial Life with Foundation Models

論文地址:https://arxiv.org/pdf/2412.17799

在線論文:https://pub.sakana.ai/asal/

項目代碼:https://github.com/SakanaAI/asal/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/84908.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/84908.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/84908.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Day.31

變量類型: name: str "Alice" age: int 30 height: float 1.75 is_student: bool False 注解: def add(a: int, b: int) -> int: return a b def greet(name: str) -> None: print(f"Hello, {name}") 定義矩形類&a…

光譜數據分析的方法有哪些?

光譜數據分析是通過特征光譜識別物質結構與成分的核心技術,其標準化流程如下: ?一、數據預處理?(消除干擾噪聲) ?去噪平滑? Savitzky-Golay濾波:保留光譜特征峰形,消除高頻噪聲。 移動平均法&#…

RabbitMQ的使用--Spring AMQP(更新中)

1.首先是創建項目 在一個父工程 mq_demo 的基礎上建立兩個子模塊,生產者模塊publisher,消費者模塊 consumer 創建項目: 建立成功: 刪除多余文件 創建子模塊1:publisher(生產者模塊) 右鍵---…

DAY 31 文件的規范拆分和寫法

浙大疏錦行 今日的示例代碼包含2個部分 notebook文件夾內的ipynb文件,介紹下今天的思路項目文件夾中其他部分:拆分后的信貸項目,學習下如何拆分的,未來你看到的很多大項目都是類似的拆分方法 知識點回顧 規范的文件命名規范的文件…

EtherCAT至TCP/IP異構網絡互聯:施耐德M580 PLC對接倍福CX5140解決方案

一、項目背景與需求 某智能工廠致力于打造高度自動化的生產流水線,其中部分核心設備采用EtherCAT協議進行通信,以實現高速、高精度的控制,例如基于EtherCAT總線的倍福(Beckhoff)CX5140PLC,它能夠快速響應設…

[學習] FIR多項濾波器的數學原理詳解:從多相分解到高效實現(完整仿真代碼)

FIR多項濾波器的數學原理詳解:從多相分解到高效實現 文章目錄 FIR多項濾波器的數學原理詳解:從多相分解到高效實現引言一、FIR濾波器基礎與多相分解原理1.1 FIR濾波器數學模型1.2 多相分解的數學推導1.3 多相分解的物理意義 二、插值應用中的數學原理2.1…

Java并發編程實戰 Day 22:高性能無鎖編程技術

【Java并發編程實戰 Day 22】高性能無鎖編程技術 文章簡述 在高并發場景下,傳統的鎖機制(如synchronized、ReentrantLock)雖然能夠保證線程安全,但在高競爭環境下容易引發性能瓶頸。本文深入探討無鎖編程技術,重點介紹…

打破語言壁壘!DHTMLX Gantt 與 Scheduler 文檔正式上線中文等多語言版本!

你還在為英文技術文檔望而卻步嗎?現在好消息來了!DHTMLX 團隊宣布,其兩款明星組件——DHTMLX Gantt(甘特圖)與 DHTMLX Scheduler(日程排程器)的官方文檔,現已全面支持中文、德語、韓…

無監督 vs 有監督的本質區別

一、無監督 vs 有監督的本質區別 1. 無監督學習 定義:數據中沒有人為標注的 “正確答案”(如類別標簽、目標值),模型需自己發現數據中的模式。任務目標:學習數據的分布規律、結構或生成邏輯。例子: 文本續…

【Linux】初見,進程概念

前言: 上文我們講到了Linux下的第一個程序:進度條 【Linux】LInux下第一個程序:進度條-CSDN博客 本文我們來講一講Linux中下一個非常重要的東西:進程 1.馮諾依曼體系結構 我們所見的大部分計算機都是遵循的馮諾依曼體系結構…

Linux進程間通信(IPC)詳解:從入門到理解

引言 作為一名C開發初學者,理解Linux下的進程間通信(Inter-Process Communication,簡稱IPC)機制是非常重要的一步。本文將用通俗易懂的語言,配合直觀的圖示,幫助你理解Linux進程間通信的基本概念和各種實現…

SQL進階之旅 Day 27:存儲過程與函數高級應用

【SQL進階之旅 Day 27】存儲過程與函數高級應用 文章簡述 在數據庫開發中,存儲過程和函數是實現復雜業務邏輯、提高代碼復用性和提升系統性能的重要工具。本文作為“SQL進階之旅”系列的第27天,深入探討存儲過程與函數的高級應用,涵蓋其設計…

泰國零售巨頭 CJ Express 借助 SAP 內存數據庫實現高效數據管理

泰國 CJ Express 運用 SAP 內存數據庫有效控制數據增長案例 “Datavard Outboard 操作簡便、配置輕松,我們得以在生產系統上完成數據歸檔,成功將約 730GB 數據遷移至 Hadoop 集群。”——K. Jak,J Express 技術服務經理 關于 CJ Express …

ImageSharp.Web 使用指南:高效處理ASP.NET Core中的圖像

文章目錄 前言一、ImageSharp.Web簡介二、安裝與配置1. 安裝NuGet包2. 基本配置3. 高級配置 三、核心功能與使用示例1. 基本圖像處理2. 處理模式詳解3. 自定義處理命令 四、緩存策略1. 物理文件系統緩存2. 分布式緩存3. 自定義緩存 五、性能優化建議六、常見問題解決1. 圖像處理…

使用R進行數字信號處理:嬰兒哭聲分析深度解析

音頻信號處理將原始聲音數據轉化為有意義的洞見,適用于語音分析、生物聲學和醫學診斷等領域。使用R語言,我們可以處理音頻文件、可視化頻率內容,并生成如聲譜圖等詳細圖表。本指南將展示如何使用R包tuneR、seewave和rpanel分析嬰兒哭聲音頻文…

【環境配置】解決linux每次打開終端都需要source .bashrc文件的問題

解決方法: cd vim .bash_profile輸入下面內容后 :wq 保存并退出 # .bash_profileif [ -f ~/.bashrc ]; then. ~/.bashrc fi 參考鏈接&am…

ResizeObserver的錯誤

為什么會存在ResizeObserver錯誤 ResizeObserver loop completed with undelivered notifications. ResizeObserver用于監聽元素content size和border size的變化。但是元素的變化和監聽可能會導致循環觸發,例如有元素A,監聽元素A尺寸變化后將元素A的寬…

[k8s]--exec探針詳細解析

在 Kubernetes 中,exec 探針是一種通過 在容器內執行命令 來檢測容器健康狀態的機制。它的核心邏輯是:執行命令后,若命令返回值為 0(表示成功),則認為容器健康;否則認為不健康。 一、exec 探針的…

偶數項收斂半徑

🧠 背景:冪級數與收斂半徑 一個冪級數(power series): ∑ n 0 ∞ a n x n \sum_{n0}^{\infty} a_n x^n n0∑∞?an?xn 其收斂半徑 R R R 表示該級數在哪些 x x x 的取值范圍內收斂。其計算公式: 1 R …

從0開始學習語言模型--Day01--親自構筑語言模型的重要性

在如今這個時代,人工智能儼然已經成了一個大家耳熟能詳的詞匯。隨著技術的發展,它在不斷地降低計算機領域一些工作的門檻,甚至有時候我們能看到一個可能六年前還需要從頭開始學習的職業,現在只需要能掌握一個專屬的小模型就可以擁…