【多智能體】基于嵌套進化算法的多代理工作流

在這里插入圖片描述

😊你好,我是小航,一個正在變禿、變強的文藝傾年。
🔔本專欄《人工智能》旨在記錄最新的科研前沿,包括大模型、具身智能、智能體等相關領域,期待與你一同探索、學習、進步,一起卷起來叭!
🚩Paper:EvoFlow: Evolving Diverse Agentic Workflows On The Fly
💻時間:202502
💭推薦指數:🌟🌟🌟🌟🌟

往期精彩專欄內容,歡迎訂閱:

🔗【多智能體】20250610:受木偶戲啟發實現多智能體協作編排
🔗【多智能體】20250609:基于LLM自進化多學科團隊醫療咨詢多智能體框架
🔗【具身智能體】20250608:EvoAgent:針對長時程任務具有持續世界模型的自主進化智能體

創新性

  1. 范式轉變:首次明確將代理工作流程自動化表述為成本效益驅動的多目標優化問題,強調了LLM異質性和復雜性多樣性在多智能體系統發展中的關鍵作用。
  2. 實用解決方案:提出了一種基于生態位進化算法的框架EvoFlow,能夠在各種任務領域中自動演化出異質且復雜性自適應的代理工作流程,最小化人為干預。
  3. 實證評估:在七個基準測試上的廣泛實驗表明,EvoFlow具有多樣性、高性能和經濟性,優于之前的手工制作和自動化工作流程。
  4. 多樣性演化:能夠演化出從簡單I/O任務到復雜多輪交互的工作流程群體。
  5. 性能提升:在六個基準測試中,EvoFlow的性能比現有的手工設計或自動化工作流程提高了1.23%到29.86%。
  6. 經濟性:訓練成本僅為SOTA基線AFlow的1/3,推理成本僅為AFlow的1/5,同時在MATH基準上超越了AFlow 5.91%。

補充這里可能會存在的疑點
EvoFlow在處理多目標優化問題時是如何定義其優化目標的?

EvoFlow的多目標優化目標是通過平衡成本和性能來生成的。具體來說,EvoFlow的優化目標函數定義為: G ? = arg ? max ? G ∈ H ( I , E o ) [ u ( G , T ) , ? c ( G , T ) ] ? , \mathcal{G}^{\star}=\underset{\mathcal{G}\in\mathcal{H}(\mathcal{I},\mathcal{E}^{o})}{\arg\max}\left[u(\mathcal{G},T),-c(\mathcal{G},T)\right]^{\top}, G?=GH(I,Eo)argmax?[u(G,T),?c(G,T)]?,
其中, u ( ? ) u(\cdot) u(?)表示任務領域的性能評估函數, c ( ? ) c(\cdot) c(?)表示系統成本的評估函數。

這個目標函數表示在尋找一個工作流集合 G ? \mathcal{G}^{\star} G?,使得在性能和成本之間達到最佳平衡。具體來說, G ? \mathcal{G}^{\star} G?包括一組非支配的工作流,這些工作流在目標空間中分布均勻,并且位于帕累托前沿(Pareto front)附近。

EvoFlow在實驗中是如何設置初始工作流種群的?

EvoFlow的初始工作流種群是通過選擇一個包含多種強大單代理和多代理結構的籃子來初始化的。這些結構包括CoT(Chain-of-Thought)、Ensemble、Self-Reflexion、Multi-agent
Debate等。具體初始化過程如下:

  1. 從操作符節點池 O ( 0 ) \mathcal{O}^{(0)} O(0)中選擇多個操作符模板,并從LLM池 M \mathcal{M} M中隨機抽樣LLM實例和提示。
  2. 將選定的操作符模板實例化,生成初始工作流個體 G k \mathcal{G}_{k} Gk?,并為其分配多個效用指示標簽,這些標簽反映了工作流在特定任務領域的專長。
  3. 通過上述步驟生成初始工作流種群 P ( 0 ) P^{(0)} P(0),并為其分配多個效用指示標簽,以便快速匹配用戶查詢和相關工作流。

EvoFlow在進化過程中如何利用小生境選擇機制來維持種群的多樣性和質量?

具體步驟如下:

  1. 對于每個新個體 G ⊙ ( t ) \mathcal{G}_{\odot}^{(t)} G(t)?,計算其在成本和效用標簽上的排名,以確定其所屬的小生境區域 P N A P^{NA} PNA
  2. 在小生境區域內執行查詢,記錄每個個體在處理查詢時的累計成本和性能。
  3. 計算每個個體在小生境區域內的適應度值 F ( G ) \mathcal{F}(\mathcal{G}) F(G),適應度值較低的個體被認為更優。
  4. 在小生境區域內執行選擇操作,淘汰適應度值最低的個體 G worst \mathcal{G}^{\text{worst}} Gworst,并將
    其他個體(包括父代、后代和新個體)更新到種群中。

通過這種方式,EvoFlow能夠在保持種群多樣性的同時,逐步進化出高性能的工作流。

研究背景

在這里插入圖片描述

  1. 研究問題:這篇文章要解決的問題是如何自動優化一組異構且復雜度自適應的智能工作流程,以提供多樣化的解決方案。現有的自動化管道通常缺乏LLM異質性和復雜性調度,限制了它們結合較弱模型以實現更定制化和成本效益解決方案的潛力。
  2. 研究難點:該問題的研究難點包括:如何在多目標優化中平衡成本和性能;如何在大規模搜索空間中找到高效的進化算法;如何在保持種群多樣性的同時提高進化效率。
  3. 相關工作:該問題的研究相關工作包括早期的手動配置工作流(如CAMEL、AutoGen、MetaGPT),以及后續顯著減少人類干預的工作流(如DsPy、GPTSwarm、EvoAgent)。最近的研究表明,這些自動化管道能夠開發出驚人且強大的智能工作流,標志著向完全自主智能代理AI的重大進步。然而,這些管道仍然缺乏LLM異質性和復雜性多樣性。

研究方法

在這里插入圖片描述

這篇論文提出了EvoFlow,一種基于小生境進化算法的框架,用于自動搜索異構且復雜度自適應的智能工作流程。具體來說,

  1. 標簽檢索:首先,EvoFlow通過標簽檢索從代理種群中提取父工作流程。標簽是通過LLM生成的,反映了工作流程的任務領域專長。在這里插入圖片描述
  2. 交叉和變異:然后,EvoFlow通過交叉和變異操作進化新工作流程。交叉操作在選定的父工作流程之間進行,變異操作包括LLM/提示/操作符變異,以提高后代的多樣性。
  3. 小生境選擇:最后,EvoFlow利用小生境選擇機制維持種群的多樣性和質量。小生境選擇通過計算每個個體在成本和效用標簽上的排名來確定小生境區域,并在該區域內執行查詢。

公式解釋:

  • 調用節點 I i I_{i} Ii? 的定義: I i = ( M i , P i , τ i ) , , P i ∈ P , τ i ∈ [ 0 , 1 ] , I_{i}=(M_{i},P_{i},\tau_{i}),,P_{i}\in\mathcal{P},\tau_{i}\in[0,1], Ii?=(Mi?,Pi?,τi?),,Pi?P,τi?[0,1],其中 P i P_{i} Pi? 表示關聯的提示, P \mathcal{P} P 表示可行的提示空間, τ i \tau_{i} τi? 是溫度參數。 M i M_{i} Mi? 表示從可行模型池 M \mathcal{M} M 中選擇的LLM實例。
  • 操作符節點 O j O_{j} Oj? 的定義: O j = ( I j o , E j o ) , I j o = I 1 , … , I n , E j o ? I j o × I j o , O_{j}=(\mathcal{I}{j}^{o},\mathcal{E}{j}^{o}),\mathcal{I} {j}^{o}={I{1},\ldots,I_{n}},\mathcal{E}{j}^{o}\subseteq\mathcal{I}{j}^{o}\times\mathcal{I}{j}^{o}, Oj?=(Ijo,Ejo),Ijo=I1,,In?,Ejo?Ijo×Ijo,其中 I j o \mathcal{I}{j}^{o} Ijo 是選定的調用節點集合, E j o \mathcal{E}_{j}^{o} Ejo?表示調用節點之間的連接關系。
  • 工作流 G \mathcal{G} G 的定義:KaTeX parse error: Expected '}', got '\right' at position 91: …_1,\ldots, O_ m\?r?i?g?h?t?},\mathcal{E}^a…
    其中 O S \mathcal{O}^S OS 是操作符節點的子集, E a / E o \mathcal{E}^a/\mathcal{E}^{o} Ea/Eo表示操作符節點內部/之間的連接。
  • EvoFlow的多目標優化目標: G ? = arg ? m a x G ∈ H ( I , E o ) [ u ( G , T ) , ? c ( G , T ) ] ? , \mathcal{G}^{\star}=\underset{\mathcal{G}\in\mathcal{H}(\mathcal{I},\mathcal{E}^{o})}{\arg\ max}\left[u(\mathcal{G},T),-c(\mathcal{G},T)\right]^{\top}, G?=GH(I,Eo)arg?max?[u(G,T),?c(G,T)]?,其中 u ( ? ) u(\cdot) u(?)表示任務領域的性能評估函數, c ( ? ) c(\cdot) c(?) 表示系統成本的評估函數, G ? \mathcal{G}^{\star} G?表示平衡成本和性能的帕累托最優工作流集合。

實驗設計

  1. 任務和基準:實驗在六個公共基準上進行,涵蓋四個領域:數學推理(GSM8K、MATH、MultiArith)、代碼生成(HumanEval、MBPP)、具身智能(ALFWorld)。對于MATH基準,選擇了難度為5的617個問題。
  2. 基線:比較了EvoFlow與手工設計的工作流(如Chain-of-Thought、ComplexCoT)和自動化工作
    流(如GPTSwarm、ADAS)。
  3. LLM骨干網絡:使用了四個開源模型(llama-3.1-70b、Qwen-2.5-72b、Deepseek-V2.5、Hermes-3-70b)和一個閉源模型(gpt-4o-mini-0718)。
  4. 參數配置:選擇了七個操作符來初始化操作符節點的可行空間,種群大小為15,效用標簽數量為5。

結果與分析

在這里插入圖片描述

  1. 同質性能:在六個基準上,EvoFlow的性能均優于現有的手工設計或自動化工作流。例如,在MATH基準上,EvoFlow比vanilla gpt-4o-mini提高了11.41%,比最先進的AFlow提高了6.42%。在這里插入圖片描述
  2. 異質性能:在異質設置中,EvoFlow通過優化四個開源模型,整體成本僅為ol-preview的12.4%。例如,在MATH基準上,EvoFlow比ol-preview提高了2.7%。
  3. 跨域性能:在跨域優化設置中,EvoFlow通過在MBPP數據集上的優化,提高了從87.62%到88.35%的性能,證明了其在不同領域間的優化能力。

總體結論

這篇論文提出了一種新的范式,將自主多代理工作流搜索從單目標優化轉向成本效益驅動的多目標優
化。通過基于小生境的進化算法,EvoFlow能夠自動進化出異構且復雜度自適應的智能工作流。廣泛的實驗結果表明,EvoFlow在性能上有顯著提升,同時在成本上具有顯著優勢。

📌 [ 筆者 ]   文藝傾年
📃 [ 更新 ]   2025.6.11
? [ 勘誤 ]   /* 暫無 */
📜 [ 聲明 ]   由于作者水平有限,本文有錯誤和不準確之處在所難免,本人也很想知道這些錯誤,懇望讀者批評指正!

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/86666.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/86666.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/86666.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

電源知多少?LDO VS DCDC((下)

首先補充幾個上一節沒有提到的知識,我們通常說的DCDC同步整流是指什么? 同步是指采用通態電阻極低的專用功率MOS來取代整流二極管以降低整流損耗,,但是同步整流有以下兩點需要注意:1、MOS在導通之后的壓降比較低&…

數組方法_push()/pop()/數組方法_shift()/unshift()

push 方法用于在數組的末端添加一個或多個元素,并返回添加新元 素后的數組長度。注意,該方法會改變原數組 var arr [];arr.push("顫三") // 1arr.push(itbaizhan) // 2arr.push(true, {}) // 4arr // [顫三 , itbaizhan, true, {}] pop 方法用…

腦機新手指南(八):OpenBCI_GUI:從環境搭建到數據可視化(下)

一、數據處理與分析實戰 (一)實時濾波與參數調整 基礎濾波操作 60Hz 工頻濾波:勾選界面右側 “60Hz” 復選框,可有效抑制電網干擾(適用于北美地區,歐洲用戶可調整為 50Hz)。 平滑處理&…

多頭與空頭:市場博弈的兩面

在金融市場中,多頭(Bull)和空頭(Bear)代表兩種截然相反的投資策略,它們的博弈構成了市場價格波動的核心動力。 1. 概念對比:看漲與看跌的本質區別 多頭(Bull)&#xff0…

Excel 發現此工作表中有一處或多處公式引用錯誤。請檢查公式中的單元格引用、區域名稱、已定義名稱以及到其他工作簿的鏈接是否均正確無誤。彈窗

Excel 提示“發現此工作表中有一處或多處公式引用錯誤”通常表示公式中存在無效引用。以下是系統化的檢查步驟,幫助你定位和修復問題: 1. 檢查單元格引用: 無效單元格引用:檢查公式中的單元格地址(如 A1、B10&…

變量 varablie 聲明- Rust 變量 let mut 聲明與 C/C++ 變量聲明對比分析

一、變量聲明設計:let 與 mut 的哲學解析 Rust 采用 let 聲明變量并通過 mut 顯式標記可變性,這種設計體現了語言的核心哲學。以下是深度解析: 1.1 設計理念剖析 安全優先原則:默認不可變強制開發者明確聲明意圖 let x 5; …

【指針】(適合考研、專升本)

指針 &與*是兩個作用相反的運算符。 二級指針只能保存一級指針變量的地址和指向指針數組,其余情況不考慮。 int *p[2];int a12;int b15;*p&a;*(p1)&b;printf("%d\n%d\n",**p,**(p1));int **rp;printf("%d\n",**r); 普遍變量…

電路圖識圖基礎知識-行程開關自動往返運行控制電路詳解(二十三)

行程開關自動往返運行控制電路詳解 在機床設備運行中,部分工作臺需在特定距離內自動往復循環,行程開關自動往返運行控制電路可實現該功能,通過行程開關自動控制電動機正反轉,保障工作臺有序運動,以下展開詳細解析。 …

SpringBoot學習day1-SpringBoot的簡介與搭建

springboot回顧springspringbootspringboot搭建(新聞為例)springboot中的配置文件spring集成jdbc,mybatis,阿里巴巴數據源**SpringBoot 集成日志功能**(了解)常用日志組件日志級別 springboot統一異常處理 springboot 回顧spring spring是一個輕量級的…

【牛客小白月賽117】E題——種類數小結

1 初步想法 1.1 前置知識:vector數組的去重操作 unique()將不重復的元素放在數組前面,重復元素移到后面,qs獲取不重復元素的后一個位置,之后用erase()函數去除重復元素。 qsunique(a.begin()1,a.begin()k1); a.erase(qs,a.end(…

linux之kylin系統nginx的安裝

一、nginx的作用 1.可做高性能的web服務器 直接處理靜態資源(HTML/CSS/圖片等),響應速度遠超傳統服務器類似apache支持高并發連接 2.反向代理服務器 隱藏后端服務器IP地址,提高安全性 3.負載均衡服務器 支持多種策略分發流量…

MatAnyone本地部署,視頻分割處理,綠幕摳像(WIN/MAC)

大家好,今天要和大家分享的項目是MatAnyone,與上一篇分享的SAM2LONG類似,不過上次的分享沒有提到如何在 MAC 上部署,后來有小伙伴私信說希望能出一個 MAC 版本的。那正好看到MatAnyone這個項目順手就寫下來。該項目基于SAM2同樣可…

記錄下blog的成長過程

2025-06-11 新人榜83 2025-06-09 新人榜87 北京市原力月榜 80

C語言學習20250611

指針 指針類型 int p;》普通的整形變量int *p;》p先與*結合,表示p為指針,該指針指向的內容的數據類型為整型int p[3];》p為一個由整型數據組成的數組int *p[3];》因為[]比*優先級高,p先與方括號結合,所以p為一個數組&#xff0c…

【AI智能體】Dify 從部署到使用操作詳解

目錄 一、前言 二、Dify 介紹 2.1 Dify 是什么 2.2 Dify 核心特性 2.2.1 多模型支持 2.2.2 可視化編排工作流 2.2.3 低代碼/無代碼開發 2.3 Dify 適用場景 2.4 Dify 與Coze的對比 2.4.1 定位與目標用戶 2.4.2 核心功能對比 2.4.3 開發體驗與成本 2.4.4 適用場景對比…

Java爬蟲庫的選擇與實戰代碼

如果你的項目正在Java中考慮引入爬蟲能力,無論是做數據分析、信息聚合,還是競品監測,選對庫確實能大幅提升開發效率和運行效果。結合當前主流庫的特點與適用場景,我整理了一份更貼近實戰的對比分析,并附上可直接運行的…

詳細解釋aruco::markdetection _detectInitialCandidates函數

_detectInitialCandidates 是 OpenCV 的 ArUco 模塊中一個非常關鍵的函數,它負責檢測圖像中的候選 ArUco 標記。該函數的主要目標是: 使用多個尺度(scale)對輸入圖像進行自適應閾值處理;在每個尺度下提取輪廓并篩選出…

Android 開發中配置 USB 配件模式(Accessory Mode) 配件過濾器的配置

在 Android 開發中配置 USB 配件模式(Accessory Mode) 的配件過濾器(accessory_filter.xml),需要以下步驟: 1. 創建配件過濾器文件 在項目的 res/xml/ 目錄下創建 accessory_filter.xml 文件(若…

FreeRTOS互斥量

目錄 1.使用場合2.函數2.1 創建2.1.1 動態創建2.1.2 靜態創建 2.2 刪除2.3 釋放(Give)2.4 獲取(Take)2.5 ISR 版本注意事項 3.常規使用流程4.和二進制信號量的對比5.遞歸鎖5.1 死鎖5.2 概念5.2.1 問題5.2.2 解決方案:遞…

ThinkPad 交換 Ctrl 鍵和 Fn 鍵

概述 不知道那個大聰明設計的將fn設置在最左邊,xxx,我服了,你這個老六真惡心。 方法 一:BIOS/UEFI 設置(推薦) 重啟 你的 ThinkPad。 在啟動時按下 F1(或 Enter,再按 F1&#xff0…