目錄
一、什么是Agent
二、什么是MetaGPT【多智能體框架介紹】
三、MetaGPT的背景
一、什么是Agent
智能體 = LLM+觀察+思考+行動+記憶
?Agent(智能體) = 一個設置了一些目標或任務,可以迭代運行的大型語言模型。這與大型語言模型(LLM)在像ChatGPT這樣的工具中“通常”的使用方式不同。在ChatGPT中,你提出一個問題并獲得一個答案作為回應。而Agent擁有復雜的工作流程,模型本質上可以自我對話,而無需人類驅動每一部分的交互。?
我的理解:Agent是賦予大語言模型使用工具的能力,讓其不再是簡單的QA問答,而是通過用戶的提問,大語言模型可以自己本身去使用工具把用戶的指令拆分從而更好的挖掘出大語言模型的能力;例如:
Agent爬蟲:
①通過bing.search.q + query的方式,構造bing的搜索頁面的url
(例如:https://www.bing.com/search?q=)
②通過requests.get獲取到搜索頁面的結果,使用beautifulsoup解析
③提取里面的文本然后將文本傳入大語言模型,進行整理和分析。
上述就是一個智能體的實例,這分別提到Agent的工具調用能力和規劃能力,在 LLM 支持的自主Agent系統中,LLM 充當Agents的大腦,并輔以幾個關鍵組成部分:
-
規劃
-
子目標和分解:Agents將大型任務分解為更小的、可管理的子目標,從而能夠有效處理復雜的任務。
-
反思和完善:Agents可以對過去的行為進行自我批評和自我反思,從錯誤中吸取教訓,并針對未來的步驟進行完善,從而提高最終結果的質量。
-
-
記憶
-
短期記憶:我認為所有的上下文學習(參見提示工程)都是利用模型的短期記憶來學習。
-
長期記憶:這為Agents提供了長時間保留和回憶(無限)信息的能力,通常是通過利用外部向量存儲和快速檢索來實現。
-
-
工具使用
-
Agents學習調用外部 API 來獲取模型權重中缺失的額外信息(通常在預訓練后很難更改),包括當前信息、代碼執行能力、對專有信息源的訪問等。
-
二、什么是MetaGPT【多智能體框架介紹】
MetaGPT是一個多智能體協作框架,將標準化操作(SOP) 程序編碼為提示確保解決問題時采用結構化方法。要求智能體以專家形式參與協作,并按要求生成結構化的輸出,例如高質量的需求文檔、架構設計圖和流程圖等。結構化的輸出對于單個智能體即是更高層次的思維鏈(Chain-of-Thought),對于下游角色則是語義清晰、目標明確的上下文(Context)。通過明確定義的角色分工,復雜的工作得以分解為更小、更具體的任務。從而提升了LLMs的輸出質量。
①什么是SOP:
SOP是 Standard Operating Procedure三個單詞中首字母的大寫 ,即標準作業程序,指將某一事件的標準操作步驟和要求以統一的格式描述出來,用于指導和規范日常的工作。SOP的精髓是將細節進行量化,通俗來講,SOP就是對某一程序中的關鍵控制點進行細化和量化。SOP不是一個單點任務,而是一個完整的營銷、運營、服務體系構成;
②為什么要做SOP?
標準作業流程可縮短大模型對不熟練且復雜的事務所花費的學習時間。只要按照步驟指示就能避免失誤與疏忽;
主要特點:
-
穩定的解決方案:借助SOP,與其他 Agents 相比,MetaGPT 已被證明可以生成更一致和正確的解決方案。
-
多樣化的角色分配:為LLM分配不同角色的能力確保了解決問題的全面性。
在MetaGPT中多智能體 = 智能體+環境+SOP+評審+路由+訂閱+經濟
-
智能體:在單個智能體的基礎上,擴展了多智能體定義。在多智能體系統中,可以由多個單智能體協同工作,每個智能體都具備獨特有的LLM、觀察、思考、行動和記憶。
-
環境:環境是智能體生存和互動的公共場所。智能體從環境中觀察到重要信息,并發布行動的輸出結果以供其他智能體使用。
-
標準流程(SOP):這些是管理智能體行動和交互的既定程序,確保系統內部的有序和高效運作。
-
評審:評審是為了解決幻覺問題。人類的幻覺實際高于大語言模型,但人類已經習慣了幻覺與錯誤,日常中會通過大量評審來保障復雜工作每一步的可靠性。嚴謹有效的評審過程能將復雜工作整體的錯誤率降低90%
-
路由:通信是智能體之間信息交流的過程。它對于系統內的協作、談判和競爭至關重要。
-
訂閱:需求說了一個制度改革或市場變化,所有人都應該關注/判斷影響/修改計劃
-
經濟:這指的是多智能體環境中的價值交換系統,決定資源分配和任務優先級。
三、MetaGPT的背景
在探索大規模語言模型(LLMs)的應用上,自主智能體展現了巨大的潛力,能夠增強和模擬人類工作流程。目前研究主要集中在以角色扮演形式驅動LLMs,通過多輪對話解決問題。然而,在面對更為復雜的任務時,簡單地連接多個LLM可能導致解決問題的不可控性,難以滿足實際需求。人類通過長期實踐積累了各種領域的標準操作流程(SOPs),這些SOPs在任務分解和角色協作中發揮著關鍵作用。
受此啟發,DeepWisdom團隊在2023年6月開源了MetaGPT框架,火爆全網,并聯合KAUST AI中心、廈門大學、CUHK(SZ)、南京大學、UPenn以及UCB等眾多高校機構的學者進行了廣泛深入的研究,為多智能體協作錨定了有效范式。MetaGPT創新性地將SOPs編碼為智能體的設計規范和協議,進而實現了人類領域知識的自動嵌入。這一工作為更好地理解和模擬人類工作流程提供了新的途徑,為自主智能體在各種任務中的表現和適應性帶來了新的可能性。