文章目錄
- 一,Autogen簡介
- 二,Autogen原理
- 1,Autogen原理圖解
- 2,拆解Autogen是如何完成繪制特斯拉股票趨勢圖的
這篇文章介紹一個開源的Agent框架-微軟的Autogen。
一,Autogen簡介
- 官網:https://microsoft.github.io/autogen/
- git:http://github.com/microsoft/autogen
- discord:https://discord.com/invite/pAbnFJrkgZ
GPTs這么強大,不是挺好嗎?為什么要開源的智能體Autogen框架呢?那
GPTs背靠OpenAI,的確非常強悍,但是也有弊端,弊端就在于它完全依賴于ChatGPT,而對于ChatGPT,我們只能在應用層調用其API,無法在大模型層面做一些個性化的調整,比如想讓大模型在回答問題的過程中調用本地的應用。
GPTs做不到,但是Autogen框架可以做到。
Autogen可以對接商業化模型,如OpenAI;也可以對接開源的模型,比如說本地部署的KoDrama、WitherCoder、DeepSeek、通義千問。
Autogen可以簡單理解為是一個GPTs的一個本地化平替。
Autogen提供一個可視化的UI界面Autogen Studio,提供模型配置、能力配置、工作流配置等能力。通過這些能力,可以實現類似GPTs的功能。
二,Autogen原理
1,Autogen原理圖解
接下來,先通過官網的一個例子來理解Autogen的設計架構以及工作原理。
下圖是官網提供的一個Autogen智能體架構圖。
如上圖左側,Autogen框架默認提供兩個agent:
- 一個用戶代理,User Proxy Agent
- 一個助理代理,Assistant Agent
工作流程描述如下:
- 用戶提出一個需求
- 用戶代理接收到需求后,發給助理
- 助理接收到需求后,進行總體規劃設計,將這個需求拆解為多個步驟,規定每個步驟需要執行的任務
- 助理將規劃整體返回給用戶代理
- 用戶代理按照規劃按步驟執行,執行的過程中,可以持續、多次與助理進行溝通,調整任務的具體內容
2,拆解Autogen是如何完成繪制特斯拉股票趨勢圖的
以上圖中的業務場景為例,用戶要求繪制特斯拉最近一年的股票價格的變化趨勢圖。
助理對這個需求進行拆解,之后的交互過程如下:
- 助理告知用戶代理第一個步驟是執行一段代碼
- 用戶代理執行助理提供的代碼
- 用戶代理將執行的過程中出現錯誤的錯誤反饋給助理
- 助理給出解決方案,提供一個腳本
- 用戶代理執行這個腳本后,重新執行代碼,成功畫出趨勢圖
- 用戶代理對結果進行反饋,需要對結果進行調整,要求繪制百分比趨勢圖
- 助理接收到反饋后,調整任務內容,給出新的代碼
- 用戶代理執行新的代碼,繪制出滿足要求的趨勢圖
這就是Autogen的工作原理,兩個agent協同工作, 完成用戶需求。
這是最簡單的場景,只涉及兩個智能體的交互,實際上Autogen框架支持多智能體間的復雜交互。
相當于可以創建一個公司,這個公司的工作不是由具體的物理世界的人完成的,而是由多個具有不同能力的智能體完成的,每個智能體就像是一個人一樣,他們之間也可以像人一樣相互寫作,完成一個個復雜的任務。
后續將介紹多智能體的交換案例。