一、Agents概念
? ? ? 人類是這個星球上最強大的 Agent。Agent是一個能感知并自主地采取行動的實體,這里的自主性極其關鍵,Agent要能夠實現設定的目標,其中包括具備學習和獲取知識的能力以提高自身性能。
關鍵點:感知環境、自主決策、具備行動能力,設定明確的目標和任務,適應環境及學習能力
例如?Agent 的復雜程度各不相同,一個簡單的恒溫器可以是一個 Agent
? ? ? ? ? ? ? ? 一個大型的國家或者一個生物群體也可能是個 Agent。
垂直領域 Agent?:
比如 Alphago,還有使用強化學習打游戲的DeepMind的Agent57,更加通用的Gato,OpenAI玩“躲貓貓”的多智能體。
二、prompt 工程
提示詞萬能公式
角色+角色技能+
任務核心關鍵詞+任務目標+任務背景+任務范圍+任務解決與否判定+任務限制條件
輸出格式/形式+輸出量
?
https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor
?三、Prompt外掛
外掛知識庫數據庫
這些還不夠,嘗試讓 GPT 調用函數和使用工具,ChatGPT也推出了插件體系。當人們發現大模型的推理能力很差時,開始試圖讓模型自身清楚地描述問題,把問題轉化為 PDDL (Planning Domain Definition Language)格式的描述語言,通過調用通用規劃器來解決規劃問題?。
四、分解與組合
?大模型在大任務執行能力上分解和組合。例如,
?1.MapReduce 模式
將一個大型文本進行摘要,分開摘要在獲得整體摘要
2、思維鏈(Chain of Thought,CoT),
它要求模型展示其思考過程
兩種方式實現,一種是具體說明,即要求模型詳細地、一步步地思考;
另一種是示例說明,即通過給定問題和答案的同時,提供思考過程。當詢問模型時,模型會模仿此過程,逐漸思考并給出答案。
嘗試多種思路來解決問題,然后投票選擇最佳答案,這就是CoT-SC
3、思維樹(ToT, Tree of Thought)
發散的方法也有局限性,例如24點問題,它不能很好地解決,解決方法垂直分解,思維樹(ToT, Tree of Thought)的一個主要思路,它會根據當前的問題分解出多個可能,然后每一個樹節點就是父節點的一個子問題,逐層擴散,遍布整個解空間,一些節點就直接會發現不合適而終止掉,達到了有效剪枝的作用。
?
比如排序問題,排序你可能需要分解和排序,然后再merge,COT就不行了
4、Graph of Tree,GoT
為了解決這個問題,一種名為思維圖(Graph of Tree,GoT)的方法被提出。這種思維圖既可以分解,也可以合并。?
2023年9月26日,清華姚期智團隊又提出了更新的方法——累計推理?
首先會提出一個初步的想法,然后再對這個想法進行驗證,看這個提案是否合適。如果提案合適,就將它添加到圖的下一個節點,每一步都基于已經建立的圖節點進行下一個思考節點的創建,這樣發散、合并或刪除直到達到最終目標狀態,完備性和靈活性大大增強。24點問題上成功率已經達到98%
4、反饋?
分解和組合,不能與外界進行互動,反饋是整個控制論的基石,也是動物體從誕生之初就具備的基本能力。
ReACT讓大模型先進行思考,思考完再進行行動,然后根據行動的結果再進行觀察,再進行思考,這樣一步一步循環下去。基本上就是人類這樣的智能體主要模式。
Agent的框架都會讓模型輸出JSON進行函數調用,OpenAI也就推出了Funtion Calling?
五、Agents
1、AutoGPT
AutoGPT橫空出世,短短數周Star數就超過PyTorch達到90k?
創建一個初始的計劃,然后進入主循環。系統會讓模型判斷在當前計劃下該進行何種行動,接著會執行行動。執行完畢后,結果會寫入下一次循環中。如此,每次決策都會基于之前的結果、記憶和計劃,從而制定出新的行動方案。
2、jarvis gpt
微軟的賈維斯 (Jarvis)一個深度學習任務調度系統,也采用了類似思想。他們主要關注如何調用模型來執行各種深度學習任務,涉及到了先做計劃,再選擇模型,然后執行任務,獲取反饋,然后進入下一輪循環等環節。
?3、Xagents
清華聯合面壁發布了XAgent,提出了雙循環機制在效果上碾壓了AutoGPT
GPT-4也是一種Agent,Agent的概念是大模型的超集
?1.6 Multi-Agent
斯坦福小鎮"開了一個好頭。在這個虛擬的小鎮里,每個角色都是一個單獨的智能體,每天依據制定的計劃按照設定的角色去活動和做事情,
MetaGPT的項目
引起了廣泛關注,這個項目中定義了產品經理、架構師、項目管理員、工程師和質量保證等角色,各角色之間通過相互協作,基本可以勝任完成500行左右代碼的小工程了。?
ChatDev的系統
清華開發了一個名為ChatDev的系統,進一步引入了CEO等角色,這里就不再展開描述。
RPA Agents
?RPA 公司實在智能把 Agent 用于他們的產品調用常見桌面軟件,如淘寶網、釘釘,來自動完成桌面任務。?
Agent 的實現,共性:長短時記憶能力、工具使用能力、通信能力,甚至包括 SOP 的能力
AI在一定程度上模仿了人腦的工作方式,但實際上,機器人和人腦在處理信息時采用的策略有很大的不同。因此,即使在未來,我們也需要繼續改進 AI 框架,以解決這種差距。比如一個百萬位數的加法任務,GPT-4囿于token數的限制是不可能完成這個任務的,但人類卻可以,這恰是人類和AI需要彌補的Gap。
?
五、智能本質
?