前幾天看到一個圖,感覺能幫助理解 AI Agent 的基本思想和原理,特摘過來備忘。順道加上自己目前對相關部分的理解,不一定對,權當做個記錄。
另外,專門查了下圖的來源,應該是源自? Lilian Weng 的博客文章《LLM Powered Autonomous Agents》-June 23, 2023
原圖:?
?
中文重置版:
?
Memory(記憶):
- 短期記憶:特指利用上下文學習(In-Context Prompting,又稱為提示工程 Prompt Engineering)讓模型在短時間內“記住”并利用這些信息來提高其在特定任務上的表現。
>>簡單說就是——在提問時一并給出背景資料,引導其思想,讓結果更符合我們的預期。好處是不需要去調整和專門訓練大模型。
>>現在對話模式的AI應該都是用的這個技術。包括給定資料,讓大模型出題也是這個方式。 - 長期記憶:這種設計使得 AI Agents 能夠在長時間內保留和回憶大量信息的能力,一般通過外部向量存儲和快速檢索來實現。
>>對這塊的理解不一定對,我認為是——將以往的交流記錄存儲下來,并建立索引。當提問時,優先從歷史信息中找到最相似的記錄,來輔助這次的任務。相當于額外記錄了你的喜好,而這個是不需要“寫入”大模型的。
- Planning(規劃):
- 子目標和分解:將一個大的、復雜的任務分解成多個小的、可管理的子目標。這樣做可以讓任務變得更加容易處理,并且可以提高任務執行的效率。
>>這個相對好理解。通過這種方法來增強處理復雜任務的能力。
>>這塊應該是調用大模型來做到的? - 反思和調整:在執行任務后,對自己的行為進行評估和分析,以識別錯誤并找出改進的方法。通過這種方式,代理可以從經驗中學習,逐步提高自己的智能和適應性,從而提高最終結果的質量。
>>通過這種策略,來提升任務處理質量、提升“智能”,從而能較好處理復雜任務。
- 子目標和分解:將一個大的、復雜的任務分解成多個小的、可管理的子目標。這樣做可以讓任務變得更加容易處理,并且可以提高任務執行的效率。
- Tool use(工具使用):
- AI Agents 可以學習如何調用外部 API,以獲取模型權重中缺少的額外信息,這些信息通常在預訓練后很難更改,包括當前信息、代碼執行能力、對專有信息源的訪問等。
>>大模型側重在于其強大的語言處理能力和與外部工具結合的能力,
- AI Agents 可以學習如何調用外部 API,以獲取模型權重中缺少的額外信息,這些信息通常在預訓練后很難更改,包括當前信息、代碼執行能力、對專有信息源的訪問等。
補充資料1:
- 大模型(LLM,Large Language Model)的概念:是指擁有大量參數的預訓練語言模型,能夠理解和生成自然語言文本。這些模型通過在大規模數據上進行訓練,能夠捕捉到語言的各種模式和規律,從而在各種語言任務中表現出色,如問答、翻譯、摘要生成等。
- AI Agent的概念:是指一種自主系統,能夠感知環境并采取行動以實現特定目標。AI Agents通常具有一定的智能,能夠進行決策、學習和適應環境變化。它們可以在各種應用場景中發揮作用,如自動駕駛、智能家居控制、虛擬助手等。
- 大模型與AI Agent之間的關系:?|-大模型可以作為AI Agent的核心組件,提供語言理解和生成的能力。
? ? |-AI Agent 利用“大模型+外部工具”在真實世界中執行各種任務,擁有交互能力,可表現出較高的自主性和智能性。
補充資料2:另一個圖(應該是來源于孚知流),它加上了感知(似乎也叫“多模態”):
?