從0開始學習大模型--Day03--Agent規劃與記憶

規劃(planning)

規劃,可以為理解觀察和思考。如果用人類來類比,當我們接到一個任務,我們的思維模式可能會像下面這樣:

·1、首先會思考怎么完成這個任務。

2、然后會審視手頭上所擁有的工具,以及如何使用這些工具高效地達成目的。

3、再會把任務拆分成子任務。(就像咱們做思維導圖一樣。)

4、在執行任務的時候,我們會對執行過程進行反思和完善,吸取教訓以完善未來的步驟。

5、執行過程中思考任務何時可以終止。

這是人類的規劃能力,我們希望智能體也擁有這樣的思維模式,因此可以通過 LLM 提示工程,為智能體賦予這樣的思維模式。在智能體中,最重要的是讓 LLM 具備兩種能力:子任務拆解和反思與改進

子任務拆解

通過LLM使得智能體可以把大型任務分解為更小的、更可控的子任務,從而能夠有效完成復雜的任務。

思維鏈(Chain of Thoughts,CoT):思維鏈已經是一種比較標準的提示技術,能顯著提升LLM完成復雜任務的效果。當我們對LLM要求“think step by step”,會發現LLM會把問題分解成多個步驟,一步一步思考問題和如何解決,能使得輸出的結果更加準確,這是一種線性的思維模式。

思維樹(Tree-of thought,ToT):對CoT的進一步擴展,在思維鏈的每一步,推理出多個分支,拓撲展開成一棵思維樹,使用啟發方式評估每個推理分支對問題解決的貢獻,選擇搜索算法,使用廣度優先搜索(BFS)或深度優先搜索(DFS)等算法來探索思維樹,并進行前瞻和回溯)。

思維鏈和思維樹的不同思考過程

反思與改進

Agent對過去的行動進行自我批評和反思,從錯誤中學習并改進未來的步驟,從而提高最終結果的質量。

在實際任務中,試錯是不可避免的,而自我反思在這個過程中起著至關重要的作用。它允許 Agent 通過改進過去的行動決策和糾正以前的錯誤來進行迭代改進。

反思是 Agent 對事情進行更高層次、更抽象思考的結果。反思是周期性生議的,當gent感知到的最新事件的重要性評分之和超過一定閾值時,就會生成反思。這可以類比為我們常用的成語“三思而后行",做重大決策的時候,我們會反思自己先前的決策。

事實上,有沒有這種類似思維模式的框架,對于大模型的給出的答案,質量與耗費的時間區別是顯而易見的,無論是只有標準,僅推理還是僅行動,都會在一定程度上限制答案,相當于是在閉門造車,而如果用對了框架,像前面所說的一樣,先規劃,做出行動后思考是否合理,再去決定下一步行動,這樣給出的答案相比之下就會更完善,在解決問題上也會更高效。像是我們比較經常會說到的就是LLM有時會因為幻覺而給出很荒謬的答案,就是因為沒有交互,也沒有觀察答案的反饋,直接就給出答案。

記憶(memory)

生活中的記憶機制

感覺記憶(Sensory Memory):這是記憶的最早階段,提供在原始刺激結束后保留感官信息(視覺、聽覺等)的印象的能力。感覺記憶通常只持續幾秒鐘。

短期記憶(或工作記憶):這是一種持續時間較短的記憶,能夠暫時存儲和處理有限數量的信息。例如,記住一個電話號碼直到撥打完畢。

長期記憶:這是一種持續村間較長的記憶,可以存儲大量信息,從幾分鐘到一生。長期記憶可以進一步分為顯性記憶和隱性記憶。顯性記憶,可以有意識地回憶和表達的信息,顯性記憶又可以分為情景記憶(個人經歷的具體事件)和語義記憶(一般知識和概念)。隱性記憶,這種記憶通常是無意識的,涉及技能和習慣,如騎自行車或打字。

智能體中的記憶機制

形成記憶:大模型在大量包含世界知識的數據集上進行預訓練。在預訓練中,大模型通過調整神經元的權重來學習理解和生成人類語言,這可以被視為“記憶"的形成過程。通過使用深度學習和梯度下降等技術,大模型可以不斷提高基于預測或生產文本的能力,進而形成世界記憶或長期記憶

短期記憶:在當前任務執行過程中所產生的信息,比如某個工具或某個子任務執行的結果,會寫入短期記憶中。記憶在當前任務過程中產生和暫存,在任務完結后被清空。

長期記憶:長期記憶是長時間保留的信息。一般是指外部知識庫,通常用向量數據庫來存儲和檢索。

學習來源于B站教程:【進階篇】05.Agent記憶(memory)_嗶哩嗶哩_bilibili

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/82035.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/82035.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/82035.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用 Couchbase Analytics Service 的典型步驟

下面是使用 Couchbase Analytics Service 的典型步驟,包括部署、配置、創建數據集、運行查詢以及監控優化等環節。 首先,您需要安裝并啟用 Analytics 服務;然后將節點加入集群并重平衡;接著在 Analytics 中映射數據服務的集合&am…

從零開始學習人工智能(Python高級教程)Day6-Python3 正則表達式

一、Python3 正則表達式 正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。 在 Python 中,使用 re 模塊來處理正則表達式。 re 模塊提供了一組函數,允許你在字符串中進行模式匹配、搜索和替換操作。 r…

MATLAB導出和導入Excel文件表格數據并處理

20250507 1.MATLAB使用table函數和writetable函數將數據導出Excel表格文件 我們以高斯函數為例子,高斯函數在數學和工程領域有著廣泛的應用,它的一般形式為: 其中是均值,決定了函數的中心位置; 是標準差,決…

推薦一組WPF自定義控件開源項目

.Net Core從零學習搭建權限管理系統教程 推薦一組WPF自定義控件開源項目。 項目簡介 這是基于WPF開發的,為開發人員提供了一組方便使用自定義組件,并提供了各種常用的示例。 包含組件:數據表格、屬性列表、樹形列表、選色器、單選框列表、…

allegro出gerber時,單擊Artwork并沒有彈窗的問題

使用allegro出gerber時,有時點擊 Artwork圖標并未如愿以償的彈出窗口。。。 可按下面嘗試恢復,注,刪除前可先備份該兩支文件。。。 看時間戳,刪除最近的下面標紅兩支文件即可。

常用設計模式在 Spring Boot 項目中的實戰案例

引言? 在當今的軟件開發領域,Spring Boot 以其高效、便捷的特性成為構建 Java 應用程序的熱門框架。而設計模式作為軟件開發中的寶貴經驗總結,能夠顯著提升代碼的可維護性、可擴展性和可復用性。本文將深入探討幾種常用設計模式在 Spring Boot 項目中的…

《饒議科學》閱讀筆記

《饒議科學》 《偷竊的生物學機制:(有些)小偷有藥可治》閱讀筆記 核心內容:探討偷竊狂(kleptomania)的生物學機制及相關研究。具體要點 偷竊狂的特征:患者不可抑制地反復偷竊個人不需要、與金錢…

從零開始搭建第一個Spring Boot應用:從入門到精通

1. Spring Boot簡介與核心概念 1.1 什么是Spring Boot? Spring Boot是Spring框架的一個擴展,它簡化了基于Spring的應用程序的初始搭建和開發過程。通過自動配置和約定優于配置的原則,Spring Boot讓開發者能夠快速啟動和運行項目。 通俗理解…

c# LINQ-Query01

文章目錄 查詢數據源標準查詢分兩類即時查詢已推遲流式處理非流式處理分類表聚合Aggregate<TSource,TAccumulate,TResult>(IEnumerable<TSource>, TAccumulate, Func<TAccumulate,TSource,TAccumulate>, Func<TAccumulate,TResult>)Aggregate<TSour…

AI惡魔之眼使用說明書

AI惡魔之眼使用說明書 產品簡介 1.1 產品介紹 AI惡魔之眼是一款具備動態視覺效果與仿生眼睛模擬功能的智能顯示產品&#xff0c;可實現以下特性&#xff1a; 真實人眼模擬&#xff1a;支持虹膜樣式變換、眨眼動畫、瞳孔縮放等動態特效&#xff0c;仿真度高自定義內容上傳&am…

CAN報文逆向工程

在沒有DBC文件的情況下解析CAN報文獲取物理信息需要逆向工程和系統分析。以下是詳細步驟&#xff1a; 1. 數據采集與基礎分析 采集原始數據&#xff1a; 使用CAN分析工具&#xff08;如PCAN-Explorer、SavvyCAN或USB-CAN適配器配套軟件&#xff09;記錄車輛在不同狀態下的CAN數…

KL散度(Kullback-Leibler Divergence):概率分布差異的量化利器

目錄 1. 什么是KL散度?關鍵特點:2. KL散度的數學公式離散分布的KL散度公式:連續分布的KL散度公式:3. KL散度的計算示例示例1:離散分布示例2:連續分布(高斯分布)4. KL散度的核心性質1. 非對稱性2. 非負性3. 與熵的關系5. KL散度與相關性的關系1. KL散度 ≠ 相關性2. 間接…

二叉樹的遍歷與構造

唉&#xff0c;好想回家&#xff0c;我想回家跟饅頭醬玩&#xff0c;想老爸老媽。如果上天再給我一次選擇的機會&#xff0c;我會選擇當一只小動物&#xff0c;或者當棵大樹也好&#xff0c;或者我希望自己不要有那么多多余的情緒&#xff0c;不要太被別人影響&#xff0c;開心…

leetcode 141. Linked List Cycle

題目描述&#xff1a; 代碼&#xff1a; 用哈希表也可以解決&#xff0c;但真正考察的是用快慢指針法。 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode(int x) : val(x), next(NULL) {}* };*/ class Soluti…

AI輔助DevOps與自動化測試:重構軟件工程效率邊界

隨著AI技術滲透至軟件開發生命周期&#xff0c;DevOps與自動化測試領域正經歷顛覆性變革。本文系統性解析AI在需求分析、測試用例生成、部署決策、異常檢測等環節的技術實現路徑&#xff0c;結合微軟Azure DevOps、Tesla自動駕駛測試等典型場景&#xff0c;探討AI如何突破傳統效…

5月7號.

flex布局: 表單標簽: 表單標簽-表單項:

【AI面試準備】中文分詞與實體抽取技術詳解

分詞&#xff0c;詞性標準 目錄 一、分詞與詞性標注1. **分詞&#xff08;Word Segmentation&#xff09;**2. **詞性標注&#xff08;Part-of-Speech Tagging&#xff09;** 二、實體抽取&#xff08;Named Entity Recognition, NER&#xff09;1. **實體類型示例**2. **輸出…

【AI落地應用實戰】Amazon Bedrock 零門檻使用 DeepSeek-R1:在 Amazon Bedrock 上部署與調用的完整實踐指南

隨著大語言模型&#xff08;LLM&#xff09;技術的快速發展&#xff0c;企業和開發者對具備更強理解與生成能力的模型需求也愈加旺盛。DeepSeek-R1 作為 DeepSeek 公司推出的一款強大開源模型&#xff0c;不僅在多項評測中表現優異&#xff0c;更具備出色的推理能力和長文本處理…

阿里云平臺與STM32的物聯網設計

基于阿里云平臺與STM32的物聯網設計方案可結合硬件選型、通信協議、云端配置及功能實現等多個維度進行設計。以下是綜合多個參考案例的詳細設計方案&#xff1a; 一、硬件選型與架構設計 主控芯片選擇 STM32系列&#xff1a;推薦使用STM32F103&#xff08;如STM32F103ZET6、STM…

IBM BAW(原BPM升級版)使用教程Toolkit介紹

本部分為“IBM BAW&#xff08;原BPM升級版&#xff09;使用教程系列”內容的補充。 一、系統Toolkit 在 IBM Business Automation Workflow (BAW) 中&#xff0c;System Toolkit 是一組預先定義和配置好的工具、功能和組件&#xff0c;旨在幫助流程設計者和開發人員快速構建…