多智能體(Multi-agent)策略模式:思維鏈CoT和ReAct

參考:https://zhuanlan.zhihu.com/p/704523060

🎯 一句話記住

  • CoT:像“考試時在草稿紙上寫完所有步驟,再抄答案”。
  • ReAct:像“玩密室逃脫,每開一個箱子就去找下一個線索”。

用小學生能聽懂的話 + 兩個小故事,把 CoT(思維鏈)ReAct(行動-思考交替) 的區別講清楚。


🧠 先記住兩個關鍵詞

  • CoT:像“在心里自言自語”,把推理過程一口氣說完。
  • ReAct:像“邊做邊說”,先動手做一步,再思考下一步,再動手……

🌰 故事 1:CoT——小明做數學題

題目:小明有 5 顆糖,媽媽又給他 3 顆,他吃掉 2 顆,還剩幾顆?

小明心里的小劇場(CoT)
“我先數原來的 5 顆,加上 3 顆就是 5 + 3 = 8 顆。再吃掉 2 顆,8 - 2 = 6 顆。所以還剩 6 顆!”
一口氣把推理全說完,再給出答案。
這就是 CoT:先完整思考,再回答


🌰 故事 2:ReAct——小紅拼樂高

任務:拼一輛樂高小車,但說明書丟了。

小紅邊做邊說(ReAct)

  1. 行動:先拿起輪子裝上去。
    思考:咦,車身還沒裝,輪子會晃!
  2. 行動:拆掉輪子,先拼底座。
    思考:底座好了,輪子應該裝這里。
  3. 行動:把輪子對準卡扣按進去。
    思考:現在裝方向盤,車就能開了!
    每一步先做再想,再做再想……
    這就是 ReAct:行動和思考交替進行

📝 小學生總結表

CoT(思維鏈)ReAct(行動-思考交替)
像什么?一口氣把解題步驟全說完邊做實驗邊記錄
順序思考 → 思考 → … → 答案行動 → 思考 → 行動 → 思考…
優點邏輯清楚,一步不漏靈活應變,隨時糾錯
例子口算題:先算乘法,再加法拼樂高:裝錯了拆了重裝

下面用最少的代碼,把 CoT(思維鏈)ReAct(行動-思考交替) 各寫一個可運行的小例子,全部用小學生也能看懂的“加減法”場景。


① CoT(思維鏈)

一口氣把推理過程打印完,再給答案。

def solve_by_cot(a, b, c):# 1. 先把整個思考過程說完print(f"1. 原來有 {a} 顆糖")print(f"2. 媽媽又給 {b} 顆,一共 {a + b} 顆")print(f"3. 吃掉 {c} 顆,還剩 {a + b - c} 顆")# 2. 最后給出答案return a + b - cprint("CoT 答案:", solve_by_cot(5, 3, 2))

運行結果

1. 原來有 5 顆糖
2. 媽媽又給 3 顆,一共 8 顆
3. 吃掉 2 顆,還剩 6 顆
CoT 答案: 6

② ReAct(行動-思考交替)

每做一步就停下來“想一想”,再繼續下一步。

def solve_by_react(a, b, c):total = aprint(f"行動:數出 {a} 顆糖")total += bprint(f"思考:媽媽又給 {b} 顆,現在應該有 {total} 顆")total -= cprint(f"行動:吃掉 {c} 顆")print(f"思考:所以最后還剩 {total} 顆")return totalprint("ReAct 答案:", solve_by_react(5, 3, 2))

運行結果

行動:數出 5 顆糖
思考:媽媽又給 3 顆,現在應該有 8 顆
行動:吃掉 2 顆
思考:所以最后還剩 6 顆
ReAct 答案: 6

🎯 一句話總結代碼差異

  • CoT:先 print 完所有思考,最后 return 結果。
  • ReAct:每做一次運算就 print,邊算邊說。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/92906.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/92906.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/92906.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ChatGPT指令大全:輸入需求=輸出完整方案

ChatGPT指令大全提供數百個精煉過的指令語句 (提示詞),讓你充分發揮 ChatGPT 的強大功能 一、核心功能模塊分類 1. 求職與面試 簡歷優化 專業反饋:按面試官視角分析簡歷并提出改進建議量化數據:為經歷添加具體數字(如提升效率30…

Java零基礎入門學習知識點2-JDK安裝配置+Maven

文章目錄版本提示參考視頻Maven環境準備一、安裝Java開發工具包(JDK)二、JDK環境配置三、下載Maven安裝包*四、Maven環境配置(可省略)*五、驗證安裝(上一步沒做,這步無法驗證,可省)六…

基于單片機智能衣柜/智能衣櫥設計

傳送門 👉👉👉👉其他作品題目速選一覽表 👉👉👉👉其他作品題目功能速覽 概述 本設計實現了一種基于單片機的多功能智能衣柜,融合環境檢測、安全防護與用戶交互功能…

自動語音識別(ASR)技術詳解

語音識別(Automatic Speech Recognition, ASR)是人工智能和自然語言處理領域的重要技術,旨在將人類的語音信號轉換為對應的文本。近年來,深度學習的突破推動語音識別系統從實驗室走入日常生活,為智能助手、實時翻譯、醫…

【MySQL】MySQL 事務和鎖詳解

一、MySQL 事務 1.1 事務介紹 在 MySQL 中,事務(Transaction) 是一組不可分割的 SQL 操作序列,這些操作要么全部成功執行,要么全部失敗回滾,以此保證數據庫操作的完整性和一致性。 事務將數據庫從一種一致…

虛擬直線閾值告警人員計數算法暑期應用

智慧人員計數助力暑期:技術賦能安全管理的創新實踐一、背景:暑期人流激增下的安全管理挑戰暑期是旅游、商業、交通等場景的客流高峰期,人員密集區域易引發踩踏事故、管理混亂等安全隱患。傳統人工計數方式效率低、誤差大,難以滿足…

SQL164 2021年11月每天新用戶的次日留存率

SQL164 2021年11月每天新用戶的次日留存率 思路 ?找出新用戶?:確定每個用戶首次活躍的日期(即新用戶) 例如101用戶在11月1日首次出現 ?處理跨天活躍?:考慮用戶可能跨天活躍的情況(in_time和out_time不在同一天&a…

基于單片機的數字電壓表設計

2 系統原理及基本框圖 如圖2.1所示,模擬電壓經過檔位切換到不同的分壓電路衰減后,經隔離干擾送到A/D轉換器進行A/D轉換,然后送到單片機中進行數據處理。處理后的數據送到LCD中顯示,同時通過串行通訊與上位機通信。圖2.1系統基本方…

[NLP]UPF基本語法及其在 native low power verification中的典型流程

UPF基本語法及其在 native low power verification中的典型流程 摘要:本文首先簡要介紹 UPF(Unified Power Format),然后解釋其在 native low power verification(原生低功耗驗證)中的典型流程。最后,我將使用50個具體例子來完整展示 UPF 的關鍵語法。這些例子基…

fish-speech 在50系列顯卡使用 --compile加速兼容

#環境說明 GPU: NVIDIA GeForce RTX 5080 Laptop GPU (sm_120) win11家庭版 24H2 #問題匯總 baize.exceptions.HTTPException: (500, "RuntimeError: ptxas failed with error code 4294967295: \\n\\n") 問題匯總 1 baize.exceptions.HTTPException: (500, "…

UI自動化測試實戰

Python接口自動化測試零基礎入門到精通(2025最新版)一、設計背景 隨著IT行業的發展,產品愈漸復雜,web端業務及流程更加繁瑣,目前UI測試僅是針對單一頁面,操作量大。為了滿足多頁面功能及流程的需求及節省工…

面試實戰,問題六,被問數據庫索引,怎么回答

Java開發面試:數據庫索引的原理及常見問題解答 在Java開發面試中,數據庫索引是核心知識點,涉及數據庫優化和性能調優。索引通過高效的數據結構加速數據檢索,降低磁盤IO成本,并支持排序操作。下面我將逐步解釋索引的原理…

ARM-I2C硬實現

硬件I2C-GD32F4系列的實現初始化操作在初始化函數里執行以下代碼uint32_t i2cx_scl_port_rcu RCU_GPIOB; uint32_t i2cx_scl_port GPIOB; uint32_t i2cx_scl_pin GPIO_PIN_6; uint32_t i2cx_scl_af GPIO_AF_4;uint32_t i2cx_sda_port_rcu RCU_GPIOB; uint32_t i2cx_sda_po…

WinUI3開發_過渡動畫

簡介 過渡動畫是當發生事件時控件UI狀態發生改變時以一種動畫形式來演變到另外一種狀態,而非瞬間改變,使用一種更加平滑的方式來進行切換,例如下圖是文字切換的交叉柵欄效果:還有頁面切換動畫:在或者是圖標動畫&#x…

Linux下提權root權限

現在AI工具這么豐富,稍微搜一下就有一個差不多的總結輸出。但是,可能還不夠詳細,或者給得太多~~~今天時間關系,今天只總結了在Linux如何提權到root,并沒有寫如何進行防護。后面有時間,我再總結一下。命令實…

焊接機器人節能先鋒

汽車制造業中,機器人技術的應用已成為推動工業自動化和生產效率提升的重要力量。機器人在焊接、組裝、涂裝等關鍵制造環節中扮演著不可或缺的角色。隨著工業生產規模的不斷擴大,能源消耗和成本控制成為了企業必須面對的重大挑戰。尤其是工業焊接用氣的大…

MinIO:云原生對象存儲的終極指南

MinIO 是什么? MinIO 是一款高性能、云原生的對象存儲服務,具有以下優勢: 輕量級部署:采用 Go 語言編寫,資源占用低,支持快速部署 兼容性強:完全兼容 Amazon S3 API,輕松對接現有應用 高可用架構:支持分布式部署,確保數據持久性和服務可用性 高性能表現:專為云環境…

Spring AOP `MethodInvocation` 工作原理

?? 一、通知到 MethodInterceptor 的轉換機制 Spring AOP 通過適配器模式將開發者定義的注解型通知(如 Before)統一轉換為 MethodInterceptor 接口實現,確保所有通知類型能接入同一調用鏈。以下是轉換細節: 1. 適配器實現原理 核…

PPO原論文閱讀

一、Introduction1.目前存在的問題:(deep)Q-learning:在一些簡單問題上表現不佳,可理解性差基礎的policy gradient算法:(如REINFORCE)魯棒性差,需要大量數據TRPO:復雜,在包含噪音&am…

零基礎也能創作專屬歌曲:文心一言+蘑兔AI協同教程

在AI技術飛速發展的今天,音樂創作已不再是專業音樂人的專屬領域。通過文心一言與蘑兔AI的協同使用,即使沒有音樂基礎,也能輕松完成從歌詞創作到作曲編曲的全流程。本文將詳細拆解操作步驟,助你快速上手,實現音樂創作夢…