最近在技術圈里有一個很有趣的爭論:大模型 Agent 是不是就是各種 Prompt 的堆疊?像 Manus 這樣看起來很智能的 Agent,本質上是不是就是用巧妙的 Prompt 約束大模型生成更好的輸出?換句話說,這是不是一門文字藝術?
這個問題引發了業內專家的激烈討論,觀點分化明顯。讓我們來看看不同的聲音。
兩大陣營的觀點碰撞
觀點一:就是文字藝術,沒必要遮遮掩掩
有開發者直言不諱地表示:"沒人敢說實話嗎?是的,就是各種 Prompt 的堆疊。"另一位實戰派開發者更加犀利:“LLM 的 input 就是 prompt,不管什么工具或模型,都只是優化 prompt。大把人把’優化 prompt’的工具吹得云里霧里,卻有意無意回避其目的還是只是生成更好的 prompt。”
這種觀點認為,Agent 可以看做 prompt engineering 的升級版。核心在于如何具體設計 prompt,如何拆分,順序是什么。其他那些復雜的架構設計,在他們看來都是在"象牙塔里扯淡"。
觀點二:遠不止文字游戲這么簡單
但技術專家們顯然不買賬。有人從工程角度分析:"生產級別的工程顯然不僅僅是 Prompt 這么簡單。"以 OpenHands 為例,對接 LLM 只是其中一個模塊,真正驅動 Agent 完成復雜任務的核心,是一整套事件驅動機制,包括狀態機、事件流框架、控制器等等,還用到了像 Sandbox 這樣的沙箱技術。
另一位專家總結得更加全面:“真正可用的 Agent = Prompt(語言接口)+ 程序化編排 + 長期狀態/記憶 + 外部工具動作 + 自反饋循環。缺少任何一環,都會從’自治智能體’迅速退化成’高級聊天機器人’。”
Agent 的本質是什么?
從技術定義來看,Agent 本質上是一個循環系統。對于一個給定目標的 AI Agent,它能夠自己創建任務、完成任務、創建新任務、重新確定任務列表的優先級,并循環直到達到目標。
用公式表達就是:Agent = LLM + Planning(計劃)+ Tool use(執行)+ Feedback(糾正偏差)
這個定義揭示了一個關鍵點:Agent 讓 LLM 具備了目標實現能力,通過自我激勵循環來完成給定目標。
關鍵在于狀態管理
有一個被很多人忽視的技術細節:現在幾乎所有的大模型 API 都是無狀態的。大模型 API 連魚的七秒記憶都沒有,它甚至記不住自己上一次的回答是什么。
那為什么我們在 AI 聊天工具里能看到它"記住"了歷史對話呢?實際上,是把以前的歷史會話每次都重新傳給大模型一遍,讓它看起來有了記憶。這就是把無狀態的 API 做成有狀態的樣子。
隨著應用復雜化,狀態管理變得越來越重要。真正厲害的 Agent 拼的其實是狀態管理能力。
Prompt 的真正作用
一位分析過 Manus 和 OpenManus 項目結構的開發者指出,Prompt 確實很重要,它可以在不微調大模型的情況下,根據先驗知識引導大模型行為,達到期待的業務效果。
但關鍵是:Prompt 是 Agent 系統中大模型和其他各個組件的潤滑油,而不是全部。
以 OpenManus 為例,其結構主要包括:
- Agent(智能體)
- Flow(流程)
- Tool(工具)
- Prompt(提示詞)
Prompt 只是其中一個組件。
技術的進化邏輯
從技術發展的角度看,這場爭論其實反映了不同階段的認知差異:
初級階段:確實主要靠 Prompt 工程,通過精心設計的提示詞讓模型表現更好。
中級階段:開始引入工具調用、多輪對話、簡單的狀態管理。
高級階段:構建完整的事件驅動系統,包含復雜的狀態機、內存管理、自主規劃和執行能力。
企業級階段:需要考慮并發、容錯、監控、安全等工程化問題。
結論:既是也不是
回到最初的問題:大模型 Agent 是不是文字藝術?
答案是:既是也不是。
從某種意義上說,所有與 LLM 的交互最終都要通過文字(Prompt)來實現,這確實是一門語言藝術。設計好的 Prompt 需要對語言有深刻理解,需要巧妙的措辭和精確的邏輯。
但將 Agent 簡單等同于 Prompt 堆疊,就像說建筑就是磚塊堆疊一樣——技術上沒錯,但忽略了設計、結構、工程等更重要的層面。
真正的 Agent 系統需要:
- 精心設計的 Prompt(文字藝術)
- 復雜的狀態管理(系統工程)
- 智能的任務規劃(算法設計)
- 可靠的工具調用(接口工程)
- 持續的自我優化(反饋機制)
寫在最后
這場爭論的價值不在于誰對誰錯,而在于推動我們更深入地思考 AI Agent 的本質。
對于初學者,從 Prompt 工程開始確實是一個好的起點,它能讓你快速理解如何與 AI 交互。
對于有經驗的開發者,則需要跳出 Prompt 的局限,從系統工程的角度思考如何構建真正可用的智能體。
技術的進步往往就是在這樣的爭論中螺旋上升的。無論你站在哪一邊,都要承認:我們正在見證一個激動人心的技術變革時代。
你覺得大模型 Agent 是文字藝術嗎?歡迎在評論區分享你的觀點。