大模型 Agent 就是文字藝術嗎?

最近在技術圈里有一個很有趣的爭論:大模型 Agent 是不是就是各種 Prompt 的堆疊?像 Manus 這樣看起來很智能的 Agent,本質上是不是就是用巧妙的 Prompt 約束大模型生成更好的輸出?換句話說,這是不是一門文字藝術?

這個問題引發了業內專家的激烈討論,觀點分化明顯。讓我們來看看不同的聲音。

兩大陣營的觀點碰撞

觀點一:就是文字藝術,沒必要遮遮掩掩

有開發者直言不諱地表示:"沒人敢說實話嗎?是的,就是各種 Prompt 的堆疊。"另一位實戰派開發者更加犀利:“LLM 的 input 就是 prompt,不管什么工具或模型,都只是優化 prompt。大把人把’優化 prompt’的工具吹得云里霧里,卻有意無意回避其目的還是只是生成更好的 prompt。”

這種觀點認為,Agent 可以看做 prompt engineering 的升級版。核心在于如何具體設計 prompt,如何拆分,順序是什么。其他那些復雜的架構設計,在他們看來都是在"象牙塔里扯淡"。

觀點二:遠不止文字游戲這么簡單

但技術專家們顯然不買賬。有人從工程角度分析:"生產級別的工程顯然不僅僅是 Prompt 這么簡單。"以 OpenHands 為例,對接 LLM 只是其中一個模塊,真正驅動 Agent 完成復雜任務的核心,是一整套事件驅動機制,包括狀態機、事件流框架、控制器等等,還用到了像 Sandbox 這樣的沙箱技術。

另一位專家總結得更加全面:“真正可用的 Agent = Prompt(語言接口)+ 程序化編排 + 長期狀態/記憶 + 外部工具動作 + 自反饋循環。缺少任何一環,都會從’自治智能體’迅速退化成’高級聊天機器人’。”

Agent 的本質是什么?

從技術定義來看,Agent 本質上是一個循環系統。對于一個給定目標的 AI Agent,它能夠自己創建任務、完成任務、創建新任務、重新確定任務列表的優先級,并循環直到達到目標。

用公式表達就是:Agent = LLM + Planning(計劃)+ Tool use(執行)+ Feedback(糾正偏差)

這個定義揭示了一個關鍵點:Agent 讓 LLM 具備了目標實現能力,通過自我激勵循環來完成給定目標。

關鍵在于狀態管理

有一個被很多人忽視的技術細節:現在幾乎所有的大模型 API 都是無狀態的。大模型 API 連魚的七秒記憶都沒有,它甚至記不住自己上一次的回答是什么。

那為什么我們在 AI 聊天工具里能看到它"記住"了歷史對話呢?實際上,是把以前的歷史會話每次都重新傳給大模型一遍,讓它看起來有了記憶。這就是把無狀態的 API 做成有狀態的樣子。

隨著應用復雜化,狀態管理變得越來越重要。真正厲害的 Agent 拼的其實是狀態管理能力。

Prompt 的真正作用

一位分析過 Manus 和 OpenManus 項目結構的開發者指出,Prompt 確實很重要,它可以在不微調大模型的情況下,根據先驗知識引導大模型行為,達到期待的業務效果。

但關鍵是:Prompt 是 Agent 系統中大模型和其他各個組件的潤滑油,而不是全部。

以 OpenManus 為例,其結構主要包括:

  • Agent(智能體)
  • Flow(流程)
  • Tool(工具)
  • Prompt(提示詞)

Prompt 只是其中一個組件。

技術的進化邏輯

從技術發展的角度看,這場爭論其實反映了不同階段的認知差異:

初級階段:確實主要靠 Prompt 工程,通過精心設計的提示詞讓模型表現更好。

中級階段:開始引入工具調用、多輪對話、簡單的狀態管理。

高級階段:構建完整的事件驅動系統,包含復雜的狀態機、內存管理、自主規劃和執行能力。

企業級階段:需要考慮并發、容錯、監控、安全等工程化問題。

結論:既是也不是

回到最初的問題:大模型 Agent 是不是文字藝術?

答案是:既是也不是。

從某種意義上說,所有與 LLM 的交互最終都要通過文字(Prompt)來實現,這確實是一門語言藝術。設計好的 Prompt 需要對語言有深刻理解,需要巧妙的措辭和精確的邏輯。

但將 Agent 簡單等同于 Prompt 堆疊,就像說建筑就是磚塊堆疊一樣——技術上沒錯,但忽略了設計、結構、工程等更重要的層面。

真正的 Agent 系統需要:

  • 精心設計的 Prompt(文字藝術)
  • 復雜的狀態管理(系統工程)
  • 智能的任務規劃(算法設計)
  • 可靠的工具調用(接口工程)
  • 持續的自我優化(反饋機制)

寫在最后

這場爭論的價值不在于誰對誰錯,而在于推動我們更深入地思考 AI Agent 的本質。

對于初學者,從 Prompt 工程開始確實是一個好的起點,它能讓你快速理解如何與 AI 交互。

對于有經驗的開發者,則需要跳出 Prompt 的局限,從系統工程的角度思考如何構建真正可用的智能體。

技術的進步往往就是在這樣的爭論中螺旋上升的。無論你站在哪一邊,都要承認:我們正在見證一個激動人心的技術變革時代。


你覺得大模型 Agent 是文字藝術嗎?歡迎在評論區分享你的觀點。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/906657.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/906657.shtml
英文地址,請注明出處:http://en.pswp.cn/news/906657.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LeetCode 1340. 跳躍游戲 V(困難)

題目描述 給你一個整數數組 arr 和一個整數 d 。每一步你可以從下標 i 跳到&#xff1a; i x &#xff0c;其中 i x < arr.length 且 0 < x < d 。i - x &#xff0c;其中 i - x > 0 且 0 < x < d 。 除此以外&#xff0c;你從下標 i 跳到下標 j 需要滿…

三相電壓的優勢,應用場景,功率測量

三相系統概述 我國三相系統&#xff0c;由頻率相同&#xff0c;幅度類似的三個交流電壓組成&#xff0c;每個電壓相差120度。 三相系統的優勢 啟動電機&#xff1a;三個矢量間隔的電壓&#xff0c;在電機中產生旋轉磁場&#xff0c;不需要額外繞組就可以啟動電機。 減少線損…

[原創](計算機數學)(The Probability Lifesaver)(P14): 推導計算 In(1-u) 約等于 -u

[作者] 常用網名: 豬頭三 出生日期: 1981.XX.XX 企鵝交流: 643439947 個人網站: 80x86匯編小站 編程生涯: 2001年~至今[共24年] 職業生涯: 22年 開發語言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、 開發工具: Visual Studio、Delphi、XCode、…

Android12 Rom定制去掉剪貼板復制成功的Toast

Android12Rom定制去掉剪貼板復制成功的Toast提示 1.前言&#xff1a; 最近在rom定制化開發時&#xff0c;測試提了一個bug&#xff0c;在瀏覽器或者文本里面使用剪貼板復制成功后會有一個Toast提示&#xff0c;這種體驗不是很好&#xff0c;因為每次復制成功都有一個提示&…

SOC-ESP32S3部分:9-GPIO輸入按鍵狀態讀取

飛書文檔https://x509p6c8to.feishu.cn/wiki/L6IGwHKV6ikQ08kqwAwcAvhznBc 前面我們學習了GPIO的輸出&#xff0c;GPIO輸入部分其實也是一樣的&#xff0c;這里我們使用按鍵作為GPIO輸入例程講解&#xff0c;分三步走。 查看板卡原理圖&#xff0c;確定使用的是哪個GPIO查看G…

高可用集群keepalived

1.不同操作系統的安裝 1.1 不同系統編譯安裝 ubuntu環境 apt-get - y install libssl-dev libpopt-dev daemon build-essential libssl-dev openssl libpopt-dev libsnmp-dev libnl-3-dev libnl-genl-3-dev centos環境 &#xff08;其他的下同&#xff09; yum install - y…

SpringCloud - 整合MQ實現消息總線服務

一、背景介紹 每當修改配置文件內容&#xff0c;如果需要客戶端也同步更新&#xff0c;就需要手動調用/refresh接口&#xff0c;以便客戶端能獲取到最新的配置內容。 當客戶端越來越多的時候&#xff0c;通過人工進行處理顯然非常雞肋。有沒有一種更加高效的辦法&#xff0c;…

測試W5500的第3步_使用ioLibrary庫創建TCPServer

W5500是一款具有8個Socket的網絡芯片&#xff0c;支持TCP Server模式&#xff0c;最多可同時連接8個客戶端。本文介紹了基于STM32F10x和W5500的TCP Server實現&#xff0c;包括SPI初始化、W5500復位、網絡參數配置、Socket狀態管理等功能&#xff0c;適用于需要多客戶端連接的嵌…

Web攻防-SQL注入數據庫類型用戶權限架構分層符號干擾利用過程發現思路

知識點&#xff1a; 1、Web攻防-SQL注入-產生原理&應用因素 2、Web攻防-SQL注入-各類數據庫類型利用 演示案例-WEB攻防-SQL注入-數據庫類型&架構分層&符號干擾 一、數據庫知識 1、數據庫名&#xff0c;表名&#xff0c;列名&#xff0c;數據 2、自帶數據庫&…

手機合集(不定期更新)

一、華為手機&#xff1a; 1.華為手機自助維修的方法&#xff1a; https://blog.csdn.net/humors221/article/details/145946128 2.華為手機實用功能介紹&#xff1a; https://blog.csdn.net/humors221/article/details/132514011 3.華為手機清理大數據的方法&#xff1a;…

移動安全Android——ROOT檢測繞過

工具準備 Magisk GitHub - topjohnwu/Magisk: The Magic Mask for Android ZygisckNext GitHub - Dr-TSNG/ZygiskNext at v1.2.8 Shamiko Releases LSPosed/LSPosed.github.io 安卓ROOT教程 Magisk 安裝教程 - Magisk 中文網 問題 大多數手機在ROOT狀態下會出現APP閃…

Python高效網絡爬蟲開發指南

Python 網絡爬蟲入門與實戰 一、引言 隨著互聯網數據的爆炸性增長&#xff0c;獲取和分析這些數據變得越來越重要。網絡爬蟲作為數據采集的重要工具&#xff0c;在這其中扮演了不可或缺的角色。 二、環境搭建 首先我們需要安裝Python環境以及一些必要的庫&#xff1a; req…

wireshark: Display Filter Reference

https://www.wireshark.org/docs/dfref/// 這個里面的擴展功能還是很強大&#xff0c;可以幫著問題分析。支持大量的自定義化的字段讀取功能&#xff0c;支持很多的協議。 https://www.wireshark.org/docs/dfref///f/frame.html frame.time_delta Time delta from previous ca…

dify創建銀行客服系統例子

傳統的銀行客服系統&#xff0c;通常以會話管理的方式實現&#xff0c;配置繁瑣復雜&#xff0c;固定且不靈活。如&#xff1a; 智能體的出現&#xff0c;為實現銀行客服系統提供了想象空間&#xff0c;可以集知識庫和業務流程為一體實現靈活可控的智能客服系統&#xff0c;即能…

前端函數防抖(Debounce)完整講解 - 從原理、應用到完整實現

&#x1f337; 古之立大事者&#xff0c;不惟有超世之才&#xff0c;亦必有堅忍不拔之志 &#x1f390; 個人CSND主頁——Micro麥可樂的博客 &#x1f425;《Docker實操教程》專欄以最新的Centos版本為基礎進行Docker實操教程&#xff0c;入門到實戰 &#x1f33a;《RabbitMQ》…

服務接口鑒權與內部認證:自定義注解與AOP實現的企業級實踐

本文深入解析企業級系統中接口安全管控的核心需求&#xff0c;提出基于Spring AOP與自定義注解的輕量級鑒權方案。通過解構注解元數據定義、切面攔截邏輯、上下文傳遞機制等關鍵技術環節&#xff0c;系統闡述零侵入式鑒權體系的構建路徑。結合金融支付網關、多租戶SaaS平臺、物…

26考研|高等代數:線性變換

前言 線性變換這一章節是考頻較高的一部分&#xff0c;此部分涉及考點較多&#xff0c;涉及的考題也較多&#xff0c;學習線性變換時&#xff0c;應該注意搭建線性變換與矩陣之間的聯系&#xff0c;掌握如何利用矩陣表示一個線性變換結構&#xff0c;同時介紹了最簡單的線性變…

電磁兼容(EMC)仿真(精編版)

寫在前面 本系列文章主要講解電磁兼容(EMC)仿真的相關知識,希望能幫助更多的同學認識和了解電磁兼容(EMC)仿真。 若有相關問題,歡迎評論溝通,共同進步。(*^▽^*) 隨著產品復雜性和密集度的提高以及設計周期的不斷縮短,在設計周期的后期解決電磁兼容性(EMC)問題變得…

解決:dpkg: error: dpkg frontend lock is locked by another process

1、等待其他進程完成 如果后臺有其他包管理操作&#xff08;如自動更新、軟件安裝等&#xff09;&#xff0c;等待幾分鐘再重試。 可以通過以下命令查看是否有相關進程&#xff1a; ps aux | grep -E apt|apt-get|dpkg 2、強制終止占用鎖的進程 如果確認沒有其他包管理操作&…

LVGL(lv_textarea文本框控件)

文章目錄 一、lv_textarea 是什么&#xff1f;二、基本用法1. 創建 lv_textarea 對象2. 設置提示文字&#xff08;占位符&#xff09;3. 設置最大長度4. 設置密碼模式&#xff08;顯示為\*號&#xff09;5. 獲取和設置內容6. 配合虛擬鍵盤使用&#xff08;常用于觸摸屏&#xf…