AI Agent 入門指南:從 LLM 到智能體

AI. AI. AI. 最近耳朵里是不是總是被這些詞轟炸?特別是“Agent”、“AI Agent”、“智能體”、“Agentic”…… 感覺一夜之間,AI 就從我們熟悉的聊天框里蹦出來,要擁有“獨立思考”和“自主行動”的能力了?

說實話,一開始我也被這些詞搞得有點暈。很多解釋要么太技術化,各種框架、算法撲面而來;要么又太基礎,講了半天還是感覺沒抓住重點。

如果你跟我一樣,不是程序員,沒有深厚的技術背景,但平時一直在用 ChatGPT、文心一言、通義千問這些 AI 工具,也想搞明白 AI Agent 到底是什么,以及它將來可能會如何影響我們的生活和工作,那恭喜你,這篇文章就是為你寫的!

今天,我就用最簡單、最貼近生活的例子,帶你一起走完一個“1-2-3”的學習路徑:從你熟悉的 LLM(大型語言模型),到 AI 工作流(AI Workflow),再到最終的 AI Agent(AI 智能體)。相信我,那些聽起來嚇人的“RAG”、“ReAct”,拆開了看一點都不復雜!

咱們,這就開始!

第一層:你熟悉的“超級大腦”——大型語言模型(LLM)

咱們先從最熟悉的第一層說起。你平時用的那些強大的 AI 聊天機器人,比如 ChatGPT、Google Gemini、Claude、國內的文心一言、通義千問等等,它們的核心其實都是構建在大型語言模型(LLM)這個基礎上的應用。

你可以想象一下,LLM 就像一個擁有海量知識的“超級大腦”。我們人類(你)給它一個輸入(也就是 Prompt,你的問題或指令),它就根據它在訓練中學到的海量數據,給出一個輸出(它的回答或生成的內容)。

舉個最簡單的例子:我讓 ChatGPT 幫我寫一封約咖啡的郵件。我的 Prompt 就是輸入,它瞬間生成的那封比我本人寫得流暢、客氣一百倍的郵件,就是輸出。到這里是不是感覺很簡單?沒啥難的!

但是,問題來了。如果我問 ChatGPT:“我下周三跟 Elon Husky 約咖啡是幾點?”

你懂的,就算你沒試過,你也知道它肯定會懵圈,然后回復你一句“我不知道你的個人日程信息”。為什么?因為它沒法訪問我的個人日歷!

這就暴露了大型語言模型的兩個關鍵“軟肋”:

  1. 知識不全:?它們雖然學了很多互聯網上的公共數據,但對我們個人的私密信息、公司內部的數據,或者某些實時變化的信息(比如我的最新日歷、最新的天氣),是一無所知的。

  2. 太“被動”:?它們就像一個被動等指令的機器人。你問一句,它答一句。你給它個 Prompt,它給個 Output。它不會主動去外部世界獲取信息,也不會自己決定去做點什么。

記住 LLM 的這兩個特點,我們繼續往下走,看看怎么解決這些問題。

第二層:聽話的“流水線工人”——AI 工作流(AI Workflow)

既然 LLM 自己不知道我的日歷,那我們能不能給它“賦能”呢?這就是 AI 工作流要做的事情。

我們可以在 LLM 的外面,搭建一個“工作流程”。比如,我這個人類,可以預設一個邏輯:“以后只要我問關于個人日程的問題,我的指令先不要直接給 LLM,而是先觸發一個‘查日歷’的動作。查到日歷數據后,把數據連同我的問題一起,打包喂給 LLM,讓它根據這些信息回答。”

如果按照這個邏輯實現了,下次我再問“我下周三跟 Elon Husky 的咖啡約會是幾點?”,我的這個問題就會先觸發“查日歷”這個步驟。系統查到日歷信息(比如是下午 3 點),然后把“我下周三跟 Elon Husky 約會是下午 3 點”這個信息,連同我的問題,一起發給 LLM。LLM 收到信息后,就能準確地回答我了!

看起來很智能對不對?但新問題又來了。如果我緊接著問:“那天下雨嗎?”

這時候,我的這個“查日歷”工作流就又會“卡殼”了。為什么?因為它只能嚴格遵循我預設好的那個“路徑”:永遠是“查日歷”。我的日歷里可沒有天氣信息!

這就是 AI 工作流的一個根本特點:它只能嚴格、機械地遵循人類預設好的、固定不變的“路徑”或“步驟”去執行任務。?它就像一條“流水線”,每一步做什么都是我們人類提前設計好的。用技術話說,這個固定的路徑,就是它的“控制邏輯”,是人來編寫和控制的。

就算我把這個流程搞得更復雜:比如先查日歷,再通過天氣 API 查天氣,甚至再加一個文語轉換模型把最終答案讀出來。聽起來功能很強大了,對不對?但本質上,它依然只是一個 AI 工作流。?為什么?因為它每一步做什么,調用哪個工具,都是我這個人類提前設定好的。只要是由人類在做決策,決定一步一步怎么走,它就還不是 AI Agent。

順便提一個你可能聽過的高級詞:“RAG”(Retrieval Augmented Generation,檢索增強生成)。這個詞在 AI 圈子里被說得很多,聽起來很高大上。其實你簡單理解,它就是一種特殊的 AI 工作流!它的核心功能就是:在 AI 模型生成回答之前,先去外部世界(比如你的文檔庫、數據庫、互聯網)“檢索”相關的“增強”信息,然后把信息喂給模型,讓它基于這些信息生成更準確、更及時的回答。?所以,“檢索”+“生成”,就是 RAG 的本質,它是一種讓 LLM 突破自身知識限制的有效工作流。你看,是不是沒那么復雜了?

我之前用 Make.com 搭建過一個很典型的 AI 工作流,你聽聽是不是這個邏輯:

  1. 我把收集到的新聞文章鏈接放到一個 Google Sheets 表格里。

  2. 我的這個自動化工作流啟動后,先去讀取 Google Sheets 里的鏈接。

  3. 然后把鏈接發給 Perplexity,讓 Perplexity 幫我總結文章內容。

  4. 接著把 Perplexity 總結好的內容,發給 Claude(一個 LLM),并配合我預設好的一個 Prompt,讓 Claude 幫我寫成適合發 LinkedIn 和 Instagram 的社交媒體推文。

  5. 最后設置成每天早上 8 點自動運行一次。

你看,這就是一個標準的工作流:每一步都由我這個人類事先設定好了——先表格、再 Perplexity、然后 Claude、最后定時。人是這個流程的決策者和設計者,它只是按部就班地執行。

再加一個點:如果我對 Claude 生成的 LinkedIn 推文不滿意(比如我覺得它寫得不夠吸引人),我得手動去修改那個給 Claude 的 Prompt,然后重新運行一下這個工作流。這個“試錯-調整-再運行”的過程,現在還是由我這個人類在完成。記住這一點,因為待會兒講 Agent 的時候,它就不同了!

第三層:能“思考”和“行動”的自主個體——AI Agent

好,終于來到第三層,也是最近最讓人興奮的概念:AI Agent(AI 智能體)

核心區別是什么?還記得剛才的 AI 工作流嗎?是人類決定每一步怎么走。而 AI Agent 最關鍵的變化在于:把那個做決策的人類,換成了一個 LLM!

簡單來說,一個真正的 AI Agent,不再是一個只等你下指令、按固定流程跑的機器人。它更像是一個擁有某個“目標”后,能夠自己去思考、自己去行動,想方設法達成目標的“智能體”。

它的核心能力體現在兩個方面(這也是為什么很多 Agent 框架被稱為?ReAct?的原因,ReAct =?Reason +?Act):

  1. 它必須能“思考”(Reason):?當你給 Agent 一個目標(比如“幫我寫一篇基于最新新聞的社交媒體推文”)時,它不會傻等指示。它會自己動腦子,像人一樣“思考”:怎么做最有效率??我需要新聞內容,是自己去網上找然后復制粘貼嗎?好像太慢了。哦,我可以只收集新聞鏈接,然后調用一個工具自動抓取內容并總結!這個方案聽起來不錯!它會自己選擇最佳的路徑和方法。

  2. 它必須能“行動”(Act):?光想沒用,Agent 必須能把想法付諸實踐。它會自己去調用各種外部工具來完成任務。比如,它決定要收集鏈接并抓取內容,它會自己選擇并調用合適的工具(比如一個搜索引擎 API、一個網頁抓取工具、或者像 Make.com 那樣能連接各種服務的平臺)來執行這些操作。再比如,要寫推文,它會自己決定調用哪個 LLM,使用什么樣的 Prompt,并把之前獲取到的新聞總結作為輸入。

所以,當一個 AI 接收到一個任務/目標后,如果它能夠:

  • 自己“思考”?達成目標的步驟和方法(Reason)

  • 自己“行動”?去調用工具執行這些步驟(Act)

  • 自己“觀察”?行動的結果是否符合預期

  • 自己“決定”?是否需要調整計劃或重復步驟(Iterate)

  • 直到最終達成目標

那它就是一個 AI Agent!關鍵是:決策者從人類變成了 LLM 自己。

還記得剛才我在 AI 工作流里手動修改 Prompt 嗎?在 Agent 的世界里,它還能做得更多:

一個高級的 AI Agent,甚至擁有自主迭代(Iterate)和優化的能力。比如,它寫完第一版的 LinkedIn 推文后,可能會自己調用另一個 LLM 來“評價”這篇推文質量如何,是否符合要求。如果評價反饋說“不行,不夠吸引人”,Agent 會根據這個反饋,自己調整推文的內容或寫作策略,然后再讓評價 LLM 檢查,直到寫出它認為最佳的版本。整個“生成-評價-修改”的循環,Agent 自己就能完成,不需要我這個人類一直盯著、手動修改。

再舉個更具象的例子。AI 領域的牛人吳恩達(Andrew Ng)之前演示過一個 AI 視覺 Agent。你給它一個目標:“在視頻素材里找到所有出現‘滑雪的人’的片段”。

這個 Agent 在后臺做了什么呢?它首先會“思考”:一個“滑雪的人”大概長什么樣?(嗯,應該是一個人在雪地里,穿著滑雪板,可能速度很快?)然后它開始“行動”:它會自己去瀏覽視頻里的每一幀畫面,調用圖像識別或動作捕捉等工具,嘗試識別出符合它“思考”出來的特征的畫面。一旦找到了它認為是“滑雪的人”的畫面,它就會給對應的視頻片段打上標簽,并把這些片段提取出來呈現給你。

這個過程最厲害的地方在于:識別“滑雪的人”、判斷畫面、打標簽、提取片段,整個復雜的任務,是這個 Agent 自己根據目標,自主地進行“思考”和“行動”來完成的,而不是預先由人類把視頻都看一遍,手動給每一段打好各種標簽(比如‘滑雪者’、‘雪山’、‘雪地’等等),Agent 只是按照人類打好的標簽去檢索。?這種根據目標自主規劃和執行的能力,就是 Agent 和傳統工作流的根本區別。

總結一下:從 LLM 到 Agent 的進階之路

好了,咱們一起回顧一下今天走過的“1-2-3”路徑:

  1. 第一層 LLM:?你給輸入,它給輸出,很被動,知識有限。

  2. 第二層 AI 工作流:?你給輸入,并給它設定好固定的步驟(人類是決策者),它按照你的步驟去調用外部工具(比如查日歷、查天氣、查數據庫)獲取信息,再給 LLM 處理,最終給輸出。流程固定,需要人類來調整和優化。

  3. 第三層 AI Agent:?你給一個目標,LLM 自己會“思考”(Reason),決定要采取哪些“行動”(Act),自己去調用工具,自己觀察結果,甚至能自主“迭代”優化,最終達成目標(LLM 是決策者)。?它是一個更智能、更自主的“個體”。

AI Agent 正在讓 AI 從一個被動的工具,變成一個能理解你的意圖、自主規劃并執行任務的“智能助理”。雖然目前可能很多 Agent 還不完美,但毫無疑問,它們代表著 AI 應用的一個重要發展方向,也預示著未來我們的工作和生活方式可能會因此發生改變。

希望這篇文章能幫你揭開 AI Agent 的神秘面紗,讓你不再覺得這些詞高不可攀。理解了這些基礎概念,你就能更好地把握 AI 發展的脈搏啦!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/79628.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/79628.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/79628.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

開啟docker中mysql的binlog日志

1.登陸docker服務器,輸入docker ps查看服務: 2.進入mysql服務 進入到mysql的服務容器后,輸入mysql -u*** -p***登陸 mysql 客戶端查看是否開啟binlog 輸入 : show variables like log_bin; 3.輸入quit退出mysql客戶端 4.之后在docker的mysql服務容器里查詢mysql的配置文件所在…

Kotlin 中 List 和 MutableList 的區別

在 Kotlin 中,List 和 MutableList 是兩種不同的集合接口,核心區別在于可變性。 Kotlin 集合框架的重要設計原則:通過接口分離只讀(read - only)和可變(mutable)操作,以提高代碼的安…

【能力比對】K8S數據平臺VS數據平臺

🔥🔥 AllData大數據產品是可定義數據中臺,以數據平臺為底座,以數據中臺為橋梁,以機器學習平臺為中層框架,以大模型應用為上游產品,提供全鏈路數字化解決方案。 ?AllData數據中臺官方平臺&…

Fastjson 從多層級的JSON數據中獲取特定字段的值

使用 Fastjson 的 JSONPath.eval 可以通過 JSONPath 表達式直接定位多層級 JSON 中的目標字段,避免逐層調用 getJSONObject() 的繁瑣操作。以下是具體實現方法和示例: 核心思路 通過 JSONPath.eval 方法,傳入 JSON 對象(或 JSON…

端口安全基本配置

1.top圖 2.交換機配置 交換機swa <SWA> system-view [SWA] vlan batch 10 20[SWA] interface GigabitEthernet0/0/1 [SWA-GigabitEthernet0/0/1] port link-type trunk [SWA-GigabitEthernet0/0/1] port trunk allow-pass vlan 10[SWA] interface GigabitEthernet0/0/2 …

hadoop集群建立

建立Hadoop集群的步驟指南 建立Hadoop集群需要系統規劃和多個步驟的配置。以下是詳細的建立流程&#xff1a; 一、前期準備 硬件需求 多臺服務器(至少3臺&#xff0c;1主2從) 每臺建議配置&#xff1a;至少4核CPU&#xff0c;8GB內存&#xff0c;100GB硬盤 穩定的網絡連接(…

從零開始學java--集合類(2)

集合類 目錄 集合類 Queue 隊列的使用&#xff1a; 雙端隊列&#xff08;Deque&#xff09; Map和Set 概念&#xff1a; 模型&#xff1a; Map 常見方法說明&#xff1a; 注意&#xff1a; TreeMap和HashMap的區別&#xff1a; Set 常見方法說明&#xff1a; 注…

【HarmonyOS 5】鴻蒙發展歷程

【HarmonyOS 5】鴻蒙發展歷程 一、鴻蒙 HarmonyOS 版本年代記 鴻蒙 1.0&#xff1a; 2019 年 8 月 9 日&#xff0c;華為在開發者大會上正式發布鴻蒙 1.0 系統&#xff0c;這一版本首次應用于華為榮耀智慧屏產品中&#xff0c;標志著華為正式進軍操作系統領域。該版本初步展現…

SpringBoot教學管理平臺源碼設計開發

概述 基于SpringBoot框架開發的??教學管理平臺??完整項目&#xff0c;幫助開發者快速搭建在線教育平臺。該系統包含學生端、教師端和管理后臺&#xff0c;實現了課程管理、隨堂測試、作業提交等核心功能&#xff0c;是學習SpringBoot開發的優質案例。 主要內容 1. 系統架…

人工智能端側熱度再起

在科技浪潮洶涌澎湃的當下,人工智能端側正悄然掀起新一輪的熱度風暴。曾經,人工智能更多停留在概念層面,仿佛是遙不可及的未來幻想;而后,它逐漸落地,在特定領域嶄露頭角,卻也顯得有些曲高和寡。但如今,人工智能端側正以前所未有的態勢融入我們的生活,從智能手機的語音…

相同的數(簡單)

深度優先搜索 如果兩個二叉樹都為空&#xff0c;則兩個二叉樹相同。如果兩個二叉樹中有且只有一個為空&#xff0c;則兩個二叉樹一定不相同。 如果兩個二叉樹都不為空&#xff0c;那么首先判斷它們的根節點的值是否相同&#xff0c;若不相同則兩個二叉樹一定不同&#xff0c;…

網絡安全等級保護有關工作事項[2025]

公安部發布公網安〔2025〕1846號文件&#xff0c;關于對網絡安全等級保護有關共工作事項的進一步說明 一、備案相關問題 1、如何執行系統備案動態更新工作? 全面梳理與重新填報&#xff1a; 答復&#xff1a;運營者需**全面梳理已備案系統**的情況&#xff0c;對于已完成定…

c++類【發展】

類的靜態成員&#xff08;用static聲明的成員&#xff09;,在聲明之外用例單獨的語句進行初始化&#xff0c;初始化時&#xff0c;不再需要用static進行限定。在方法文件中初始化。以防重復。 特殊成員函數 復制構造函數&#xff1a; 當使用一個對象來初始化另一個對象…

寧德時代區塊鏈+數字孿生專利解析:去中心化身份認證重構產業安全底座

引言&#xff1a;當動力電池巨頭瞄準數字孿生安全 2025年5月6日&#xff0c;金融界披露寧德時代未來能源&#xff08;上海&#xff09;研究院與母公司寧德時代新能源科技股份有限公司聯合申請的一項關鍵專利——“身份驗證方法、系統、電子設備及存儲介質”。這項技術將區塊鏈…

cesium之自定義地圖與地圖疊加

在appvue中,cesium支持更換不同的地圖資源,代碼如下 <template><div id"cesiumContainer" ref"cesiumContainer"></div> </template><script setup> import * as Cesium from cesium; import "./Widgets/widgets.css&…

STL?string!!!

一、引言 在之前的文章中&#xff0c;我們一同學習了有關類和對象、模板、動態內存管理的相關知識&#xff0c;那么接下來一段時間我們將要趁熱打鐵&#xff0c;一起來手撕C庫中最重要的一個庫----STL中的一些容器&#xff0c;在手撕它們之前&#xff0c;我將先介紹一下對應的容…

低版本GUI配置SAProuter

1、注意配置SAProuter時&#xff0c;必須添加后面的/H/ 如&#xff1a;/H/sap.sapzx.cn/H/ 2、或者有時需要配置service文件&#xff08;C:\WINDOWS \system32\drivers\etc\service&#xff09; sapmsEP1 3600/tcp

springBoot中自定義一個validation注解,實現指定枚舉值校驗

緣由 在后臺寫接口的時候&#xff0c;經常會出現dto某個屬性是映射到一個枚舉的情況。有時候還會出現只能映射到枚舉類中部分枚舉值的情況。以前都是在service里面自行判斷&#xff0c;很多地方代碼冗余&#xff0c;所以就想著弄一個自定義的validation注解來實現。 例如下面某…

MySQL數據庫中篇

#作者&#xff1a;允砸兒 #日期&#xff1a;乙巳青蛇年 四月初九 筆者繼續帶朋友們了解mysql數據庫中篇的內容。多了不說&#xff0c;少了不嘮&#xff0c;咱們直接就開寫。 書接上回筆者在上篇中介紹了什么是數據庫和數據庫的一些基礎的概念&#xff0c;以及mysql數據庫的…

AI如何重塑DDoS防護行業?六大變革與未來展望

隨著AI技術的深度滲透&#xff0c;DDoS防護行業正經歷一場從“規則驅動”到“智能驅動”的范式革命。傳統依賴靜態閾值和人工規則的防御模式已難以應對新型攻擊&#xff0c;而AI的引入不僅提升了檢測精度&#xff0c;更重構了防護體系的底層邏輯。以下是AI帶來的六大核心變革及…