大模型應用開發第五講:成熟度模型:從ChatGPT(L2)到未來自主Agent(L4)

大模型應用開發第五講:成熟度模型:從ChatGPT(L2)到未來自主Agent(L4)

資料取自《大模型應用開發:動手做AI Agent 》。
查看總目錄:學習大綱

關于DeepSeek本地部署指南可以看下我之前寫的文章:DeepSeek R1本地與線上滿血版部署:超詳細手把手指南


Agent成熟度模型詳解:從「智能客服」到「科幻管家」

手機進化史類比AI Agent發展路徑,結合書中技術框架梳理階段特征


一、成熟度分級表(先看全局)

級別名稱能力類比典型特征案例參考
L1基礎對話模型功能機(只能打電話)單輪問答,無上下文記憶早期客服機器人
L2ChatGPT級(初級Agent)智能手機(裝App擴展能力)簡單規劃+調用單個工具GPT-4聯網版
L3專業領域Agent智能手表(健康監測)多步驟決策+領域工具鏈協作醫療診斷Agent
L4自主Agent科幻管家(賈維斯)跨系統協作+動態學習+自我優化電影《鋼鐵俠》AI

二、逐級拆解(含技術原理與案例)

? L2級:會查資料的「實習生」

核心特征

  • 有限規劃:拆解簡單任務(如“查天氣→推薦穿搭”)[2][5]
  • 單一工具:每次調用1個接口(如地圖API)[5]
  • 線性執行:出錯需人工修正(訂單失敗就卡住)[6]

生活案例:旅行清單助手

用戶說:“下周末去杭州要帶什么?”
1?? 查杭州天氣(調用天氣API → 顯示有雨)[5]
2?? 生成清單:雨傘、薄外套 → 結束任務[6]

用戶提問
調用天氣API
是否下雨?
建議帶傘
建議防曬用品

▲ 線性決策流程(第5章Function Calling示例)


? L3級:行業專家級的「部門主管」

技術突破

  • 多級規劃:任務樹分解(如看病→掛號→檢查→開藥)[1][6]
  • 工具鏈協作:連續調用多個系統(醫保計算+藥房庫存查詢)[6]
  • 異常處理:預算超支自動切換方案(如改用平價替代藥)[6]

醫療Agent實戰流程
1?? 患者輸入癥狀 → 拆解為[掛號科室→檢查項目→取藥] [1]
2?? 調用醫院HIS系統查號源 → 推薦最近三甲醫院 [5][6]
3?? 檢查報告解讀 → 自動對比歷史病例庫 [5]
4?? 開藥時檢測醫保余額 → 不足時觸發短信提醒 [6]

癥狀描述
分解就診步驟
工具1:掛號系統
工具2:檢查項庫
工具3:醫保計算器
生成就診方案
患者確認?
執行預約
重新規劃

▲ 多工具協作流程(第6章ReAct框架)


? L4級:全能型的「CEO助理」

質變特征(相比L3):

  • 動態學習:從用戶反饋優化策略(如記住用戶常選航空公司)[4]
  • 跨系統協同:同時調度物流+支付+供應鏈系統 [6]
  • 自主糾錯:航班取消時自動改簽+重訂酒店+通知客戶 [4][6]

案例:情人節鮮花危機救援
1?? 感知異常:物流系統報警 → 50%庫存損毀[6]
2?? 動態規劃
? 查找備用供應商(調用3個鮮花平臺API)
? 比價后鎖定本地批發市場現貨 [6]
3?? 多線程執行
? 向批發商付款 → 調用企業支付接口
? 同步更新客戶訂單 → 發送延遲補償券 [6]
4?? 經驗沉淀:將本次方案存入危機應對知識庫 [2][4]

庫存告警
自主啟動應急預案
并行調用工具
供應商檢索API
比價算法
物流調度系統
成本<預算?
全自動采購
發起人工審批

▲ L4自主決策流程(第6章Plan-and-Execute案例)


三、關鍵技術支撐(書中核心章節索引)

L2→L3躍遷關鍵

  • 任務分解技術:思維鏈(Chain of Thought) → 《大模型應用開發:動手做AI Agent 》第2章2.2節[1]
  • 工具調度能力:外部規劃器(PDDL語言轉換) → 《大模型應用開發:動手做AI Agent 》第2章2.2節[1]
  • 驗證反饋機制:ReAct框架的思考-行動循環 → 《大模型應用開發:動手做AI Agent 》第6章[6]

L3→L4躍遷關鍵

  • 長期記憶系統:向量數據庫存儲歷史經驗 → 《大模型應用開發:動手做AI Agent 》第2章2.3節[5]
  • 動態學習架構: Reflexion框架的自我反思 → 《大模型應用開發:動手做AI Agent 》第2章2.2節[1]
  • 多Agent協同: 邊緣計算節點分工協作 → 《大模型應用開發:動手做AI Agent 》附錄A[4]

四、未來展望:L5級「數字生命」會遠嗎?

書中線索(《大模型應用開發:動手做AI Agent 》附錄A方向):

  • 具身智能: Agent控制實體機器人維修設備 [4]
  • 人機共生: AI實時學習用戶習慣 → 下班前自動調節家中空調[4]
  • 社會協作: 物流Agent與交通Agent協商最優配送路線 [4]

科幻照進現實的時間表

2024-01-01 2025-01-01 2026-01-01 2027-01-01 2028-01-01 2029-01-01 2030-01-01 L3醫療Agent L4供應鏈Agent L5具身Agent 城市級Agent網絡 當前階段 未來5年 Agent進化路線預測

關鍵引用

  • 多模態Agent方向 → 《大模型應用開發:動手做AI Agent 》附錄A.3節[4]
  • 邊緣系統部署技術 → 《大模型應用開發:動手做AI Agent 》附錄A.2節[4]
  • 自主進化架構 → 《大模型應用開發:動手做AI Agent 》第6章ReAct擴展案例[6]

目錄:總目錄
上篇文章:大模型應用開發第四講:兩大方向:增加上下文信息(知識) vs 提升行動力(微調或Agent技術)
下篇文章:大模型應用開發第六講:目標:從被動響應到主動決策與執行


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84994.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84994.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84994.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Delphi 導入excel

Delphi導入Excel的常見方法可分為兩種主流方案&#xff1a;基于OLE自動化操作Excel原生接口和利用第三方組件庫。以下為具體實現流程及注意事項&#xff1a; ?一、OLE自動化方案&#xff08;推薦基礎場景&#xff09;? 該方法通過COM接口調用本地安裝的Excel程序&#xff0c…

Selenium的第四天打卡——Selenium瀏覽器應用(完整版)

Selenium瀏覽器應用 目錄 Selenium瀏覽器應用 一、瀏覽器操作示例代碼 1.設置瀏覽器縮放大小 2.瀏覽器前進和后退 3.瀏覽器刷新 二、WebDriver常見方法 三、鼠標事件示例 四、鍵盤事件示例 五、獲取斷言信息 六、窗口的切換 七、關鍵注意事項 一、瀏覽器操作示例代…

PMO價值重構:從項目管理“交付機器”到“戰略推手”

在數字化轉型浪潮中&#xff0c;項目管理辦公室&#xff08;PMO&#xff09;正經歷著前所未有的角色蛻變。傳統上&#xff0c;PMO往往被視為項目管理的“交付機器”&#xff0c;專注于項目的按時交付和資源分配。然而&#xff0c;隨著企業對戰略執行的重視&#xff0c;PMO正逐漸…

本地依賴庫的版本和庫依賴的版本不一致如何解決?

我用的 yarn v4 版本&#xff0c;所以以下教程命令都基于yarn 這里假設我報錯的庫名字叫 XXXXXXXX&#xff0c;依賴他的庫叫 AAAAAAAA 排查解決思路分析&#xff1a; 首先查看一下 XXXXXXXX 的依賴關系&#xff0c;執行 yarn why XXXXXXXX 首先我們要知道 yarn 自動做了庫…

SQLiteStudio - 免費開源、輕量高效,跨平臺的 SQLite 數據庫管理工具,代替 Navicat for SQLite

管理 SQLite 數據庫就用這款軟件&#xff0c;真的早該摒棄破解和盜版的 Navicat 了。 SQLiteStudio 是一款專注于管理 SQLite 數據庫 的桌面軟件&#xff0c;用于瀏覽和編輯 SQLite 數據庫文件。軟件的作者是來自波蘭的開發者 Pawe? Salawa&#xff0c;他是一位擁有 20 年 Ja…

DeepSeek R1-0528 新開源推理模型(免費且快速)

DeepSeek推出了新模型,但這不是R2! R1-0528是DeepSeek的最新模型,在發布僅數小時后就在開源社區獲得了巨大關注。 這個悄然發布的模型DeepSeek R1-0528,已經開始與OpenAI的o3一較高下。 讓我來詳細介紹這次更新的新內容。 DeepSeek R1-0528 發布 DeepSeek在這次發布中采…

Opera Neon發布該公司首款“AI代理”瀏覽器

Opera 的瀏覽器產品組合今日迎來了新成員。Opera Neon 是該公司首款“AI 代理”瀏覽器&#xff0c;旨在“重新思考瀏覽器在代理網絡中的角色”。開發人員聲稱&#xff0c;Neon 能夠理解用戶的意圖&#xff0c;并利用 AI 驅動的功能將其轉化為行動。 Opera Neon 由三個主要部分…

網絡安全之Web滲透加解密

項目基本使用 準備環境&#xff1a;node.js python chrome npm install chrome-remote-interface pip install playwright playwright install chromium pip install mitmproxy ............... 第一步啟動cdp.js。 第二步使用python .\cdp_load.py vue_demo&#xff0c;連…

【VSCode-Qt】Docker遠程連接的項目UI文件在 VSCode 上無法預覽

Docker遠程連接的UI文件在 VSCode 上無法預覽&#xff0c;通常是因為 VSCode 通過遠程開發擴展&#xff08;Remote - SSH/Docker&#xff09;連接到 Docker 容器時&#xff0c;某些圖形化功能未正確配置或支持。以下是可能原因和解決方案&#xff1a; 原因分析 X11 轉發未配置…

【HW系列】—web組件漏洞(Strtus2和Apache Log4j2)

本文僅用于技術研究&#xff0c;禁止用于非法用途。 文章目錄 Struts2Struts2 框架介紹Struts2 歷史漏洞匯總&#xff08;表格&#xff09;Struts2-045 漏洞詳解 Log4j2Log4j2 框架介紹Log4j2 漏洞原理1. JNDI 注入2. 利用過程 Log4j2 歷史漏洞JNDILDAP 反彈 Shell 流程 Strut…

《深度關系-從建立關系到彼此信任》

陳海賢老師推薦的書&#xff0c;花了幾個小時&#xff0c;感覺現在的人與人之間特別缺乏這種深度的關系&#xff0c;但是與一個人建立深度的關系并沒有那么簡單&#xff0c;反正至今為止&#xff0c;自己好像沒有與任何一個人建立了這種深度的關系&#xff0c;那種雙方高度同頻…

sass基礎語法

Sass&#xff08;Syntactically Awesome Style Sheets&#xff09;是一種 CSS 預處理器&#xff0c;提供了比原生 CSS 更強大、更靈活的語法功能。它有兩種語法格式&#xff1a; Sass&#xff08;縮進語法&#xff0c;.sass 文件&#xff09;SCSS&#xff08;CSS-like 語法&am…

【JavaWeb】基本概念、web服務器、Tomcat、HTTP協議

目錄 1. 基本概念1.1 基本概念1.2 web應用程序1.3 靜態web1.4 動態web 2. web服務器3. tomcat詳解3.1 安裝3.2 啟動3.3 配置3.3.1 配置啟動的端口號3.3.2 配置主機的名稱3.3.3 其他常用配置項日志配置數據源配置安全配置 3.4 發布一個網站 4. Http協議4.1 什么是http4.2 http的…

AI in Game,大模型能力與實時音視頻技術融合,交出AI應用新答卷

隨著AI的技術進步和工具普及&#xff0c;尤其是在這兩年的躍進之后&#xff0c;AI在游戲行業內的應用已經逐步由理念設想推向落地實踐。從蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大廠家呈現的游戲AI新亮點&#xff0c;我們看到了更多AI與游戲的結合方式&#x…

Android Studio 2022.2.1.20 漢化教程

查看Android Studio 版本 Android Studio Flamingo | 2022.2.1 Patch 2 下載&#xff1a;https://plugins.jetbrains.com/plugin/13710-chinese-simplified-language-pack----/versions/stable

常見的分詞算法

常見的分詞方法分類如下&#xff1a; 類型名稱說明優缺點1?? 基于空格/標點Word-level以空格或標點劃分&#xff0c;如 "Hello, world!" → ["Hello", ",", "world", "!"]?簡單&#xff0c;?無法處理新詞&#xff0c;詞…

湖北理元理律師事務所觀察:債務優化如何成為民生安全網

據央行2023年報告&#xff0c;中國家庭債務收入比達137.8%。面對債務高壓&#xff0c;湖北理元理律師事務所的實踐揭示&#xff1a;專業債務規劃的價值不僅是減負數字&#xff0c;更是構建社會穩定的微觀防線。 一、從“催收恐懼”到“主動管理”的轉變 該所服務數據顯示&…

服務器密碼安全運維解決新思路:憑據管理SMS+雙因素SLA認證結合的方案

引言&#xff1a;云服務器安全成本困局 在云計算滲透率突破60%的今天&#xff0c;中小企業正面臨嚴峻的安全悖論&#xff1a;某權威機構數據顯示&#xff0c;72%的云上數據泄露事件源于憑據管理不當&#xff0c;而傳統安全解決方案的采購成本往往超過中小企業年利潤的8%。這種…

Vision Transformer網絡結構

0.前言 參考CSDN大佬(太陽花的小綠豆)的代碼&#xff0c;梳理了一下vit的網絡結構&#xff0c;代碼地址如下&#xff1a; deep-learning-for-image-processing/pytorch_classification/vision_transformer at master WZMIAOMIAO/deep-learning-for-image-processing GitHub …

C++ 圖像處理庫 CxImage 簡介 (遷移至OpenCV)

文章目錄 核心功能特點局限性與替代方案常用方法構造函數從數組創建圖像訪問屬性訪問像素點Windows平臺支持 常用方法遷移至OpenCV CxImage 是一款功能強大的圖像處理類庫&#xff0c;主要用于 Windows 平臺的圖像處理任務。它支持多種圖像格式的加載、保存、編輯及特效處理&am…