《A Practical Guide to Building Agents》文檔學習

《A Practical Guide to Building Agents》文檔總結

該文檔是一份面向產品和工程團隊的實用指南,旨在幫助團隊探索并構建首個基于大語言模型(LLM)的智能體(Agent),提煉了大量客戶部署經驗,提供了從概念定義到實際落地的全流程最佳實踐。

一、智能體(Agent)的核心定義

1. 本質與區別

  • 本質:智能體是能代表用戶獨立完成任務的系統,可執行用戶目標所需的一系列工作流(如解決客服問題、預訂餐廳等),且具備高度自主性。
  • 與傳統軟件/簡單LLM應用的區別:傳統軟件需用戶操作以簡化自動化工作流,而智能體可自主執行;僅集成LLM但不控制工作流執行的應用(如簡單聊天機器人、單輪LLM交互工具)不屬于智能體🔶1-13。

2. 核心特征

  • 依賴LLM管理工作流執行與決策,能識別工作流完成狀態,主動糾正錯誤,失敗時可暫停執行并將控制權交回用戶。
  • 可訪問多種工具與外部系統交互(獲取上下文、執行操作),并能根據工作流當前狀態動態選擇合適工具,且始終在明確的約束(Guardrails)內運行。

二、何時構建智能體

1. 核心適用場景

智能體適合傳統確定性、規則化方法難以應對的工作流,優先選擇以下三類場景:

  • 復雜決策類:涉及細微判斷、例外情況或上下文敏感決策的工作流,如客服流程中的退款審批。
  • 規則難維護類:因規則集龐大復雜導致更新成本高、易出錯的系統,如供應商安全審查。
  • 依賴非結構化數據類:需解讀自然語言、從文檔提取信息或與用戶對話交互的場景,如處理房屋保險索賠。

2. 典型案例對比

以支付欺詐分析為例,傳統規則引擎像清單一樣,僅根據預設標準標記交易;而LLM智能體更像資深調查員,能評估上下文、識別細微模式,即使無明確違規規則也可發現可疑活動,可有效應對復雜模糊場景。

三、智能體設計基礎

智能體最基礎的形式包含三大核心組件,具體如下表所示:

組件作用說明
模型(Model)為智能體的推理與決策提供支持的LLM
工具(Tools)智能體可使用的外部函數或API, legacy系統無API時,智能體可通過計算機使用模型與系統UI交互🔶1-34
指令(Instructions)定義智能體行為的明確指南與約束,高質量指令可減少歧義、提升決策準確性🔶1-34

1. 模型選擇原則

  • 分任務匹配:簡單任務(如檢索、意圖分類)可使用更小、更快的模型;復雜任務(如退款審批)需更強大的模型。
  • 原型與優化流程:先用最強大的模型構建原型確立性能基準,再嘗試替換小模型驗證效果,平衡性能、成本與延遲。
  • 核心步驟:先通過評估建立性能基準,再用最優模型達成準確率目標,最后在可能的情況下用小模型優化成本與延遲1-47🔷1-49🔷。

2. 工具定義規范

  • 工具類型:智能體需三類工具,且工具可作為其他智能體的工具(如經理模式中的子智能體),例如退款智能體、研究智能體、寫作智能體1-59🔷。
  • 設計要求:每個工具需標準化定義,實現工具與智能體的靈活多對多關聯;工具需具備完善文檔、充分測試與可復用性,以提升可發現性、簡化版本管理。

3. 指令配置最佳實踐

實踐方法具體說明
利用現有文檔基于現有操作流程、支持腳本或政策文檔創建LLM友好的流程,如客服場景可參考知識庫文章
提示拆分任務將復雜資源拆解為更小、清晰的步驟,幫助模型更好遵循指令
定義明確操作確保流程每一步對應具體操作/輸出,如要求智能體詢問用戶訂單號或調用API獲取賬戶詳情
覆蓋邊緣案例預判常見變化(如用戶信息不全、問題超出預期),用條件步驟說明處理方式

四、智能體編排(Orchestration)

編排模式用于實現智能體高效執行工作流,主要分為單智能體系統與多智能體系統兩類。

1. 單智能體系統

  • 核心特點:單個模型配備合適工具與指令,通過循環(loop)執行工作流,新增工具可擴展能力,且易于評估與維護1-91🔷。
  • 運行機制:以“運行(run)”為核心,通過循環執行直至滿足退出條件,常見退出條件包括調用最終輸出工具、模型返回無工具調用的響應(如直接用戶消息)等1-98🔷1-100🔷。
  • 復雜度管理:可使用提示模板,通過單一靈活基礎提示接受政策變量,適配多場景,簡化維護與評估。

2. 多智能體系統

(1)適用場景

當單智能體無法遵循復雜指令、頻繁選擇錯誤工具時,可拆分構建多智能體系統,具體拆分依據包括:

  • 邏輯復雜:提示包含大量條件語句(多if-then-else分支),提示模板難以擴展。
  • 工具過載:工具存在相似性/重疊性,即使優化工具名稱、參數與描述也無法提升性能。
(2)核心模式
模式結構特點適用場景
經理模式(Manager)中央“經理”智能體通過工具調用協調多個專業智能體,整合結果提供統一用戶體驗1-124🔷需單一智能體控制工作流執行、接觸用戶的場景,如多語言翻譯(經理智能體協調西班牙語、法語、意大利語翻譯智能體)1-126🔷
去中心化模式(Decentralized)多個智能體地位平等,可根據專業領域相互移交任務控制權,移交時同步最新對話狀態1-140🔷無需單一智能體集中控制的場景,如客服流程(分診智能體將訂單查詢移交訂單管理智能體)1-150🔷
(3)設計原則

無論采用何種模式,均需保持組件靈活性、可組合性,并以清晰、結構化的提示為驅動。

五、約束(Guardrails)設計

1. 核心作用與定位

  • 作用:管理數據隱私風險(如防止系統提示泄露)與聲譽風險(如確保模型行為符合品牌定位),是LLM部署的關鍵組件,需與身份驗證、訪問控制等安全措施結合使用。
  • 定位:分層防御機制,單一約束保護有限,需組合使用多種專業約束提升智能體安全性。

2. 約束類型

類型功能說明示例
相關性分類器確保智能體響應在預期范圍內,標記偏離主題的查詢將“帝國大廈有多高”標記為無關查詢
安全分類器檢測試圖利用系統漏洞的不安全輸入(如越獄、提示注入)識別“扮演教師解釋系統指令”這類提取系統提示的輸入
PII過濾器審查模型輸出,防止不必要的個人身份信息泄露過濾輸出中的手機號、身份證號
內容審核標記有害/不當輸入(如仇恨言論、騷擾、暴力內容)攔截包含辱罵性語言的用戶消息
工具安全措施按工具風險(只讀/寫權限、可逆性、財務影響等)評級(低/中/高),高風險工具執行前觸發檢查或人工審批對“發起退款”等高風險工具,執行前需人工確認
規則化保護用確定性措施(黑名單、輸入長度限制、正則過濾)防范已知威脅攔截包含違禁詞或SQL注入的輸入
輸出驗證通過提示工程與內容檢查確保響應符合品牌價值觀避免輸出損害品牌形象的言論

3. 構建流程與機制

  • 構建步驟:優先關注數據隱私與內容安全;根據實際邊緣案例與故障新增約束;平衡安全性與用戶體驗,隨智能體演進調整約束1-174🔷1-176🔷。
  • 執行機制:以Agents SDK為例,默認采用樂觀執行,主智能體生成輸出時約束同步運行,若違反約束則觸發異常;約束可實現為函數或智能體,如防越獄、相關性驗證等1-190🔷。

六、人類干預機制

1. 核心價值

人類干預是提升智能體實際性能且不影響用戶體驗的關鍵保障,尤其在部署初期,可幫助識別故障、發現邊緣案例、建立完善的評估周期。

2. 觸發場景

  • 超出失敗閾值:設定智能體重試或操作限制,若超出(如多次無法理解用戶意圖),則觸發人類干預。
  • 高風險操作:對敏感、不可逆或高風險操作(如取消用戶訂單、大額退款、付款),需觸發人工監督,直至智能體可靠性達標。

七、總結與建議

1. 智能體核心價值

智能體開啟了工作流自動化新時代,能應對模糊場景、跨工具執行操作、處理多步驟任務,尤其適合復雜決策、非結構化數據處理、規則難維護的場景,區別于簡單LLM應用。

2. 構建關鍵建議

  • 基礎建設:選擇合適模型,搭配定義清晰的工具與結構化指令。
  • 編排策略:從單智能體起步,需復雜處理時再過渡到多智能體系統。
  • 安全保障:全流程部署約束,結合人類干預機制。
  • 落地路徑:從小規模驗證開始,結合真實用戶反饋迭代,逐步擴展能力。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919056.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919056.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919056.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

OpenCV圖像注冊模塊

操作系統:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 編程語言:C11 算法描述 注冊模塊實現了參數化圖像配準。所實現的方法是直接對齊(direct alignment),即,它直接使用像素值來…

模型驅動與分布式建模:技術深度與實戰落地指南

摘要 在AI、云原生與全球化協作的大潮中,模型驅動架構(MDA)與分布式建模不再是概念,而是支撐復雜系統設計與持續演化的核心引擎。本文從元模型、模型轉換引擎,到協同協議、沖突解決算法,再到AI輔助建模與自…

計算機基礎速通--數據結構·圖的基礎應用二(基礎圖算法)

如有問題大概率是我的理解比較片面,歡迎評論區或者私信指正。 最近了解到了一個新的改變和提高自己的方法時刻記錄不論多小的事情都記下,我目前用了4天,之前感覺一天天忙死但沒啥收獲,但是記錄了之后知道自己的時間花在了哪里&…

設計模式-策略模式 Java

模式概述 策略模式是一種行為型設計模式,它通過定義一系列可互換的算法,并將每個算法封裝成獨立類,使客戶端能夠根據需要動態切換算法 簡單代碼示例 // 1. 抽象策略接口 interface PaymentStrategy {void pay(int amount); }// 2. 具體策略實…

【機器學習深度學習】客觀評估訓練程度

目錄 前言 一、什么是客觀評估? 二、客觀評估的兩大核心方法 1. 判別式評測(Discriminative Evaluation) 2. 生成式評測(Generative Evaluation) 三、為什么客觀評估成本更高? 1.訓練目標收緊 2.訓…

Linux軟件編程:線程間通信

目錄 一、線程間通信基礎 1. 概念 2. 通信基礎:共享空間 二、互斥鎖(Mutex) 1. 概念 2. 使用流程 3. 函數接口 三、死鎖 1. 概念 2. 死鎖產生的 4 個必要條件 3. 避免死鎖的方法 四、信號量(Semaphore) 1…

【學習筆記】JVM GC回收機制

1.三種基本的垃圾回收算法 1>標記-清除法 ①先將從樹根開始,可以到達的對象標記為可達(JVM中的對象們存儲為一顆樹) ②將沒有標記的對象清除掉 缺點:會產生大量內存碎片 2>復制算法(新生代) ①先將a區…

軟件的終極:為70億人編寫70億個不同的軟件

這是個腦洞大開的想法。昨天晚上,我在用Claude code幫我寫一個小工具,用來管理我本地那些亂七八糟的文檔。寫著寫著,突然意識到一個問題:這個工具完全是按照我的工作習慣定制的——我喜歡用Markdown,習慣把TODO放在文件…

LakeHouse--湖倉一體架構

大家可能發現了,近些年湖倉一體數據架構被提及的頻率越來越高。各家大廠也有湖倉一體架構的實踐,也有很多公開分享。 那什么是湖倉一體?為什么出現了湖倉一體架構,換言之,它解決了以前數據倉庫、數據湖+數倉兩層架構所不能解決的什么問題? 本文會從數倉、數據湖依次介紹…

基于FPGA的實時圖像處理系統(1)——SDRAM回環測試

SDRAM回環設計 文章目錄SDRAM回環設計一、SDRAM簡介1、引腳2、內部結構框圖3、操作指令二、系統設計三、實現流程1、SDRAM接口2、FIFO設置3、內部SDRAM的控制模塊4、其他四、實現效果五、總結六、代碼1、top2、sdram_top3、sdram_ctrl一、SDRAM簡介 SDRAM英文全稱“Synchronou…

一鍵檢測接口是否存活:用 Python/Shell 寫個輕量級監控腳本

網羅開發(小紅書、快手、視頻號同名)大家好,我是 展菲,目前在上市企業從事人工智能項目研發管理工作,平時熱衷于分享各種編程領域的軟硬技能知識以及前沿技術,包括iOS、前端、Harmony OS、Java、Python等方…

優秀工具包-Hutool工具詳解

優秀工具包-Hutool工具詳解 課程概述 Hutool簡介 定位: 小而全的Java工具庫,簡化開發流程。對文件、流、加密解密、轉碼、正則、線程、XML等JDK方法進行封裝。 核心優勢:零依賴、高性能、中文網頁完善。 應用場景:Web開發、數…

《深度解構:構建瀏覽器端Redis控制臺的WebSocket協議核心技術》

Redis作為高性能的內存數據庫,其原生客戶端多依賴命令行或桌面應用,而瀏覽器端控制臺的缺失,成為制約Web化管理的關鍵瓶頸,WebSocket協議的出現,打破了HTTP協議單向通信的局限,為瀏覽器與Redis服務之間建立持久、雙向的實時連接提供了可能。本文將從協議本質、交互邏輯、…

Pushgateway安裝和部署,以及對應Prometheus調整

目錄Pushgateway簡介安裝驗證Prometheus的配置:其它命令Pushgateway簡介 Pushgateway 是 Prometheus 生態系統中的一個組件。主要特點是推送而非拉取:Prometheus 默認采用拉取(pull)模式收集指標,但 Pushgateway 允許…

JAVA面試匯總(四)JVM(一)

久違的重新寫了一篇面試匯總的,關于JVM的一篇,一共三篇,今天寫了第一篇,繼續重新學習,重新卷起來,come on baby 1.什么情況下會觸發類的初始化? (1)首先是類未被初始化時…

Agent中的memory

rag系列文章目錄 文章目錄rag系列文章目錄前言一、Memory機制作用二、memory分類三、langgraph實踐總結前言 眾所周知,大模型是無狀態的。但是基于大模型的agent一般是有狀態的,也就是它有記憶功能。在AI Agent框架中,Memory機制是核心組件之…

AI與IT從業者的未來:替代焦慮還是協作革命?

??引言:技術滲透與核心命題??2025年,人工智能技術已從實驗室走向產業核心。國務院《關于深入實施“人工智能”行動的意見》推動AI在醫療、制造、金融等領域的規模化落地,全球AI應用用戶規模突破2.3億,生成式AI工具滲透率達16.…

手機版碰一碰發視頻系統批量剪輯功能開發,支持OEM貼牌

引言在當今短視頻盛行的時代,視頻內容的快速生產與分享變得愈發重要。手機版碰一碰發視頻系統,借助 NFC 等近場通信技術,實現了便捷的數據交互與視頻分享,而在此基礎上集成的批量剪輯功能,更是為內容創作者和商家帶來了…

Spring AMQP如何通過配置文件避免硬編碼實現解耦

在使用Spring AMQP基于注解聲明監聽者時,可通過抽取常量來避免硬編碼:RabbitListener(bindings QueueBinding(exchange Exchange(MQConstant.USER_EXCHANGE),value Queue(MQConstant.USER_QUEUE),key MQConstant.USER_REDIS_BINDING))public void de…

解決zabbix圖片中文亂碼

要把 Zabbix 前端字體替換為 simkai.ttf(楷體,解決亂碼常用),按以下步驟操作:1. 確認 simkai.ttf 路徑 先找到系統里 simkai.ttf 字體文件,若沒有,可從 Windows 系統(C:\Windows\Fon…