導讀
隨著推理大模型的出現(deepseek,Qwen3等),進一步地推進了大模型的智能體系統發展。然而,如何使智能體更好的調用外部工具,智能體與智能體之間如何有機地協作,仍然沒有一個完美的答案。這篇工作總結了各種智能體互操作協議(MCP/ACP/A2A/ANP等),推薦閱讀學習。
??【深藍AI】編譯
論文題目:A SURVEY OF AGENT INTEROPERABILITY PROTOCOLS: MODEL CONTEXT PROTOCOL (MCP), AGENT COMMUNICATION PROTOCOL (ACP), AGENT-TO-AGENT PROTOCOL (A2A), AND AGENT NETWORK PROTOCOL (ANP)
論文作者:Abul Ehtesham,?Aditi Singh,?Gaurav Kumar Gupta,?Saket Kumar
論文地址:https://arxiv.org/pdf/2505.02279
大語言模型(LLMs)已成為現代人工智能的核心技術,驅動著可在云端、邊緣端及本地終端環境中運行的自主代理。這類代理能夠攝取上下文信息、執行任務,并與外部服務或工具進行交互。然而,當前不一致且碎片化的互操作性實踐,導致LLM驅動型代理間的通信集成、安全保障及規模化擴展面臨顯著挑戰。
互操作性(即不同代理與系統間實現能力發現、上下文交換及行動無縫協調的能力)是構建模塊化、可復用且具備韌性的多代理[5]工作流的關鍵要素。標準化協議能夠降低開發成本、增強安全性,并支持跨平臺協作。然而當前清晰且被廣泛采納的通用標準仍處于萌芽階段。該研究聚焦于四種新興的代理通信協議,分別針對不同的互操作層級:
? ??模型上下文協議(MCP) ?:一種基于JSON-RPC的客戶端-服務器接口,支持安全上下文攝取與結構化工具調用。
? ??代理間協議(A2A) ?:通過HTTP協議和服務器發送事件(SSE),利用能力導向的代理卡片實現點對點框架,服務于企業級任務編排[9]。
? ??代理通信協議(ACP)??:基于REST原生范式的聲明式消息層,整合多部分消息、異步流式傳輸及可觀測性功能,專為本地多代理系統設計[10]。
? ??代理網絡協議(ANP)??:基于去中心化標識符(DIDs)和JSON-LD圖結構構建的開放式互聯網代理市場協議,支持去中心化發現與協作[11,12]
該研究從架構細節、集成方法、通信模式及安全考量四個維度對各協議進行系統性分析。通過橫向對比,重點揭示了交互模式、發現機制、通信模型與安全框架之間的取舍關系。研究進一步提出分階段實施路線圖——按照MCP、A2A、ACP到ANP的順序推進部署,為現實場景下智能體生態系統的漸進式擴展提供實施指引。
智能體系統面臨的挑戰與解決方案
盡管MCP、ACP、A2A和ANP等開放協議相繼涌現,但在實際AI系統中實現智能體間的無縫互操作性仍非易事。本節剖析了基于代理的架構所面臨的核心挑戰,并著重闡釋各協議如何通過針對性設計原則應對這些問題:
大語言模型上下文標準化缺失問題 ?
大語言模型(LLMs)需要上下文基礎才能生成準確輸出。然而,現有應用架構缺乏統一的機制向LLMs傳遞結構化上下文,導致工具集成方式臨時化且行為不可靠。
? 解決方案:模型上下文協議(MCP)通過標準化應用向LLMs傳遞工具、數據集和采樣指令的方式,解決了這一問題——其作用類似于AI領域的USB-C標準。該協議支持靈活的即插即用工具、安全的基礎設施集成,并兼容不同LLM供應商的技術體系。
異構智能體間的通信壁壘問題 ?
企業系統通常由基于不同技術棧和框架構建的智能體組成,導致行為孤立且協作效率低下。
? 解決方案:智能體通信協議(ACP)提供符合RESTful風格、可選SDK的接口,并在Linux基金會下實行開放治理。它通過異步優先的交互模式、離線發現機制和供應商中立的執行環境,實現了大規模場景下的互操作性突破。
圖片?1?應對智能體通信問題的解決方案
統一智能體協作標準缺失問題 ?
即使智能體之間能夠通信,當前仍缺乏支持動態協商、能力共享與協同調度的通用框架。
? 解決方案:智能體間協議(A2A)引入多模態通信標準,實現不同框架下異構自治智能體間的動態交互。該協議簡化企業級系統集成,支持共享任務管理與用戶體驗協商機制。
普適性智能體通信挑戰 ?
現代互聯網雖為人類交互優化,卻難以滿足智能體對低延遲、API原生通信及去中心化身份驗證的需求。
? 解決方案:智能體網絡協議(ANP)構建分層協議架構,整合萬維網聯盟去中心化標識符(W3C DID)、語義網原則與加密通信技術,賦能開放互聯網環境中的跨平臺智能體協作。
整體價值
上述協議共同致力于將碎片化的AI生態轉化為健壯、安全且可互操作的智能體網絡——實現跨組織與供應商邊界的規模化擴展。
MCP(Model Context Protocol )架構
模型上下文協議(MCP)采用多層抽象架構規范通信結構與語義。其底層為協議層,基于JSON-RPC 2.0規范定義消息交換的語義規范,確保每個請求均與對應響應嚴格綁定,且所有交互行為遵循可預測模式。中間層為傳輸層,負責客戶端與服務端間的物理消息傳輸,支持兩種通道模式:通過標準輸入輸出(Stdio)實現的本地通信,以及基于HTTP協議的網絡通信(可選集成服務器發送事件SSE實現實時流式傳輸)。最高抽象層將消息劃分為四類核心類型:請求(Request)——需要接收方回復的同步調用指令; ?結果(Result)——對成功執行請求的響應;錯誤(Error)——標識調用失敗或非法操作的狀態反饋;以及通知(Notification)——無需客戶端確認的異步更新消息,適用于實時狀態推送等場景。
圖片?2?MCP的結構圖
MCP服務器的四大核心能力 ?
MCP服務器提供工具(Tools)、資源(Resources)、提示模板(Prompts)和采樣(Sampling)四大核心功能,每項功能對應獨特的控制模型,共同管理客戶端、服務器與大語言模型間的交互邏輯:工具(Tools) ?
作為模型管控能力,允許LLM自動或經用戶授權后調用外部API及服務。此機制實現與第三方系統的無縫集成,并簡化對現實世界數據與操作的訪問流程。
? 資源(Resources)
屬于應用管控元素,由客戶端應用自主選擇并管理結構化文檔、上下文數據集等內容。其為LLM提供任務定制化輸入,支撐具備上下文感知能力的生成結果。
?提示模板(Prompts)
采用用戶主導模式,由服務器預定義可復用模板庫,終端用戶通過客戶端界面按需選擇。該機制保障交互一致性,降低重復勞動,支持標準化交互范式的構建。
采樣(Sampling)
由服務器集中管控,MCP服務器可將LLM生成任務委派至客戶端執行。此能力支持復雜智能體工作流,并允許對模型生成過程(如動態調節溫度參數、生成長度等)實施細粒度監管。
MCP鏈接生命循環
模型上下文協議(MCP)交互生命周期
?該協議為客戶端-服務器交互定義了三階段生命周期,旨在確保會話管理穩健性、功能協商安全性及終止流程可控性。三個階段——初始化(Initialization)、操作(Operation)與關閉(Shutdown)——嚴格對應客戶端應用與MCP服務器間的時序通信邏輯。初始化階段
???協議兼容性驗證:客戶端與服務器協商雙方支持的最高協議版本? 功能交換機制:雙方聲明可選的會話級功能(如采樣、提示模板、工具鏈、日志記錄等)
??就緒信號傳遞:客戶端在接收服務器初始化響應后,發送notifications/initialized消息,標志進入操作階段
操作階段
???交互規則:基于協商功能執行JSON-RPC方法調用與通知,雙方須嚴格遵循初始化階段達成的約束? 執行容錯機制:每個任務調用可配置超時閾值,若超時未響應,客戶端可觸發取消通知以防止資源耗盡或陳舊線程
??狀態管理:實時維護會話上下文,確保多輪交互的連貫性與原子性
關閉階段
???終止觸發方式:任一方可通過關閉傳輸層(HTTP或標準輸入輸出通道)發起會話終止? 資源清理責任:雙方須釋放活躍超時器、取消訂閱事件、回收子進程資源
??終止后約束:禁止發送新協議消息(診斷類基礎操作如心跳檢測、日志刷新除外)
MCP的問題與挑戰
隨著MCP協議在企業及開發者生態中的普及,其生命周期各階段(初始化、運行、更新)暴露出多重安全漏洞。這些風險包括工具中毒、權限駐留、命令注入等攻擊向量,而大語言模型對提示詞操控的敏感性及執行鏈路的不透明性,進一步放大了安全威脅的潛在影響。
系統性梳理了MCP部署各階段最嚴峻的安全威脅,并給出對應的緩解策略與權威參考標準。該分析框架整合了當前公開的攻擊案例與來自最新審計報告、協議評審的最佳防御實踐:
表格?1?MCP協議面臨的安全挑戰
A2A(Agent-to-Agent)架構
A2A架構旨在實現異構智能體系統間的通信與協作,以完成復雜任務。其核心由三大交互主體構成:
用戶(User)
任務需求的發起方,通過客戶端界面定義目標并監控執行狀態。
客戶端智能體(Client Agent)
作為用戶代理,負責任務分解、資源調度,并與遠程智能體建立安全會話通道。
遠程智能體(服務端)
提供專業化服務能力,按協議規范響應任務請求并返回結構化結果。
三大主體通過標準化通信協議實現以下核心特性:
?? 安全驗證機制:基于零知識證明的跨鏈身份認證,防止中間人攻擊? 語義互操作性:通過能力描述語言(ADL)統一服務接口語義,消除框架差異
? 執行原子性:支持兩階段提交(2PC)協議,保障分布式任務的事務完整性
該架構已在金融風控(實時反欺詐協作)與工業物聯網(跨廠區設備協同運維)場景中驗證其企業級擴展能力。
A2A核心組成部分
用戶觸發任務請求(通常無需理解底層智能體系統的技術細節),客戶端智能體接收請求后解析任務意圖,通過檢索遠程智能體發布的能力卡片(Agent Card)匹配最適格的服務提供方。隨后,客戶端智能體與選定的遠程智能體建立會話通道,協調消息交換并獲取任務執行產物(Artifacts),最終將結構化結果返回至用戶端。
用戶端
用戶作為任何A2A交互的發起者,通常帶有著啟動智能體流程的意圖或需求。雖然用戶通常為人類最終用戶,但它也可以是分層工作流程中的某個系統、服務或另一個智能體。無論其形式如何,用戶都不會直接與遠程智能體交互,而是依賴客戶端智能體將其請求轉化為可執行的任務,并協調所有響應。
客戶端智能體
A2A支持多樣化的用戶交互模式。直接終端用戶可通過聊天機器人或語音助手等接口與客戶端智能體交互,實時提供任務輸入并接收結果;間接終端用戶則與更高層系統(如企業儀表盤或協調工具)交互,這些系統在后臺透明化調用A2A智能體;系統或服務也可作為用戶,自主調用A2A智能體完成數據轉換、監控等工作流;在多智能體層級結構中,當某一智能體通過觸發另一智能體的下游操作來完成復雜任務時,則形成"智能體即用戶"場景。這些多樣的用戶范式體現了該協議對用戶身份的不可知性,并著重強調其核心目標——標準化客戶端智能體與遠程智能體之間的通信。
客戶端智能體作為代表用戶意圖的中介,負責與遠程智能體協調以實現該意圖。其職責涵蓋任務生命周期的多個階段:首先執行智能體發現流程,檢索并評估描述各遠程智能體技能、能力、輸入/輸出規格及認證要求的智能體卡片;基于此發現結果,選擇與用戶任務匹配的遠程智能體;隨后進行任務初始化,構建結構化的任務對象(封裝用戶意圖、相關元數據及格式化輸入),并通過規范化的消息格式將任務發送至選定遠程智能體;在執行階段,管理消息與產物交換——與遠程智能體進行雙向通信(發送新指令或后續請求,接收稱為"產物"的輸出及中間狀態更新);對于長期運行或需狀態保持的交互,則維護會話上下文,使用標識符將相關交互歸組到統一工作流中。
客戶端智能體還負責錯誤處理——解析遠程智能體返回的失敗響應,并執行適當的恢復策略(如重試、選擇備用智能體或通知用戶)。執行完成后,通過結果呈現步驟將產物轉換為用戶可用的格式,并集成到相關應用程序或用戶界面中。
在支持相關功能的情況下,客戶端智能體可通過Server-Sent Events(SSE)或推送通知等機制處理異步通信。對于SSE,客戶端智能體會建立持久連接并實時流式傳輸更新;若支持推送通知,則向通知服務注冊以通過獨立通道接收任務更新。總體而言,客戶端智能體在A2A協議中充當執行協調器、數據轉換器與通信橋梁的角色,代表用戶實現智能且具備上下文感知能力的交互。
遠端智能體(服務端)
遠端智能體(服務端)是執行客戶端智能體委派任務的服務端點,其提供一項或多項"技能"——這些技能代表該智能體可執行的離散化操作,涵蓋從簡單數據檢索到復雜計算,乃至涉及外部API或數據庫的協調操作。每項技能均通過其輸入/輸出模式進行正式定義,從而實現跨客戶端調用的一致性。
為實現這些能力的可發現性,遠程智能體發布智能體卡片——這是一種包含可用技能列表、使用說明、輸入/輸出格式、支持協議及認證要求的結構化元數據文檔。該智能體卡片既作為交互智能體間的服務宣傳,又充當接口約定。
遠程智能體還需管理其內部資源使用,確保任務執行期間對計算、內存、網絡及存儲資源的公平分配。除執行功能外,其還負責執行安全與訪問控制機制——包括認證客戶端身份、驗證消息完整性,以及基于訪問策略或令牌范圍對特定技能的訪問權限進行授權。通過將服務能力抽象為模塊化且獨立管理的組件,遠程智能體支持智能體生態系統內的可組合性、可靠性與互操作性。
Agent Communication Protocol (ACP)架構
智能體通信協議(ACP)定義了一個層級化、基于REST原生設計的框架,專為實現可互操作AI智能體而構建。其靜態架構由明確角色與協議層構成,各層級均負責明確定義的功能集。
ACP架構總覽
智能體通信協議(ACP)定義了一種簡化的三角色架構,旨在標準化AI智能體間的發現、調用與交互。該架構確保客戶端無需定制化集成即可實現:無縫定位智能體、發起結構化任務請求、接收多模態響應。
智能體客戶端作為該架構的入口點,通過已發布的注冊表發現智能體并構建符合ACP規范的格式化請求來發起通信。其核心功能包括:將用戶意圖封裝為多部分消息;按需管理會話級上下文;處理從純文本到富產物及二進制數據等多種由智能體返回的有序響應組件。
ACP服務器作為該協議體系的核心,承擔協議中介角色。其主要功能包括:維護遵循智能體詳情模式定義的元數據目錄——智能體注冊表;執行系統級策略(包括身份認證、訪問授權與速率限制)。當接收到客戶端請求時,ACP服務器完成智能體查找與路由,確保請求符合注冊能力范圍,并按預定順序將響應組件安全傳輸回客戶端。
ACP智能體代表執行端點,承載領域特定邏輯。其可運行為無狀態微服務,也可維護會話上下文以支持多輪交互。該智能體接收由有序消息組件構成的結構化請求(每個組件均按語義元數據標記),并根據注冊技能定義進行處理;任務完成后,生成符合ACP消息結構規范的響應組件,從而建立統一且可解析的響應管道。
這三個組件共同構建了一個模塊化且可互操作的智能體通信框架,促進可擴展部署、松耦合架構,以及發現、協調與執行邏輯的明確分離。
圖片?3?ACP架構概覽圖
ACP主要組成部分
ACP交互由一組核心組件規范管理,這些組件定義智能體行為、實現運行時互操作性并標準化任務通信。其架構核心是智能體詳情——一種采用JSON或YAML格式的自描述文檔,充當智能體的公開身份與能力檔案。該文檔提供關鍵元數據,包括智能體名稱、可用操作、支持的內容類型、認證方案及運行時診斷信息。客戶端將智能體詳情作為調用前提,無需定制化集成即可實現可信代理選擇與調用。
作為補充,發現機制使客戶端能在運行時動態定位智能體。這些機制既可采用中心化形式(如注冊表API),也可采用去中心化形式——包括托管在知名URL路徑下的清單文件(例如/.well-known/agent.yml)或內嵌于容器標簽等部署元數據中的配置。該可發現性層將客戶端邏輯與固定配置解耦,支持構建可擴展的智能體網絡。
當智能體被定位后,客戶端會發起任務請求——這種結構化的工作委托單元由有序消息組件構成,具體包含:指定目標操作、文本輸入內容、二進制負載或外部托管數據引用。該設計既支持同步調用,也支持需長期運行的異步任務。
所有請求與響應均遵循ACP的消息結構規范,該規范對通信信封進行標準化定義。每個消息由有序部件列表構成,各部件均明確標注MIME內容類型,并包含內嵌內容或可解引用內容URL值。可選名稱屬性支持使用帶有語義標記的產物,從而促進下游系統對數據的解析。
智能體執行的結果最終封裝為一個或多個產物。這些產物可包括結構化JSON輸出、純文本結果、二進制文件乃至嵌套消息引用等類型。產物作為消息結構響應的一部分傳遞,隨后可被呈現、存儲或鏈接至其他智能體工作流,從而實現支持ACP協議系統間的可擴展性與可組合性。
Agent Network Protocol (ANP)架構
智能體網絡協議(ANP)是一種去中心化的點對點通信標準,專為開放互聯網上的跨平臺智能體互操作性而設計。ANP使智能體能夠通過結構化元數據與AI原生數據交換,實現自主發現、認證及交互。后續章節將ANP的架構與標準化生命周期及模塊化框架進行對齊,使其與MCP、A2A、ACP等協議保持建模一致性。
圖片?4?ANP結構圖
ANP主要組成部分
智能體網絡協議(ANP)的底層由一組基礎組件支撐,共同實現去中心化身份、語義自描述、發現機制及自適應交互。其核心是智能體身份——采用去中心化標識符(DIDs)實現跨平臺唯一身份識別。具體而言,ANP采用did:wba方法,每個標識符對應一個通過HTTPS托管的DID文檔,從而充分利用現有Web基礎設施進行去中心化身份解析。
智能體網絡協議(ANP)在身份層之上構建了智能體描述功能,通過智能體描述協議(ADP)實現。這些采用JSON-LD格式的文檔包含智能體的結構化元數據,涵蓋名稱、功能能力、支持協議、認證方案及服務端點等信息,作為智能體的公開可訪問資料,促進互操作性與語義理解。
智能體通過發現目錄對外公開其存在狀態與功能能力,該目錄通常位于標準化路徑/.well-known/agent-descriptions下。此目錄使人類用戶與自動化系統均可獲取特定域名下的可用智能體列表,為可擴展的智能體索引與搜索奠定基礎。為支持交互,ANP協議提供兩類通信接口:結構化接口(如REST API或gRPC端點,需嚴格遵循預定義模式),以及自適應接口(如自然語言指令通道,支持通過LLM驅動的意圖解析與動態行為生成)。
為支持交互,智能體網絡協議(ANP)提供兩類通信接口:結構化接口(如JSON-RPC與OpenAPI)及自然語言接口(通過YAML或等效模式文件定義)。這兩類接口均在智能體描述中聲明,支持根據場景復雜度與用例靈活選擇交互模式。
最后,元協議協商器實現智能體間的動態協議對齊。該機制允許智能體交換關于其通信需求與能力的自然語言描述,并基于此協商生成兼容的交互協議實例。通過支持運行時自適應性與協議協商,這一技術層確保即使在異構智能體生態系統間也能實現無縫互操作。
Agent協議對比
為更清晰理解主流智能體互操作性協議間的差異,下表對四個廣泛討論的框架進行橫向對比:模型上下文協議(MCP)、智能體通信協議(ACP)、智能體間協議(A2A)與智能體網絡協議(ANP)。該結構化分析聚焦各協議的架構設計、消息格式、發現機制、會話模式及目標用例,從而揭示其在多樣化部署場景中的適用性。
結論
隨著基于大語言模型的自主智能體在各領域快速普及,對安全、模塊化且可互操作的通信需求變得日益緊迫。本研究通過結構化分析四類新興協議——MCP、ACP、A2A與ANP,系統闡釋了它們分別在智能體互操作的不同層級提供的解決方案。這些協議通過統一工具調用、多模態消息傳遞、任務協調及去中心化發現機制,共同構建了可擴展多智能體系統的技術基礎。對比研究表明,單一協議無法滿足所有場景需求,而采取分階段互補的采用策略(從MCP起步,逐步演進至ACP、A2A直至ANP),為部署智能體生態系統提供了切實可行的路徑。未來研究應聚焦于協議互操作橋梁構建、智能體協作信任框架開發及標準化評估基準建立,以加速技術落地并保障實際部署的魯棒性。這些基礎性工作將成為推動下一代智能網絡化智能體發展的關鍵支撐。