科技云報道原創。
經過兩年多的發展后,AI開始加速進入Agent時代。
當AI從“被動響應”邁向“主動決策”,AI Agent正成為連接數字世界與物理世界的核心樞紐。
從自動處理客戶服務工單的企業Agent,到協調多步驟科研實驗的學術Agent,再到管理智能家居生態的個人Agent,這種具備推理、規劃、記憶與工具使用能力的智能體,正在重塑產業形態。
但支撐其智能的,是一套復雜且精密的基礎設施——它不僅包含算法與模型,更涵蓋從研發到部署、從協作到運維的全生命周期支撐體系。
2025年,AI Agentic基礎設施(Agent Infra)迎來爆發拐點。DeepSeek、Qwen等開源大模型的突破為 Agent提供了強大的認知“大腦”,而模型上下文協議(MCP)的生態繁榮則賦予其靈活“四肢”。
據IDC預測,全球80%企業將在年內部署Agent。“大腦”與“四肢”的協同進化,正在倒逼承載二者的“軀干”全面升級,Agent Infra成為技術攻堅的核心戰場。
Agent企業應用 面臨五大痛點
利用AI的能力將工作流程自動化,這類產品早已有之。在生成式AI出現之前,就有RPA類產品大行其道。
但限于當時的AI能力還較弱,RPA只能將簡單的單一工作流程自動化,不具備真正的智能,不能解決復合化的復雜問題。
直到生成式AI出現,各種真正具備智能的Agent應用出現,人們才從AI自動化中獲得了很好的效率提升。
Agent本質是一個能調用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了一個精巧的工作流(Work Flow),讓AI模型使用各種不同的工具,然后完成一個復雜的任務。
但是,無論是以DeepResearch為代表的研究類Agent應用,還是Manus這樣的通用Agent應用,都是通過網頁或App的形式對終端的用戶提供。
這種提供方式,并不適合專業的AI開發者,AI創業者和企業用戶。因為他們的需求是讓Agent使用專有的數據,無縫地嵌入到業務中,為業務持續提供價值。
商業化使用Agent,首先遇到的就是終端性能,但當一個功能強大的Agent在用戶本地的終端運行時,會遇到各種各樣的問題。
首當其沖的是AI推理的算力限制。Agent由一個能力強大的AI模型及一堆供它調用的工具鏈組成。
運行能力強大的AI模型,通常需要AI專用的算力,由GPU或AI專用芯片提供,幾乎沒有消費級的PC或手機能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓練和推理都放在云端完成。
其次是執行任務的算力。Agent任務具有高并發、高算力需求的特點,企業在本地部署了Agent后,當Agent支持的業務量開始快速增長時,馬上就需要更多算力,本地部署的速度跟不上;反過來,當這個業務閑置時,又沒有那么多算力需求,會對企業造成巨大資源浪費。
比如Manus在初期是用本地服務器的虛擬機去做任務,這也導致它在用戶大量涌入的時候,出現了性能不足、服務不穩定的情況,一定程度上影響了初期口碑。
再次是AI工具配置麻煩。Agent若不能調用工具,就很難具備解決復雜問題的能力。
例如,要搭建一個銷售類Agent,它需要調用CRM獲取客戶信息,調用內部的知識庫以備自動向客戶介紹產品,還需要調用各種通訊工具以便直接觸及到客戶。
國內各地已經有不少的智算中心,可以初步緩解算力限制問題,但是這些智算中心卻只提供算力,不提供搭建Agent需要的各種工具鏈。
企業要定制與業務緊密耦合的Agent,就需要自己搭建工具鏈。這是一個很復雜的工程,一方面需要很高的開發成本,另一方面,在Agent正式部署前,需要不短的開發時間,這反而會延緩企業的業務發展速度。
當解決了算力限制和AI工具配置的問題后,專業AI開發者和企業用戶馬上會遇到第三個問題是權限沖突。
開發和部署Agent的目的,是將其嵌入到自己的業務中。而這個過程,除了要調用各種各樣的工具以外,還需要與業務中的各類軟件緊密配合。
以銷售類Agent為例,當它調用CRM,內部知識庫和對外通訊工具時,不僅會占用本地計算資源,更麻煩的是,它會搶占人類員工的訪問和操作權限。
當Agent不是與人類協同,而是互相內耗時,反而可能拉低整個團隊的整體工作效率。
對于企業用戶,還有一個大問題,就是安全性差。企業使用Agent的目的就是要增強自己的業務,或者提高員工的效率,這勢必需要使用公司的內部數據。
但是Agent任務執行是一個黑盒子,執行過程對于用戶來說是不透明的,有可能對本地電腦文件系統進行修改、刪減等操作,輕則留下垃圾文件造成系統臃腫,重則造成文件丟失或數據泄露。
更進一步,其實Agent在調用工具時,本身就會有安全隱患。
據統計,超過43%的MCP服務節點存在未經驗證的Shell調用路徑,超過83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒啟用任何形式的防護機制。
當未來Agent的使用越來越普及,安全和信任的重要性,在AI時代比在互聯網時代更加重要。
當真正把本地部署Agent用起來后,企業還會面臨一個問題,就是Agent缺乏長期記憶。
當缺乏語義記憶和場景記憶,Agent能完成一次性的任務,這會嚴重影響Agent在企業業務中的使用范圍。
當企業用戶將Agent用到業務中時,如果能為其賦予長期記憶,那么Agent除了能夠完成多次任務,企業還可以根據這些記憶迭代Agent,使其對業務或用戶的理解越來越深,在特定任務上的能力越來越強。
Agent Infra乘風而來
如今,云廠商競相推出新一代Agent Infra技術架構。
比如AWS 推出AgentCore(預覽版),其基于Lambda FaaS基礎設施深度定制和優化的全托管運行時,為Bedrock Agents解決了標準Lambda的關鍵限制,如長時執行、狀態記錄、會話隔離等。
Azure則推出AI Foundry Agent Service,集成Functions FaaS事件驅動使得Agent Service能夠利用Serverless計算的事件驅動、可擴展性和靈活性,更輕松地構建和部署Agent。
Google Cloud推出Vertex AI Agent Builder,官方雖未明確但普遍推斷其高度依賴并優化了Cloud Run(Cloud Functions 2nd Gen已經基于Cloud Run來構建)來支撐長時運行、并發和有狀態的需求。
阿里云推出函數計算Function AI,官方明確基于FC FaaS的Serverless x AI運行時深度優化,推出模型服務、工具服務、Agent 服務,開發者可自主選擇模型、運行時、工具的一個或多個以組裝式設計構建和部署Agent。
PPIO推出國內首個Agentic AI基礎設施服務平臺——AI智能體,該AI智能體平臺產品分為通用版和企業版。
通用版以分布式GPU云底座為支撐,發布中國首款兼容E2B接口的Agent沙箱,以及更適用于Agent構建的模型服務。
Agent沙箱專為Agent執行任務設計的云端安全運行環境,支持動態調用Browser use、Computer use、MCP、RAG、Search等各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”。目前,該沙箱已接入Camel AI、OpenManus、Dify等著名開源項目。
這些技術共同指向同一目標——為Agent提供更高彈性、更低延遲、更強安全、更長會話的“軀干”,支撐其從實驗室邁向千萬級企業場景。
當認知與行動完成閉環,Agent Infra的技術代差將決定企業AI創新和轉型的落地速度與質量。
Agent開發范式的演進對底層基礎設施提出了全新要求。
各大云廠商的新一代 Agent Infra聚焦長時運行、會話親和、會話隔離、企業級IAM和VPC及模型/框架開放等技術突破,本質上是為滿足三類核心Agent形態的共性需求。
首先是LLM Agent連續調用工具的強訴求。LLM Agent需連續調用工具鏈完成復雜推理,可能跨越數分鐘甚至數小時。
傳統Serverless的執行時長限制(如 AWS Lambda 的15分鐘上限)會強制中斷任務,因此新一代Agent Infra必須突破該限制,支持長時運行。
同時,為維持多輪對話的上下文一致性,需會話親和確保同一請求路由到同一計算實例,避免狀態丟失。
其次,Workflow Agent對狀態管理的依賴。自動化工作流(如數據處理 Pipeline)需持久化記錄執行狀態。
傳統Serverless的無狀態特性無法保存中間結果,而新一代Agent Infra通過提供有狀態會話保障工作流的原子性和可恢復性。會話隔離則確保多租戶或高并發場景下任務互不干擾,滿足企業級安全合規要求。
第三,Custom Agent的靈活性與生態整合。Custom Agent需集成異構工具(API、領域模型、數據庫、Code Interpreter、Browser Use等),要求新一代Agent Infra支持模型/框架開放(如 AutoGen、LangChain、AgentScope)。
封閉式架構會限制Agent能力擴展,而云廠商通過解耦計算層與框架層,可提供插件化集成接口。
新一代Agent Infra在保留Serverless核心優勢(全托管免運維、輕量彈性更經濟)的同時,通過關鍵功能(長時運行、會話親和/會話隔離)和技術突破(狀態持久化、冷啟動優化、開放集成),解決了LLM Agent的持續推理、Workflow Agent的復雜狀態流轉、Custom Agent的靈活定制等核心需求。
這標志著Agent開發正從“手動拼湊傳統組件”轉向“利用原生Infra實現高效、安全、可擴展的開發部署”這一全新的技術路徑。
隨著Agent應用進一步加速,Agent Infra成為模型公司、云廠商、初創公司都在積極拓展的領域。除了云巨頭外,創業公司在這個領域也有不小的機會。
首先,是在已有Infra中尋找有AI-native需求的環節。這種需求可以是Agent開發對該環節的某些性能提出了更高的要求,例如Sandbox需要更快冷啟動速度、更強的隔離性;這種需求也可以是需要和AI workflow結合的更好,有更多AI-native的功能點,例如增加RAG功能,或者和某些AI開發者常用的語言或SDK有更好的結合。
其次,抓住Agent開發中的新痛點。Agent開發要追求R&D和時間投入的ROI,對降低開發門檻和工程量的Infra產品有較大需求,因此一套易用性高且價格合理的Infra就有機會被廣泛采用。而且Agent生態是一個強調共建的生態系統,而Infra的持續創新,正在大力推動這種生態的構建。
當開發一個Agent變得像組裝樂高積木一樣便捷,當Agent協作網絡滲透到社會的每個角落,我們將不再爭論“這是風口還是泡沫”,因為這是一個正在到來的新未來。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、數博會、國家網安周與全球云計算等大型活動的官方指定傳播媒體之一。深入原創報道云計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。