科技云報到：Agent應用爆發，誰成為向上托舉的力量？

科技云報道原創。

經過兩年多的發展后，AI開始加速進入Agent時代。

當AI從“被動響應”邁向“主動決策”，AI Agent正成為連接數字世界與物理世界的核心樞紐。

從自動處理客戶服務工單的企業Agent，到協調多步驟科研實驗的學術Agent，再到管理智能家居生態的個人Agent，這種具備推理、規劃、記憶與工具使用能力的智能體，正在重塑產業形態。

但支撐其智能的，是一套復雜且精密的基礎設施——它不僅包含算法與模型，更涵蓋從研發到部署、從協作到運維的全生命周期支撐體系。

2025年，AI Agentic基礎設施（Agent Infra）迎來爆發拐點。DeepSeek、Qwen等開源大模型的突破為 Agent提供了強大的認知“大腦”，而模型上下文協議（MCP）的生態繁榮則賦予其靈活“四肢”。

據IDC預測，全球80%企業將在年內部署Agent。“大腦”與“四肢”的協同進化，正在倒逼承載二者的“軀干”全面升級，Agent Infra成為技術攻堅的核心戰場。

Agent企業應用 面臨五大痛點

利用AI的能力將工作流程自動化，這類產品早已有之。在生成式AI出現之前，就有RPA類產品大行其道。

但限于當時的AI能力還較弱，RPA只能將簡單的單一工作流程自動化，不具備真正的智能，不能解決復合化的復雜問題。

直到生成式AI出現，各種真正具備智能的Agent應用出現，人們才從AI自動化中獲得了很好的效率提升。

Agent本質是一個能調用各種工具的AI。比如Manus，它用提示詞控制AI模型，并編排了一個精巧的工作流（Work Flow），讓AI模型使用各種不同的工具，然后完成一個復雜的任務。

但是，無論是以DeepResearch為代表的研究類Agent應用，還是Manus這樣的通用Agent應用，都是通過網頁或App的形式對終端的用戶提供。

這種提供方式，并不適合專業的AI開發者，AI創業者和企業用戶。因為他們的需求是讓Agent使用專有的數據，無縫地嵌入到業務中，為業務持續提供價值。

商業化使用Agent，首先遇到的就是終端性能，但當一個功能強大的Agent在用戶本地的終端運行時，會遇到各種各樣的問題。

首當其沖的是AI推理的算力限制。Agent由一個能力強大的AI模型及一堆供它調用的工具鏈組成。

運行能力強大的AI模型，通常需要AI專用的算力，由GPU或AI專用芯片提供，幾乎沒有消費級的PC或手機能部署高精度的大模型本體。因此，目前大量的Agent公司都采用了云端算力的方式，將模型的訓練和推理都放在云端完成。

其次是執行任務的算力。Agent任務具有高并發、高算力需求的特點，企業在本地部署了Agent后，當Agent支持的業務量開始快速增長時，馬上就需要更多算力，本地部署的速度跟不上；反過來，當這個業務閑置時，又沒有那么多算力需求，會對企業造成巨大資源浪費。

比如Manus在初期是用本地服務器的虛擬機去做任務，這也導致它在用戶大量涌入的時候，出現了性能不足、服務不穩定的情況，一定程度上影響了初期口碑。

再次是AI工具配置麻煩。Agent若不能調用工具，就很難具備解決復雜問題的能力。

例如，要搭建一個銷售類Agent，它需要調用CRM獲取客戶信息，調用內部的知識庫以備自動向客戶介紹產品，還需要調用各種通訊工具以便直接觸及到客戶。

國內各地已經有不少的智算中心，可以初步緩解算力限制問題，但是這些智算中心卻只提供算力，不提供搭建Agent需要的各種工具鏈。

企業要定制與業務緊密耦合的Agent，就需要自己搭建工具鏈。這是一個很復雜的工程，一方面需要很高的開發成本，另一方面，在Agent正式部署前，需要不短的開發時間，這反而會延緩企業的業務發展速度。

當解決了算力限制和AI工具配置的問題后，專業AI開發者和企業用戶馬上會遇到第三個問題是權限沖突。

開發和部署Agent的目的，是將其嵌入到自己的業務中。而這個過程，除了要調用各種各樣的工具以外，還需要與業務中的各類軟件緊密配合。

以銷售類Agent為例，當它調用CRM，內部知識庫和對外通訊工具時，不僅會占用本地計算資源，更麻煩的是，它會搶占人類員工的訪問和操作權限。

當Agent不是與人類協同，而是互相內耗時，反而可能拉低整個團隊的整體工作效率。

對于企業用戶，還有一個大問題，就是安全性差。企業使用Agent的目的就是要增強自己的業務，或者提高員工的效率，這勢必需要使用公司的內部數據。

但是Agent任務執行是一個黑盒子，執行過程對于用戶來說是不透明的，有可能對本地電腦文件系統進行修改、刪減等操作，輕則留下垃圾文件造成系統臃腫，重則造成文件丟失或數據泄露。

更進一步，其實Agent在調用工具時，本身就會有安全隱患。

據統計，超過43%的MCP服務節點存在未經驗證的Shell調用路徑，超過83%的部署存在MCP配置漏洞；88%的AI組件部署根本沒啟用任何形式的防護機制。

當未來Agent的使用越來越普及，安全和信任的重要性，在AI時代比在互聯網時代更加重要。

當真正把本地部署Agent用起來后，企業還會面臨一個問題，就是Agent缺乏長期記憶。

當缺乏語義記憶和場景記憶，Agent能完成一次性的任務，這會嚴重影響Agent在企業業務中的使用范圍。

當企業用戶將Agent用到業務中時，如果能為其賦予長期記憶，那么Agent除了能夠完成多次任務，企業還可以根據這些記憶迭代Agent，使其對業務或用戶的理解越來越深，在特定任務上的能力越來越強。

Agent Infra乘風而來

如今，云廠商競相推出新一代Agent Infra技術架構。

比如AWS 推出AgentCore（預覽版），其基于Lambda FaaS基礎設施深度定制和優化的全托管運行時，為Bedrock Agents解決了標準Lambda的關鍵限制，如長時執行、狀態記錄、會話隔離等。

Azure則推出AI Foundry Agent Service，集成Functions FaaS事件驅動使得Agent Service能夠利用Serverless計算的事件驅動、可擴展性和靈活性，更輕松地構建和部署Agent。

Google Cloud推出Vertex AI Agent Builder，官方雖未明確但普遍推斷其高度依賴并優化了Cloud Run（Cloud Functions 2nd Gen已經基于Cloud Run來構建）來支撐長時運行、并發和有狀態的需求。

阿里云推出函數計算Function AI，官方明確基于FC FaaS的Serverless x AI運行時深度優化，推出模型服務、工具服務、Agent 服務，開發者可自主選擇模型、運行時、工具的一個或多個以組裝式設計構建和部署Agent。

PPIO推出國內首個Agentic AI基礎設施服務平臺——AI智能體，該AI智能體平臺產品分為通用版和企業版。

通用版以分布式GPU云底座為支撐，發布中國首款兼容E2B接口的Agent沙箱，以及更適用于Agent構建的模型服務。

Agent沙箱專為Agent執行任務設計的云端安全運行環境，支持動態調用Browser use、Computer use、MCP、RAG、Search等各種工具，為Agent賦予安全可靠、高效敏捷的“手和腳”。目前，該沙箱已接入Camel AI、OpenManus、Dify等著名開源項目。

這些技術共同指向同一目標——為Agent提供更高彈性、更低延遲、更強安全、更長會話的“軀干”，支撐其從實驗室邁向千萬級企業場景。

當認知與行動完成閉環，Agent Infra的技術代差將決定企業AI創新和轉型的落地速度與質量。

Agent開發范式的演進對底層基礎設施提出了全新要求。

各大云廠商的新一代 Agent Infra聚焦長時運行、會話親和、會話隔離、企業級IAM和VPC及模型/框架開放等技術突破，本質上是為滿足三類核心Agent形態的共性需求。

首先是LLM Agent連續調用工具的強訴求。LLM Agent需連續調用工具鏈完成復雜推理，可能跨越數分鐘甚至數小時。

傳統Serverless的執行時長限制（如 AWS Lambda 的15分鐘上限）會強制中斷任務，因此新一代Agent Infra必須突破該限制，支持長時運行。

同時，為維持多輪對話的上下文一致性，需會話親和確保同一請求路由到同一計算實例，避免狀態丟失。

其次，Workflow Agent對狀態管理的依賴。自動化工作流（如數據處理 Pipeline）需持久化記錄執行狀態。

傳統Serverless的無狀態特性無法保存中間結果，而新一代Agent Infra通過提供有狀態會話保障工作流的原子性和可恢復性。會話隔離則確保多租戶或高并發場景下任務互不干擾，滿足企業級安全合規要求。

第三，Custom Agent的靈活性與生態整合。Custom Agent需集成異構工具（API、領域模型、數據庫、Code Interpreter、Browser Use等），要求新一代Agent Infra支持模型/框架開放（如 AutoGen、LangChain、AgentScope）。

封閉式架構會限制Agent能力擴展，而云廠商通過解耦計算層與框架層，可提供插件化集成接口。

新一代Agent Infra在保留Serverless核心優勢（全托管免運維、輕量彈性更經濟）的同時，通過關鍵功能（長時運行、會話親和/會話隔離）和技術突破（狀態持久化、冷啟動優化、開放集成），解決了LLM Agent的持續推理、Workflow Agent的復雜狀態流轉、Custom Agent的靈活定制等核心需求。

這標志著Agent開發正從“手動拼湊傳統組件”轉向“利用原生Infra實現高效、安全、可擴展的開發部署”這一全新的技術路徑。

隨著Agent應用進一步加速，Agent Infra成為模型公司、云廠商、初創公司都在積極拓展的領域。除了云巨頭外，創業公司在這個領域也有不小的機會。

首先，是在已有Infra中尋找有AI-native需求的環節。這種需求可以是Agent開發對該環節的某些性能提出了更高的要求，例如Sandbox需要更快冷啟動速度、更強的隔離性；這種需求也可以是需要和AI workflow結合的更好，有更多AI-native的功能點，例如增加RAG功能，或者和某些AI開發者常用的語言或SDK有更好的結合。

其次，抓住Agent開發中的新痛點。Agent開發要追求R&D和時間投入的ROI，對降低開發門檻和工程量的Infra產品有較大需求，因此一套易用性高且價格合理的Infra就有機會被廣泛采用。而且Agent生態是一個強調共建的生態系統，而Infra的持續創新，正在大力推動這種生態的構建。

當開發一個Agent變得像組裝樂高積木一樣便捷，當Agent協作網絡滲透到社會的每個角落，我們將不再爭論“這是風口還是泡沫”，因為這是一個正在到來的新未來。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年，是前沿企業級IT領域Top10媒體。獲工信部權威認可，可信云、數博會、國家網安周與全球云計算等大型活動的官方指定傳播媒體之一。深入原創報道云計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。