科技云報到:Agent應用爆發,誰成為向上托舉的力量?

科技云報道原創。

經過兩年多的發展后,AI開始加速進入Agent時代。

當AI從“被動響應”邁向“主動決策”,AI Agent正成為連接數字世界與物理世界的核心樞紐。

從自動處理客戶服務工單的企業Agent,到協調多步驟科研實驗的學術Agent,再到管理智能家居生態的個人Agent,這種具備推理、規劃、記憶與工具使用能力的智能體,正在重塑產業形態。

但支撐其智能的,是一套復雜且精密的基礎設施——它不僅包含算法與模型,更涵蓋從研發到部署、從協作到運維的全生命周期支撐體系。

2025年,AI Agentic基礎設施(Agent Infra)迎來爆發拐點。DeepSeek、Qwen等開源大模型的突破為 Agent提供了強大的認知“大腦”,而模型上下文協議(MCP)的生態繁榮則賦予其靈活“四肢”。

據IDC預測,全球80%企業將在年內部署Agent。“大腦”與“四肢”的協同進化,正在倒逼承載二者的“軀干”全面升級,Agent Infra成為技術攻堅的核心戰場。

 

Agent企業應用 面臨五大痛點

利用AI的能力將工作流程自動化,這類產品早已有之。在生成式AI出現之前,就有RPA類產品大行其道。

但限于當時的AI能力還較弱,RPA只能將簡單的單一工作流程自動化,不具備真正的智能,不能解決復合化的復雜問題。

直到生成式AI出現,各種真正具備智能的Agent應用出現,人們才從AI自動化中獲得了很好的效率提升。

Agent本質是一個能調用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了一個精巧的工作流(Work Flow),讓AI模型使用各種不同的工具,然后完成一個復雜的任務。

但是,無論是以DeepResearch為代表的研究類Agent應用,還是Manus這樣的通用Agent應用,都是通過網頁或App的形式對終端的用戶提供。

這種提供方式,并不適合專業的AI開發者,AI創業者和企業用戶。因為他們的需求是讓Agent使用專有的數據,無縫地嵌入到業務中,為業務持續提供價值。

商業化使用Agent,首先遇到的就是終端性能,但當一個功能強大的Agent在用戶本地的終端運行時,會遇到各種各樣的問題。

首當其沖的是AI推理的算力限制。Agent由一個能力強大的AI模型及一堆供它調用的工具鏈組成。

運行能力強大的AI模型,通常需要AI專用的算力,由GPU或AI專用芯片提供,幾乎沒有消費級的PC或手機能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓練和推理都放在云端完成。

其次是執行任務的算力。Agent任務具有高并發、高算力需求的特點,企業在本地部署了Agent后,當Agent支持的業務量開始快速增長時,馬上就需要更多算力,本地部署的速度跟不上;反過來,當這個業務閑置時,又沒有那么多算力需求,會對企業造成巨大資源浪費。

比如Manus在初期是用本地服務器的虛擬機去做任務,這也導致它在用戶大量涌入的時候,出現了性能不足、服務不穩定的情況,一定程度上影響了初期口碑。

再次是AI工具配置麻煩。Agent若不能調用工具,就很難具備解決復雜問題的能力。

例如,要搭建一個銷售類Agent,它需要調用CRM獲取客戶信息,調用內部的知識庫以備自動向客戶介紹產品,還需要調用各種通訊工具以便直接觸及到客戶。

國內各地已經有不少的智算中心,可以初步緩解算力限制問題,但是這些智算中心卻只提供算力,不提供搭建Agent需要的各種工具鏈。

企業要定制與業務緊密耦合的Agent,就需要自己搭建工具鏈。這是一個很復雜的工程,一方面需要很高的開發成本,另一方面,在Agent正式部署前,需要不短的開發時間,這反而會延緩企業的業務發展速度。

當解決了算力限制和AI工具配置的問題后,專業AI開發者和企業用戶馬上會遇到第三個問題是權限沖突。

開發和部署Agent的目的,是將其嵌入到自己的業務中。而這個過程,除了要調用各種各樣的工具以外,還需要與業務中的各類軟件緊密配合。

以銷售類Agent為例,當它調用CRM,內部知識庫和對外通訊工具時,不僅會占用本地計算資源,更麻煩的是,它會搶占人類員工的訪問和操作權限。

當Agent不是與人類協同,而是互相內耗時,反而可能拉低整個團隊的整體工作效率。

對于企業用戶,還有一個大問題,就是安全性差。企業使用Agent的目的就是要增強自己的業務,或者提高員工的效率,這勢必需要使用公司的內部數據。

但是Agent任務執行是一個黑盒子,執行過程對于用戶來說是不透明的,有可能對本地電腦文件系統進行修改、刪減等操作,輕則留下垃圾文件造成系統臃腫,重則造成文件丟失或數據泄露。

更進一步,其實Agent在調用工具時,本身就會有安全隱患。

據統計,超過43%的MCP服務節點存在未經驗證的Shell調用路徑,超過83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒啟用任何形式的防護機制。

當未來Agent的使用越來越普及,安全和信任的重要性,在AI時代比在互聯網時代更加重要。

當真正把本地部署Agent用起來后,企業還會面臨一個問題,就是Agent缺乏長期記憶。

當缺乏語義記憶和場景記憶,Agent能完成一次性的任務,這會嚴重影響Agent在企業業務中的使用范圍。

當企業用戶將Agent用到業務中時,如果能為其賦予長期記憶,那么Agent除了能夠完成多次任務,企業還可以根據這些記憶迭代Agent,使其對業務或用戶的理解越來越深,在特定任務上的能力越來越強。

Agent Infra乘風而來

如今,云廠商競相推出新一代Agent Infra技術架構。

比如AWS 推出AgentCore(預覽版),其基于Lambda FaaS基礎設施深度定制和優化的全托管運行時,為Bedrock Agents解決了標準Lambda的關鍵限制,如長時執行、狀態記錄、會話隔離等。

Azure則推出AI Foundry Agent Service,集成Functions FaaS事件驅動使得Agent Service能夠利用Serverless計算的事件驅動、可擴展性和靈活性,更輕松地構建和部署Agent。

Google Cloud推出Vertex AI Agent Builder,官方雖未明確但普遍推斷其高度依賴并優化了Cloud Run(Cloud Functions 2nd Gen已經基于Cloud Run來構建)來支撐長時運行、并發和有狀態的需求。

阿里云推出函數計算Function AI,官方明確基于FC FaaS的Serverless x AI運行時深度優化,推出模型服務、工具服務、Agent 服務,開發者可自主選擇模型、運行時、工具的一個或多個以組裝式設計構建和部署Agent。

PPIO推出國內首個Agentic AI基礎設施服務平臺——AI智能體,該AI智能體平臺產品分為通用版和企業版。

通用版以分布式GPU云底座為支撐,發布中國首款兼容E2B接口的Agent沙箱,以及更適用于Agent構建的模型服務。

Agent沙箱專為Agent執行任務設計的云端安全運行環境,支持動態調用Browser use、Computer use、MCP、RAG、Search等各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”。目前,該沙箱已接入Camel AI、OpenManus、Dify等著名開源項目。

這些技術共同指向同一目標——為Agent提供更高彈性、更低延遲、更強安全、更長會話的“軀干”,支撐其從實驗室邁向千萬級企業場景。

當認知與行動完成閉環,Agent Infra的技術代差將決定企業AI創新和轉型的落地速度與質量。

Agent開發范式的演進對底層基礎設施提出了全新要求。

各大云廠商的新一代 Agent Infra聚焦長時運行、會話親和、會話隔離、企業級IAM和VPC及模型/框架開放等技術突破,本質上是為滿足三類核心Agent形態的共性需求。

首先是LLM Agent連續調用工具的強訴求。LLM Agent需連續調用工具鏈完成復雜推理,可能跨越數分鐘甚至數小時。

傳統Serverless的執行時長限制(如 AWS Lambda 的15分鐘上限)會強制中斷任務,因此新一代Agent Infra必須突破該限制,支持長時運行。

同時,為維持多輪對話的上下文一致性,需會話親和確保同一請求路由到同一計算實例,避免狀態丟失。

其次,Workflow Agent對狀態管理的依賴。自動化工作流(如數據處理 Pipeline)需持久化記錄執行狀態。

傳統Serverless的無狀態特性無法保存中間結果,而新一代Agent Infra通過提供有狀態會話保障工作流的原子性和可恢復性。會話隔離則確保多租戶或高并發場景下任務互不干擾,滿足企業級安全合規要求。

第三,Custom Agent的靈活性與生態整合。Custom Agent需集成異構工具(API、領域模型、數據庫、Code Interpreter、Browser Use等),要求新一代Agent Infra支持模型/框架開放(如 AutoGen、LangChain、AgentScope)。

封閉式架構會限制Agent能力擴展,而云廠商通過解耦計算層與框架層,可提供插件化集成接口。

新一代Agent Infra在保留Serverless核心優勢(全托管免運維、輕量彈性更經濟)的同時,通過關鍵功能(長時運行、會話親和/會話隔離)和技術突破(狀態持久化、冷啟動優化、開放集成),解決了LLM Agent的持續推理、Workflow Agent的復雜狀態流轉、Custom Agent的靈活定制等核心需求。

這標志著Agent開發正從“手動拼湊傳統組件”轉向“利用原生Infra實現高效、安全、可擴展的開發部署”這一全新的技術路徑。

隨著Agent應用進一步加速,Agent Infra成為模型公司、云廠商、初創公司都在積極拓展的領域。除了云巨頭外,創業公司在這個領域也有不小的機會。

首先,是在已有Infra中尋找有AI-native需求的環節。這種需求可以是Agent開發對該環節的某些性能提出了更高的要求,例如Sandbox需要更快冷啟動速度、更強的隔離性;這種需求也可以是需要和AI workflow結合的更好,有更多AI-native的功能點,例如增加RAG功能,或者和某些AI開發者常用的語言或SDK有更好的結合。

其次,抓住Agent開發中的新痛點。Agent開發要追求R&D和時間投入的ROI,對降低開發門檻和工程量的Infra產品有較大需求,因此一套易用性高且價格合理的Infra就有機會被廣泛采用。而且Agent生態是一個強調共建的生態系統,而Infra的持續創新,正在大力推動這種生態的構建。

當開發一個Agent變得像組裝樂高積木一樣便捷,當Agent協作網絡滲透到社會的每個角落,我們將不再爭論“這是風口還是泡沫”,因為這是一個正在到來的新未來。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、數博會、國家網安周與全球云計算等大型活動的官方指定傳播媒體之一。深入原創報道云計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/92442.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/92442.shtml
英文地址,請注明出處:http://en.pswp.cn/web/92442.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python字典高階操作:高效提取子集的技術與工程實踐

引言:字典子集提取在現代數據處理中的關鍵作用在Python數據工程領域,字典結構作為核心數據載體占比高達68%(2025年Python生態調查報告)。字典子集提取作為高頻操作,在以下場景中至關重要:??API響應處理?…

Java學習進階--集合體系結構

Java 集合框架 (java.util 包) 是 Java 中用于存儲和操作數據集合的核心組件,其設計精良、功能強大且高度靈活。理解其體系結構是 Java 進階的關鍵一步。一.集合的核心思想接口與實現分離集合框架的核心在于接口定義了行為規范,而具體實現類提供了不同的…

【Unity】Unity中的StreamingAssets文件夾

目錄前言核心特性1. 文件保留原始格式2. 只讀訪問3. 平臺兼容性不同平臺下的路徑一、使用1、讀寫2、使用UnityWebRequest讀取二、AB讀取的特例三、注意事項前言 StreamingAssets 文件夾是Unity項目中的一個特殊目錄,用于存放需要在運行時訪問的資源文件。這個文件夾…

[windows]torchsig 1.1.0 gr-spectrumdetect模塊安裝

問題 按照提供的readme git clone https://github.com/TorchDSP/torchsig.git cd torchsig pip install . cd gr-spectrumdetect mkdir build cd build cmake ../ make install cd ../examples/ bash trained_model_download.sh gnuradio-companion example.grc &安裝總是出…

網絡安全要了解的知識

基于2025年網絡安全態勢整理的十大高危漏洞類型,結合攻擊影響范圍、技術嚴重性及實際案例分析綜合排序:---1. 訪問控制失效- 核心問題:權限校驗缺失導致越權操作(如修改URL參數獲取他人數據)。 - 案例:202…

xml 格式化

運行效果:免費在線XML格式化工具 - XML代碼美化/壓縮/驗證 代碼實現: using Microsoft.AspNetCore.Mvc; using System.Xml; using System.Xml.Linq;namespace SaaS.OfficialWebSite.Web.Controllers {public class XmlController : Controller{public I…

Pygame音頻播放的最簡框架代碼示例

一、示例代碼:import pygame pygame.init() pygame.mixer.init() pygame.mixer.music.load(/home/lijiang/Music/Lynyrd Skynyrd - Sweet Home Alabama.mp3) pygame.mixer.music.play()while pygame.mixer.music.get_busy():pygame.time.Clock().tick(10)二、代碼詳…

在Ubuntu環境中安裝Docker和Minikube的完整指南

目錄 前言 準備工作 第一部分:安裝Docker 步驟1:卸載舊版本(如果有) 步驟2:安裝依賴包 步驟3:添加Docker官方GPG密鑰 步驟4:設置Docker倉庫 步驟5:安裝Docker引擎 步驟6&am…

幾個概率分布在機器學習應用示例

一、說明 在這份快速指南中,我們將介紹最重要的分布——從始終公平的均勻分布,到鐘形的正態分布,計數點擊的泊松分布,以及二元選擇的二項分布。 沒有復雜的數學,只有清晰的概念、真實的例子,以及為什么它們…

2025年測繪程序設計模擬賽一--地形圖圖幅編號及圖廓點經緯度計算

想要在2026年參加這個比賽的,可以加入小編和其它大佬所建的群242845175一起來備賽,為2026年的比賽打基礎,也可以私信小編,為你答疑解惑一、讀取文件 這里有兩種文件需要讀取,所以要額外處理 internal class Read {publ…

【C++基礎】名字空間與 inline 命名空間:面試高頻考點與真題解析

想象一下,你正在開發一個大型項目,團隊中有10名程序員同時工作。當你們分別定義了calculate()函數時,編譯器會陷入混亂:它不知道應該調用哪個版本的calculate。這就是C++引入名字空間(Namespace)的根本原因! 一、名字空間(Namespace)基礎概念 1.1 為什么需要名字空間…

Pytest項目_day08(setup、teardown前置后置操作)

setup模塊級setup_module:運行于模塊開始之前,生效一次 一個py文件(測試文件)就是一個模塊函數級setup_function:對于每條(不在類中的)函數用例生效,如果函數在類中,那么…

trae開發c#

安裝插件C# Dev Kit,使用的版本是1.41.11 .NET Install Tool一般會自動安裝,安裝C# dev kit的時候,版本2.3.7 C# 插件,版本2.87.31 https://marketplace.visualstudio.com/items?itemNamems-dotnettools.vscode-dotnet-runtim…

Modstart 請求出現 Access to XMLHttpRequest at ‘xx‘

在 uniapp 前端頁面請求時出現類似如下錯誤Access to XMLHttpRequest at https://example.com/api/mtiku/config from origin http://localhost:20000 has been blocked by CORS policy: Response to preflight request doesnt pass access control check: No Access-Control…

計算機視覺CS231n學習(5)

循環神經網絡 RNN recurrent neural networksRNN序列處理能力(RNN核心作用) RNN處理序列數據,相比“Vanilla”神經網絡(僅支持一對一映射),RNN支持多種序列映射模式: 一對一:傳統分類…

Spring Boot Redis 緩存完全指南

Spring Boot Redis 緩存完全指南 1. 項目依賴配置 1.1 Maven依賴 <dependencies><!-- Spring Boot Redis --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId><…

八股——WebSocket

文章目錄1、 什么是 WebSocket&#xff1f;與 Http 協議的區別是什么&#xff1f;2、 Http 是如何升級為 WebSocket 的&#xff1f;3、 為什么 WebSocket 可以進行全雙工模式的消息傳輸&#xff0c;而 Http 不可以&#xff1f;4、 什么是 TCP 的沾包和拆包&#xff1f;5、 WebS…

Mysql 如何使用 binlog 日志回滾操作失誤的數據

文章目錄一、背景二、準備測試數據1. 創建測試表2. 創建測試數據三、模擬誤操作四、數據回滾&#xff08;一&#xff09;方案一&#xff1a;云數據庫恢復&#xff08;二&#xff09;方案二&#xff1a;手動恢復1. 查詢 binlog 日志2. 找到刪除語句&#xff0c;手動還原為插入語…

wodpress結構化數據對SEO的作用

在 WordPress 網站中&#xff0c;結構化數據對 SEO 的作用主要體現在以下幾個方面&#xff1a; 1. 提升搜索結果的可見性 結構化數據能夠幫助搜索引擎更好地理解網頁內容&#xff0c;從而以更精準的方式展示搜索結果。通過添加結構化數據&#xff0c;網頁可以在搜索結果中顯示…

講一講@ImportResource

題目詳細答案ImportResource是 Spring 框架中的一個注解&#xff0c;用于將傳統的 XML 配置文件導入到基于 Java 配置的 Spring 應用程序中。它允許開發者在使用 Java 配置的同時&#xff0c;繼續利用現有的 XML 配置文件。這樣可以逐步遷移舊的 XML 配置&#xff0c;或者在某些…