在人工智能飛速發展的今天,數據孤島和工具碎片化問題一直是阻礙AI應用高效發展的兩大難題。由于缺乏統一的標準,AI應用難以無縫地獲取和充分利用數據價值。
為了解決這些問題,2024年AI領域提出了MCP(Model Context Protocol模型上下文協議),這一標準化接口協議旨在打破AI模型與外部資源之間的壁壘。就像?USB-C?接口一樣,為AI模型/應用與各種數據源和工具之間提供了一種通用的“即插即用”連接方式,讓AI模型與外部工具與數據源之間安全雙向連接,大大提高了AI開發的效率和靈活性。
隨著MCP作為AI?連接數據和工具的統一標準逐漸普及,也標志著AI應用從“靜態推理”向“動態執行”的轉型,AI應用的全新架構也面臨著靈活性、性能與安全等諸多挑戰。
華為云AI原生應用運行平臺+MCP,重塑?AI?應用架構新范式
為更好的適應全新AI應用架構,華為云推出AI原生應用運行平臺+MCP產品組合方案,基于MCP整合Serverless?及一系列平臺關鍵組件,為開發者提供高效、靈活、可靠的AI應用開發與部署方案,實現大模型與外部數據源的“即插即用”安全連接,助力開發者快速構建靈活擴展、安全可信的AI應用,實現AI應用的商業化。
華為云AI原生應用運行平臺+MCP產品組合方案
?
AI應用架構新范式解析
- 用戶請求:用戶向AI應用發起請求時,請求流量首先進入流量+ AI網關(APIG)。APIG作為應用的入口,維護管理所有AI Agent、MCP Server和LLM的路由規則,確保每個請求都能快速、準確地找到處理路徑,同時支持流式響應,為用戶帶來更流暢的交互體驗。
- Agent托管:開發者可通過多種方式自建Agent,CAE為Agent提供了理想的Serverless應用環境,根據負載自動實現資源的動態分配,確保Agent始終處于最佳運行狀態。
- 訪問MCP Server獲取外部數據:MCP Server這類事件驅動型業務尤其適合部署在Serverless函數(FunctionGraph)上,通過Python/Go等語言快速構建MCP Server,實現毫秒級彈性擴縮容。
- 現存業務接入:可經由MCP注冊/配置中心(CSE)的幫助注冊到Nacos上并實現自動注冊發現,MCP網關可以將API轉換成MCP Server,實現應用的平滑升級。
- 通過應用中心模板快速部署Agent/MCP Server:應用中心匯聚豐富的Agent/MCP應用模板,開發者只需一鍵操作即可部署,實現開箱即用。華為云也會將中間件(DCS、DMS、EventGrid)等服務能力以預置MCP Server的方式上架到應用中心。
- 異步推理:在多模態或長周期任務執行場景下,Agent往往采用異步推理的方式與LLM進行交互,消息隊列不僅能夠起為大模型起到削峰填谷的作用,而且支持主動推送方式提升LLM響應的實時性。
Serverless與MCP融合創新,構建AI應用全新智能中樞
從上面的整體方案我們可以看到MCP Server無疑是整個AI應用架構新范式的智能中樞,如何就保障MCP Server安全可靠運行與彈性高效擴展顯得至關重要。
傳統本地搭建MCP Server存在挑戰:
- 在傳統的MCP Server部署模式下,資源靜態分配問題尤為突出。企業在搭建MCP Server時,需要提前預估流量峰值,以確定所需的資源,但由于業務的不確定性,預估流量往往與實際流量存在較大偏差,導致資源的浪費或性能瓶頸。在業務淡季,大量的服務器資源處于閑置狀態,造成了成本的浪費,而在業務高峰期,由于資源不足,MCP Server可能會出現卡頓甚至崩潰,影響用戶體驗。
- 開發成本高。從底層的資源搭建到上層的MCP邏輯實現,都需要投入大量的人力和時間,僅開發部分工作量就需要幾天時間,且還不包括后續的測試和部署工作。開發者還需要重復實現鑒權、日志等通用功能,進一步增加了開發的復雜性和成本。
- 安全風險同樣不容忽視。在傳統的常駐服務模式下,服務進程會一直運行,這就可能導致上下文殘留,增加了數據泄露的風險,一旦服務器被攻擊,攻擊者就有可能獲取到殘留的上下文信息,從而竊取敏感數據,給企業帶來巨大的損失。
Serverless函數:MCP Server托管的最優解決方案
Serverless函數計算作為云上Serverless算力的典型代表,在資源彈性、開發效率、安全性等方面具備顯著優勢,可以為MCP Server的托管提供靈活、高效、可靠的運行時環境,直擊傳統搭建MCP Server的核心痛點。
- 資源智能彈性調度,Serverless函數計算能夠根據實際流量自動調整資源配置。根據函數的負載情況,通過自動化、智能化的資源擴縮容彈性機制,自動完成函數規格的調整,毫秒級彈性輕松應對突發流量沖擊,確保服務的穩定運行。而在流量較低時,空閑函數會自動休眠,成本趨近于零,大大降低了企業的運營成本。
- 極簡開發部署與運維。應用中心提供了預置的MCP應用模板,如server-github等,開發者只需進行簡單的配置,即可在30秒內完成MCP Server部署。Serverless函數計算還具備免運維的特性,自動處理日志、監控、擴縮容等,讓開發者能夠專注于業務邏輯開發,大幅度提高了開發效率和質量。
- 運行安全保障。業務每個請求都在獨立的沙箱環境中執行,執行后自動銷毀實例,有效防止了上下文殘留帶來的數據泄露風險。同時支持細粒度權限控制,根據最小化原則授權,只賦予每個請求所需的最小權限,降低了權限濫用的風險。支持臨時Token認證,進一步增強了認證的安全性和靈活性。
Serverless與MCP結合實踐場景演示
傳統大語言模型,就像一個有大腦會思考、有嘴巴會講話的機器人,它可以解答我們各種問題,教我們如何完成一件事,但是它沒有手和腳,不能直接去完成各種事情,現如今各種各樣的MCP Server就如同大模型的手和腳,讓其具備了這樣的能力。這里我們以MCP官方提供的Everything MCP Server來演示如何讓大模型通過調用MCP工具獲取環境中的環境變量。
以大模型DeepSeek V3演示具體的工具調用,當我們沒有啟用MCP時,向大模型提問可以看到他只能告訴我們如何完成這件事,而不能親自去做。
而當我們啟用MCP后,可以看到大模型調用了printEnv工具并正確獲取到了所有環境變量。
MCP與Serverless的創新融合,正在重塑著AI應用架構的未來格局,將為AI應用帶來更高的靈活性、安全性和效率,為企業和開發者提供更便捷、高效的開發方式,賦能加速AI應用的創新和落地。
緊跟智能化時代AI技術的飛速發展,華為云AI原生應用運行平臺+MCP整體產品組合方案,未來還可以與智能化研發、AI Agent開發、AIOps應用可觀測、應用韌性評估體系等能力相結合,在生態方面和鴻蒙開發者平臺、華為云開發者空間相結合。實現“開發-運行-運維”全鏈路的AI應用新范式,為AI原生應用提供一站式極簡的構建能力,讓開發者能夠更專注于業務創新,推動AI應用的快速發展和廣泛應用。?
后續我們將持續推出核心產品組件與MCP結合的系列應用場景與方案,產品能力也將逐步上線,歡迎持續關注。