AI重塑云基礎設施,亞馬遜云科技打造AI定制版IaaS“樣板房”

AI正在徹底重塑云基礎設施。

IDC最新《2025年IDC MarketScape:全球公有云基礎設施即服務(IaaS)報告》顯示,AI正在通過多種方式重塑云基礎設施,公有云IaaS有望繼續保持快速增長,預計2025年全球IaaS的整體規模將達到1880億美元。

那么,為什么這一輪的AI浪潮對于云基礎設施變革有如此大的影響力?從全球云計算領導者亞馬遜云科技的轉變便能一窺究竟。IDC認為,亞馬遜云科技在可擴展性方面的卓越表現、成熟的開發者社區以及對AI基礎設施的積極投入,使其成為需要先進云能力的企業的首選。

AI從四個方面重塑云基礎設施

傳統云計算以CPU通用計算為核心,滿足于各種應用的存儲與計算需求。然而,隨著AI大模型近年來的迅速崛起,以及智能體(AI Agent)大量涌現,AI對于AI對GPU、NPU等異構算力的依賴遠超預期,并且直接驅動著云基礎設施走向變革。

IDC在該報告中指出,AI正通過多種方式重塑云基礎設施,主要包括四個方面:

其一、AI帶來大量的異構算力需求,直接驅動著亞馬遜云科技等所有云服務商對GPU、TPU和FPGA等專用硬件進行大量投資;

其二、AI相關技術正在迅速融入云基礎設施日常的管理運維之中,由于云服務商的基礎設施規模龐大,借助AI技術能夠有效改善基礎設施的運營效率和成本;

其三、AI正在推動云安全體系的升級,企業需要以AI驅動型安全工具來響應日益復雜的威脅;

其四、云服務商需要利用AI技術來對需求預測,并優化資源分配,推動開發AI驅動的服務與應用等。

與過去相比,云基礎設施的確正在產生一系列的變化,AI對于云基礎設施的運維、安全等影響尤為重要。那么,在生成式AI帶動的這一輪AI浪潮中,AI的訓練、推理乃至應用都需要龐大的算力支撐,企業在未來的數字化轉型中,應該如何合理的選擇基礎設施?又應該如何選擇合理的云服務商?

對此,IDC在報告中也給出具體建議。IDC認為,重點需要考慮部署決策的原則、AI功能的集成度以及系統可觀測性相關的安全性:工作負載部署決策不能僅局限于成本考量,服務集成度、供應商服務的廣度,以及對互操作性和開放標準的支持力度,均至關重要;將AI功能集成到云基礎設施中也越來越成為一個關鍵的差異化因素;建議優先選擇具備強大開箱即用安全功能,且對系統可觀測性有全面方案的供應商。

亞馬遜云科技領跑全球IaaS市場

回顧云計算將近二十年的發展歷史,基礎設施乃云服務商最為核心的競爭力之一,基礎設施的覆蓋范圍與規模、運維管理能力、資源調度分配能力以及對于現代化應用的支持能力直接決定著云服務商提供各類云服務的質量。

作為云計算一哥,亞馬遜云科技自成立以來,就極為重視基礎設施的建設、迭代和演進,在基礎設施覆蓋的范圍、以及IaaS領域涵蓋的核心服務如計算、網絡、安全等多個方面進行持續擴展及創新。

進入到AI時代,亞馬遜云科技繼續引領云基礎設施的變革。今年2月份財報會議,亞馬遜宣布將在2025年資本投資投入1000億美元,其中大部分將用于亞馬遜云科技AI基礎設施的建設等,其金額大幅領先其他競爭對手,足以表明亞馬遜云科技對于AI和云基礎設施的重視。

在本次IDC報告中,亞馬遜云科技也被評為“領導者”,并且在能力和戰略的雙維度上均為“領導者”。亞馬遜云科技在服務范圍方面無可匹敵,豐富的服務種類使亞馬遜云科技對需要專業能力、混合基礎設施或高度可擴展應用程序的企業具有吸引力。當需要最廣泛的云服務組合以及經過驗證的可擴展性和創新能力時,可以考慮亞馬遜云科技。

仔細分析,亞馬遜云科技之所以能夠領跑全球IaaS市場,關鍵在于其基礎設施的覆蓋度、強大的自研芯片能力、領先的網絡架構以及高標準的安全體系,從多個方面建立起業界領先的云基礎設施。

首先,亞馬遜云科技已經建成全球覆蓋規模的基礎設施遍及36個地理區域的114個可用區,后續還計劃在新西蘭和沙特阿拉伯等新建4個區域、12個可用區。為支持AI應用對于基礎設施帶來的種種挑戰,亞馬遜云科技持續推動數據中心創新,包括簡化電氣和機械設計,在冷卻、機架設計和控制系統進行創新。簡化的電力分配和機械系統能夠實現高達99.9999%的基礎設施可用性,并將可能受到電氣問題影響的機架數量減少89%;更新后的冷卻系統將無縫集成空氣和液體冷卻功能,用于支持AI超級計算解決方案,以最低的成本為客戶提供最佳性能和效率。由數據和生成式AI驅動的軟件能夠精確預測服務器最佳部署方式,以最大化電力使用效率等。

其次,亞馬遜云科技一直砸加速“自研芯片”的創新。眾所周知,隨著AI大模型開始進入到各行各業之中,越來越多用戶需要包括推理等各類算力。如何高效、便捷、合理成本地為用戶提供各種AI算力需求,就成為云服務商接下來重點角逐的領域。

亞馬遜云科技的法寶是堅持“自研芯片”,推出多個系列的自研芯片,包括Amazon Nitro系統、通用處理器芯片Amazon Graviton、機器學習訓練芯片Amazon Trainium和推理芯片Amazon Inferentia等一系列自研芯片。在訓練方面,Amazon EC2 Trn2實例與當前基于GPU的EC2 P5e和P5en實例相比,性價比提升30-40%;單實例配備16個Trainium2芯片,可提供高達20.8 Petaflops浮點算力的性能,非常適合訓練和推理高達數十億參數的大型語言模型。

第三,AI對于計算帶來變革,也驅動著網絡不斷突破。AI 算力如何更加高效地發揮生產價值,僅僅依靠AI芯片的簡單堆砌是萬萬行不通,AI 計算網的重要性也與日俱增,直接決定著整個AI集群的效率。亞馬遜云科技在網絡集群的創新也堪稱業界典范。

亞馬遜云科技第二代UltraCluster網絡架構,也稱為"10p10u"網絡,支持超過20,000個GPU協同工作,帶寬達10Pb/s,延遲低于10μs(微秒),這一突破性的性能躍遷將模型訓練時間縮短至少15%。同時還推出了兼具中央控制和優化及分布式的速度和彈性的SIDR(Scalable,Intent Driven Routing)全新網絡路由協議。相比傳統的BGP、OSPF等協議,SIDR在亞馬遜云科技的10p10u網絡中能在不到1秒內恢復網絡,速度比傳統方法快10倍,顯著提升了分布式AI訓練中的可靠性和實時性,確保網絡在故障發生時也能保持高效運行。10p10u是亞馬遜云科技有史以來擴展最快的網絡,在2024年,安裝了超過300萬條鏈路。

第四,隨著生成式AI崛起,安全態勢也在發生深刻變化,攻擊側、防守側乃至監管側都在積極探索AI在安全領域的應用,甚至衍生出數據、模型和應用等一系列安全挑戰。亞馬遜云科技認為“安全是設計出來的”,無論是基礎設施還是服務,從設計之初就應該將安全作為首要任務,并嵌入到從架構到操作的各個環節,從而為客戶提供靈活、安全的云計算環境。

為此,亞馬遜云科技采取的思路是在每個區域的基礎設施采用同樣最高安全標準進行構建和運營,所有用戶均可基于同樣安全的基礎設施進行創新。此外,亞馬遜云科技還不斷使用創新技術提升基礎設施的安全性,例如亞馬遜云科技通過自動推理技術實現以可驗證的方式提升系統的可觀測性,為關鍵系統按預期運行提供了嚴格的數學保證。這些經過自動推理驗證的基礎設施和云服務,不僅能夠提高客戶云上構建的安全性,還能更快提供更高性能的代碼,并最終節約成本。

綜合觀察,幾年前有人認為云計算正在走向同質化,隨著AI的崛起,AI算力需求的持續涌現,云基礎設施也迎來了巨大的發展空間,這無疑為亞馬遜云科技這樣的廠商帶來了極大的創新舞臺。面向未來,隨著千億美元投資的落地,亞馬遜云科技有望成為AI時代的創新高地,幫助各行各業催生新一輪創新浪潮。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/900434.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/900434.shtml
英文地址,請注明出處:http://en.pswp.cn/news/900434.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

高效深度學習lecture01

lecture01 零樣本學習(Zero-Shot Learning, ZSL): 模型可以在沒有見過某種特定任務或類別的訓練樣本的情況下,直接完成對應的任務 利用知識遷移 模型在一個任務上訓練時學到的知識,能夠遷移到其他任務上比如,模型知道“狗”和“…

使用 iPerf 測試內網兩臺機器之間的傳輸速度

在現代網絡管理中,確保內部網絡(內網)的高效運行是至關重要的。為了評估和優化網絡性能,我們需要一種可靠的方法來測試內網中不同設備間的傳輸速率。iPerf 作為一款廣泛使用的工具,能夠幫助我們準確測量兩個節點之間的…

視頻設備軌跡回放平臺EasyCVR如何搭建公共娛樂場所遠程視頻監控系統

一、背景介紹 由于KTV、酒吧、足療店等服務場所人員流動頻繁、環境復雜,一直是治安管理的重點區域。為有效打擊 “黃賭毒”、打架斗毆、尋釁滋事等違法犯罪的活動,打造安全有序的娛樂消費環境,我國相關部門將加大對這類場所的清查與管控力度…

vue進度條組件

<div class"global-mask" v-if"isProgress"><div class"contentBox"><div class"progresstitie">數據加載中請稍后</div><el-progress class"progressStyle" :color"customColor" tex…

Css:如何解決絕對定位子元素內容被父級元素overflow:hidden屬性剪裁

一、問題描述 今天小伙伴提了一個bug&#xff0c;在點擊列表項的“…”按鈕應該出現的懸浮菜單顯示不完整&#xff1a; 二、問題排查 一般這種問題&#xff0c;是由于懸浮菜單采用的是絕對定位&#xff0c;而父級采用了overflow:hidden屬性。但需要注意的是&#xff0c;這里的…

JavaScript基礎--01-JS簡介

字面量&#xff1a;數字、字符串、布爾值 前言JavaScript背景Web前端有三層&#xff1a;發展歷史JavaScript的發展&#xff1a;蒸蒸日上 JavaScript介紹JavaScript入門易學性JavaScript是腳本語言JavaScript的組成 JavaScript 的特點特點1&#xff1a;解釋型語言特點2&#xff…

[leetcode] 面試經典 150 題——篇9:二叉樹(番外:二叉樹的遍歷方式)

二叉樹的遍歷是指按照某種順序訪問二叉樹中的每個節點。常見的遍歷方式有四種&#xff1a;前序遍歷&#xff08;Pre-order Traversal&#xff09;、中序遍歷&#xff08;In-order Traversal&#xff09;、后序遍歷&#xff08;Post-order Traversal&#xff09;以及層序遍歷&am…

es基本概念

Elasticsearch 的架構與基本概念 Elasticsearch&#xff08;簡稱 ES&#xff09;是一個開源的分布式搜索和分析引擎&#xff0c;基于 Apache Lucene 構建。它被廣泛用于全文搜索、日志分析、實時數據分析等場景。以下是其架構概述及其基本概念的詳細解釋。 Elasticsearch 的架…

《星環之城:量子迷霧下的網絡安全戰記》

點擊下面圖片帶您領略全新的嵌入式學習路線 &#x1f525;爆款熱榜 88萬閱讀 1.6萬收藏 序章&#xff1a;星環之隕 公元2145年&#xff0c;人類在火星軌道上建造了“星環之城”——一座由量子網絡連接的太空城邦。它的中樞AI“蓋婭”掌控著地球與殖民地的數據洪流&#xff…

《全棧+雙客戶端Turnkey方案》架構設計圖

今天分享一些全棧雙客戶端Turnkey方案的架構與結構圖。 1&#xff1a;三種分布式部署方案:網關方案&#xff0c;超級服務器單服方案&#xff0c;直連邏輯服方案 2: 單服多線程核心架構: 系統服務邏輯服服務 3: 系統服務的多線程池調度設計 4:LogicServer Update與ECS架構&…

打破界限:Android XML與Jetpack Compose深度互操作指南

在現有XML布局項目中逐步引入Jetpack Compose是現代Android開發的常見需求。本指南將全面介紹混合使用的最佳實踐、技術細節和完整解決方案。 一、基礎配置 1.1 Gradle配置 android {buildFeatures {compose true}composeOptions {kotlinCompilerExtensionVersion "1.5.3…

React-narice安卓打包流程

**1. 生成簽名密鑰 在項目的 android/app 目錄下生成簽名密鑰的步驟&#xff1a; 打開終端或命令提示符&#xff1a;導航到您的 React Native 項目的 android/app 目錄。 運行以下命令生成密鑰庫文件&#xff1a; keytool -genkeypair -v -keystore my-release-key.keystor…

嵌入式AI開源生態指南:從框架到應用的全面解析

嵌入式AI開源生態指南&#xff1a;從框架到應用的全面解析 引言 隨著人工智能技術的迅速發展&#xff0c;將AI能力部署到邊緣設備上的需求日益增長。嵌入式AI通過在資源受限的微控制器上運行機器學習模型&#xff0c;實現了無需云連接的本地智能處理&#xff0c;大幅降低了延…

深度學習中模型量化那些事

在深度學習中模型量化可以分為3塊知識點&#xff0c;數據類型、常規模型量化與大模型量化。本文主要是對這3塊知識點進行淺要的介紹。其中數據類型是模型量化的基本點。常規模型量化是指對普通小模型的量化實現&#xff0c;通常止步于int8的量化&#xff0c;絕大部分推理引擎都…

Redis-list類型

這里只是介紹命令使用 列表是用來存儲多個有序的字符串 可以用來充當棧和隊列的角色 列表特點: 列表中的元素是有序的,可以通過索引下標來獲取某個元素或者某個范圍的元素 獲取和刪除有區別 元素可以重復 命令 LPUSH 將一個或者多個元素從左側放入到list中(頭插法) lp…

Business English Certificates (BEC) 高頻詞匯背誦

Business English Certificates {BEC} 高頻詞匯背誦 References Cambridge English: Business Certificates, also known as Business English Certificates (BEC), are a suite of three English language qualifications for international business. abandon /??bnd?n/ …

第十四屆藍橋杯省賽真題解析(含C++詳細源碼)

第十四屆藍橋杯省賽 整數刪除滿分思路及代碼solution1 &#xff08;40% 雙指針暴力枚舉&#xff09;solution 2&#xff08;優先隊列模擬鏈表 AC&#xff09; 冶煉金屬滿分代碼及思路 子串簡寫滿分思路及代碼solution 1&#xff08;60% 雙指針&#xff09;solution 2&#xff0…

AI Agent開發大全第二十一課-如何開發一個MCP(從0開發一個MCP Client)

開篇 上一章《AI Agent開發大全第二十課-如何開發一個MCP(從0開發一個MCP Server)》里我們講了如何從0開始開發一個MCP Server。可以看到文中大量細節為MCP發明者官網Claude都不曾或者是遺漏的,而且還有那么多點遺漏,想要真正要在企業生產級環境使用MCP是需要做分布式開發的…

TypeScript面試題集合【初級、中級、高級】

初級面試題 什么是TypeScript&#xff1f; TypeScript是JavaScript的超集&#xff0c;由Microsoft開發&#xff0c;它添加了可選的靜態類型和基于類的面向對象編程。TypeScript旨在解決JavaScript的某些局限性&#xff0c;比如缺乏靜態類型和基于類的面向對象編程&#xff0c…

無錫無人機駕駛證培訓費用

無錫無人機駕駛證培訓費用&#xff0c;隨著科技的迅速發展&#xff0c;無人機在眾多行業中發揮著舉足輕重的作用。從影視制作到農業監測&#xff0c;再到物流運輸與城市規劃&#xff0c;無人機的應用場景不斷擴展&#xff0c;因此越來越多的人開始意識到學習無人機駕駛技能的重…