為何說分布式 AI 推理已成為下一代計算方式

2024 年,我們見證了人工智能創新的空前爆發。AI 的快速發展令很多人驚嘆,為了訓練更先進的大語言模型(LLM),科技巨頭爭相獲取強大的 GPU。如今,AI 正在無縫融入我們世界的每個角落。

image.png

在眾多新興 AI 公司、模型和應用的浪潮中,有個趨勢愈發清晰:AI 的重點正在從訓練轉向推理。彭博社預測,到 2032 年,AI 推理市場規模將增至 1.3 萬億美元,這一觀點也得到了很多最新報告的支持。市場的這一變化表明,2025 年將成為加速分布式 AI 推理發展的關鍵一年。

“持續改進” 和 “不斷適應” 的往復循環

盡管在打造強大 AI 模型的過程中,訓練工作仍將發揮關鍵作用,但未來的重點將會是推理:即部署這些模型,進而為企業和消費者提供實時、可行的見解和結果。同時,通過從邊緣設備將動態數據回饋至訓練過程,推動模型持續改進與適應,形成一個不斷優化的循環。

AI 推理的應用方式

AI 推理是人工智能從 “畫在紙上的餅” 轉變為實際應用并產生現實影響的關鍵環節。Akamai 的客戶正在多個行業和應用場景中利用 AI 推理,包括:

  • 智慧城市:?優化交通流量以減少擁堵并提升安全性,通過智能監控改善公共安全。
  • 自動駕駛車輛:?實現瞬時決策,促進高效的車隊編排。
  • 工業物聯網與制造業:?實施預測性維護以防止停機,通過實時視頻分析提升質量控制。
  • 智能零售:?提供個性化購物體驗,并通過智能結賬和庫存管理優化運營。
  • 醫療與遠程醫療:?實時監測患者健康狀況,通過圖像處理加速醫學診斷,支持先進的可穿戴設備。
  • 媒體娛樂:?定制個性化內容,實現實時視頻轉碼和直播增強。

這些示例只是客戶借助 AI 推理所能實現的廣泛應用的冰山一角。隨著邊緣計算不斷發展,預計將在各個行業看到更多創新性的應用。

AI 推理的常見挑戰

這種創新也帶來了一些常見挑戰,包括延遲、成本和可擴展性。多年來,Akamai 始終致力于解決這些問題。

將大量通用且性能過剩的 GPU 集中在數據中心的方式,已無法滿足大眾對高效 AI 推理的規模化和響應速度的需求。我們需要采用全新范式,使推理架構更貼近用戶,也就是要通過分布式云模型來實現。

通過分布式云模型實現 AI 推理

在采用分布式云模型提供 AI 推理時,需要考慮一些獨特因素,包括:

  • 延遲與響應速度:在集中式云數據中心之間傳輸數據會影響用戶體驗,并可能導致業務機會流失。去中心化的分布式架構則可提升推理響應速度。
  • 資源約束:邊緣設備在功耗、存儲和計算能力方面存在限制。因此無比要通過部署輕量化、更高效的 AI 模型來實現強大的性能。
  • 安全與數據隱私:本地數據處理可減少數據在傳輸過程中的暴露,從而增強安全性。這對醫療、金融和政府等需遵守嚴格數據本地化和隱私法規的行業尤為重要。
  • 可擴展性與分布式架構:隨著托管 AI 應用的分布式位置數量增加,跨網絡管理和更新 AI 模型的復雜性也隨之上升。因此,必須要能提供可擴展的模型部署和維護解決方案。
  • 帶寬與成本效益:去中心化 AI 推理可大幅減少傳輸至集中式云服務器的數據量,不僅能緩解網絡擁堵,還能顯著降低數據傳輸和存儲成本。

這些因素是在分布式、去中心化云基礎設施上部署 AI 時的關鍵考量,所有希望高效利用 AI 的企業都應重點關注。

image.png

Akamai 強大生態系統帶來卓越的性能和可擴展性

Akamai 致力于構建全球分布的云。我們的全球基礎設施經過近 30 年發展,已容納超過 25 個核心計算區域、快速擴展的分布式計算位置,以及超過 4000 個邊緣節點。這一強大生態系統已經為滿足企業在當前和未來 AI 推理需求做好了準備。

我們意識到,盡管客戶對高性能有很高需求,但他們也越來越擔心傳統云服務商常見的高額成本超支。Akamai 云旨在解決這一日益增長的問題。

我們并沒有沿襲傳統做法囤積昂貴的通用 GPU,這些 GPU 對 AI 推理任務來說往往過于強大。相反,我們為客戶提供了一種平衡的 GPU 替代方案:Nvidia RTX 4000 Ada 系列 GPU。這些 GPU 兼具性能和成本效益,非常適合 AI 推理、運行小型語言模型以及處理像媒體轉碼這樣的專用工作負載。

強大但不失成本效益的方法

這種方法使我們能將卓越的 AI 能力更貼近用戶,同時保持對客戶的成本效益。我們的測試顯示,在運行生成式 AI 類 Stable Diffusion 模型時,與傳統公有云服務商提供的同類 GPU 替代方案相比,我們的成本節省幅度超過了 80%。

相信這種方法能帶來最強大且兼具成本效益的結果,并能夠推動新的 AI 應用場景繼續發展。

分布式推理是使用 AI 的全新構想

隨著 AI 的實用性不斷提升,Akamai 認為:分布式推理不僅僅是技術的進步,更是對 AI 使用方式的根本性重新構想。從集中的資源密集型計算轉向更高效的分布式邊緣計算,這一轉變已經在不知不覺中開始了。

Akamai 不僅在觀察這一變革,也在積極塑造這場變革。通過將遍布全球的分布式網絡、戰略性的云計算投資(包括圍繞推理工作進行優化的 GPU)以及對性能和成本效益的深刻理解等因素緊密結合在一起,Akamai 正專注于幫助企業釋放 AI 推理的真正潛力。

很多企業也已經意識到,對于采用 AI 推理這件事,真正的問題已經不再是 “是否”,而是 “如何”。邊緣不再僅僅是數據的目的地,而是正成為 AI 提供最具影響力、實時見解的主要領域。歡迎進入計算的下一世代。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/91418.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/91418.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/91418.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

阿里云 RabbitMQ 可觀測性最佳實踐

阿里云 RabbitMQ 阿里云 RabbitMQ 是一款高性能、高可靠的消息中間件,支持多種消息協議和豐富的功能特性。它提供消息隊列功能,能夠實現應用間的消息解耦和異步通信,提升系統擴展性和穩定性。其支持多種消息持久化策略,確保消息不…

vue-router 導航式編程 參數的設置

主要是想記錄一下this.$router.push、replace、go等方法的參數如何設置。字符串路徑router.push(/home)直接使用字符串(或模板字符串)路徑,可跳轉到相應的URL路徑。對象式路徑路徑也可以是一個對象,對象里以key:value的形式表示UR…

Swift實現股票圖:從基礎到高級

目錄一、核心實現方案1. 原生方案:使用 Core Graphics 繪制2. 使用第三方庫:Charts3. 跨平臺方案:使用 SwiftUI Canvas二、技術指標實現1. 移動平均線 (MA)2. 布林帶 (Bollinger Bands)3. MACD (Moving Average Convergence Divergence)三、…

【unitrix】 6.4 數特征(number.rs)

一、源碼 這段代碼定義了一個名為Number的trait&#xff08;特質&#xff09;以及它的實現。 use crate::sealed::Sealed; use crate::number::{V, BaseNumber, TNumber};/// 數值的統一標記特質 /// 可以是編譯時類型化數字(TNumber)或運行時變量(V<T>) pub trait Numbe…

AI治AI:大語言模型自檢新法

“以火攻火”的思路解決大語言模型(LLMs)“幻覺”問題 虛構是由于與提示無關的內部因素而不可預測地從 LLM 中出現的幻覺。作者專注于衡量 LLM 對提示響應的不確定性,使用高不確定性表示虛構的假設。他們通過計算一個稱為熵的量來估計這種不確定性**,熵可以被認為是模型生…

ESLint 配置錯誤:ReferenceError: prettier is not defined 解決方案

問題描述在使用 pnpm lint 運行 ESLint 時&#xff0c;出現以下錯誤&#xff1a;Oops! Something went wrong! :( ESLint: 9.31.0 ReferenceError: prettier is not defined該錯誤導致 ESLint 無法正確執行代碼格式檢查&#xff0c;但 不會影響項目的實際運行&#xff08;如 pn…

數據結構--準備知識

一.算法效率算法效率分為兩種&#xff1a;第一種為時間效率&#xff0c;第二種為空間效率。時間效率稱為時間復雜度&#xff0c;空間效率稱為空間復雜度。時間復雜主要衡量一個算法的運行速度&#xff0c;空間復雜度主要衡量一個算法所需的 額外的空間&#xff08;現在不需要特…

HTML 入門教程:從零開始學習網頁開發基礎

一、HTML簡介 1.1 什么是HTML&#xff1f; HTML全稱是Hyper Text Markup Language&#xff08;超文本標記語言&#xff09;&#xff0c;由Tim Berners-Lee和同事Daniel W. Connolly于1990年創立。它是一種用于創建網頁的標準標記語言&#xff0c;而不是編程語言。 1.2 HTML的…

使用 bat 批量創建帶有項目前綴名的文件夾結構

在項目管理中&#xff0c;經常需要為每個新項目創建一套標準化的文件夾結構。如文檔中所述&#xff0c;用戶希望為每個項目&#xff08;如"Project 1"、“Project 2”&#xff09;創建以下結構的文件夾&#xff1a; project-1_export\project-1_DWG project-1_expo…

Python類中魔術方法(Magic Methods)完全指南:從入門到精通

文章目錄Python類中魔術方法(Magic Methods)完全指南&#xff1a;從入門到精通一、魔術方法基礎1. 什么是魔術方法&#xff1f;2. 魔術方法的特點二、常用魔術方法分類詳解1. 對象創建與初始化2. 對象表示與字符串轉換3. 比較運算符重載4. 算術運算符重載5. 容器類型模擬6. 上下…

H3CNE綜合實驗之五角星

H3CNE綜合實驗之五角星 實驗拓撲圖交換機地址規劃表&#xff1a;SW6G1/0/1Vlan100:10.1.3.2/24G1/0/2Vlan90:10.1.4.2/24G1/0/3Vlan50:10.1.5.1/24G1/0/4Vlan60&#xff1a;10.1.6.1/24SW7G1/0/1Vlan50:10.1.5.2/24G1/0/2Vlan30:192.168.3.1/24G1/0/6Vlan70:10.1.1.2/24G1/0/3-…

Android EventBus使用方法與底層原理詳解

EventBus 是什么&#xff1f; EventBus 是一個基于發布/訂閱&#xff08;Publish/Subscribe&#xff09; 模式的開源庫&#xff08;主要由 greenrobot 開發維護&#xff09;。它的核心目的是簡化 Android 應用中不同組件&#xff08;如 Activity, Fragment, Service, Thread 等…

初等數論簡明教程

初等數論簡明教程 本文給出初等數論中的一些重要的定理與例題&#xff0c;證明風格采用 整除線法 與 命題節點法。 整除線法 指推理的第 nnn 步左邊的字符可由前面左邊的字符得到&#xff0c;右邊的字符可由前面右邊的字符得到&#xff0c;整除線變成了推理線&#xff0c;既少…

Spring之核心容器(IoC,DI,基本操作)詳解

Spring之核心容器IoC/DI/基本操作詳解一、核心概念&#xff1a;IoC與DI的本質1.1 IoC&#xff08;Inversion of Control&#xff0c;控制反轉&#xff09;傳統開發模式&#xff08;無IoC&#xff09;IoC模式&#xff08;Spring容器管理&#xff09;1.2 DI&#xff08;Dependenc…

【論文閱讀】基于注意力機制的冥想腦電分類識別研究(2025)

基于注意力機制的冥想腦電分類識別研究&#x1f4a1; Meta DataTitle基于注意力機制的冥想腦電分類識別研究Authors周梓涵Pub. date2025&#x1f4dc; Research Background & Objective背景&#xff1a; 現代生活壓力導致心理問題日益突出&#xff0c;冥想作為一種有效的心…

GitHub 上 Star 數量前 8 的開源 Web 應用項目

原文鏈接&#xff1a;https://www.nocobase.com/cn/blog/github-open-source-web-applications。 近期&#xff0c;我們發布了多篇「Top GitHub Star 開源項目推薦」系列文章&#xff0c;受到了大量點贊與收藏&#xff0c;很多開發者留言表示希望能看到更多不同領域的開源工具推…

FATFS文件系統原理及其移植詳解

一、FATFS簡介 FATFS 是一個完全免費開源的 FAT/exFAT 文件系統模塊&#xff0c;專門為小型的嵌入式系統而設計。它完全用標準 C 語言&#xff08;ANSI C C89&#xff09;編寫&#xff0c;所以具有良好的硬件平臺獨立性&#xff0c;只需做簡單的修改就可以移植到 8051、PIC、A…

KubeRay 和 Ray

KubeRay 和 Ray 不是替代關系&#xff0c;而是互補的協作關系。兩者在分布式計算生態中扮演不同角色&#xff0c;共同構成完整的云原生 AI 解決方案。以下是具體分析&#xff1a;&#x1f527; 1. 核心定位差異Ray 是分布式計算引擎&#xff0c;提供底層 API&#xff08;如 ray…

破解輪胎倉儲高密度與柔性管理難題

輪胎作為特殊的大件異形工業品&#xff0c;其倉儲管理長期面臨多重挑戰&#xff1a;規格型號繁雜導致SKU數量龐大&#xff0c;重型載重對貨架承重提出極高要求&#xff0c;橡膠材質對防壓變形、避光防老化等存儲環境存在嚴苛標準。傳統平置堆垛或普通貨架方案不僅空間利用率不足…

EVA series系列(上)

目錄 一、EVA 1、概述 2、方法 二、EVA-02 1、概述 2、架構 三、EVA-CLIP 1、概述 2、方法 四、EMU 1、概述 2、架構 3、訓練細節 4、評估 一、EVA 1、概述 為探尋大規模表征學習任務的MIM預訓練任務在ViT基礎上擴展到1B參數量規模&#xff0c;結合10M級別&am…