產品經理的大語言模型課 04 -模型應用的云、邊、端模式對比

目錄

    • 算力部署方式的影響因素
      • 數據量
      • 計算難度
      • 前期投入
      • 數據隱私
      • 應用規模與泛化能力
    • 云、邊、端部署的特點和對比
    • 典型場景舉例
      • 社區人臉門禁
      • 后廚老鼠識別
    • 未來展望

算力部署方式的影響因素

最近和人工智能從業者進行了非常廣泛的溝通,嘗試對模型應用的云、邊、端模式進行對比。

2015 年前后語音和圖片相關的人工智能應用逐漸興起,目前在不少通用場景下,都已經有了比較成熟的 AI 應用服務,例如人臉比對、車牌識別等。

而人工智能的落地離不開“計算能力”,或者說算力。考慮到業務場景下各種因素的影響,算力部署的位置選擇就有所不同。

數據量

在很多應用場景中,尤其是與物聯網終端設備相關的場景下,設備采集的數據非常龐大,如果將所有原始數據上傳云端再進行處理,帶寬費用可能遠超計算成本。
以 200 萬像素攝像機為例,即便采用最新的 H.265 編碼,一臺攝像機一天的錄像空間也要 20G 以上。如果所有視頻都進行實時上傳,占用的帶寬就是 2Mb/s,公有云一年的帶寬費用就超過 1000 元。

這時,我們通常會考慮在邊緣側,也就是在設備上,或者局域網內,完成數據的初步篩選和處理,減少上傳云端的數據量。

計算難度

當面臨復雜的計算任務,如人工智能訓練、科學模擬或密碼學運算時,需要強大的算力支持。這導致對高性能硬件的需求增加,如GPU、TPU或高性能CPU集群。
舉個例子,如果你希望部署 DeepSeek R1 滿血版,根據某些供應商提供的部署方案,需要兩張 H20 的顯卡,整體部署費用達到 300 萬以上。
絕大多數的項目都沒有這么充足的預算。

但是有一些簡單的任務,例如圖像識別中的目標標定、文字識別、基本人臉比對等,算法成熟,算力要求也不高,這些任務可能只需要 2T,甚至是 0.5T 的算力。
市面上能夠提供這種能力的芯片供應商則非常多,我們可以選用一些性價比更高的設備。而這些設備放在專業的機房里,占用帶寬資源的同時,又無法提供足夠的計算價值,通常難以為公有云提供商帶來豐厚的利潤,所以他們也無意做這樣的事情。
所以我們可以把這些低算力的設備,部署在邊緣側。

前期投入

正如許多餐飲店由于不知道后續經營效果如何,所以在開店早期,對大部分貴重的設備采用租賃的方式。
當提到通過人工智能降本增效時,絕大多數企業主對服務的效果是不明確的,他們自然希望能夠小成本驗證效果。所以租賃模式就是他們的首選。
而邊緣設備,尤其是存在綁定關系的邊緣設備,其租賃、回收的難度均較大,這類的供應商往往不存在;而云端租賃正是公有云的成熟商業模式,相對容易實現。

數據隱私

在處理醫療、監管、金融等敏感數據時,算力部署必須符合嚴格的安全標準和法規要求。很多項目要求數據不能上傳公網。
同樣因為數據隱私的問題,模型訓練的數據往往不是公開的,這也意味著市面上難有公開訓練的模型,如果客戶自己有充足的數據,自己進行模型的訓練和部署。
那么在這些時候,邊緣化部署就是唯一的選擇。

應用規模與泛化能力

2015 年開始,圖像類的人工智能算法就已經開始發展和商業化嘗試,但十年過去了,我們看到的通用的圖像類人工智能算法并沒有很多。
其中一個重要原因正是標注數據的缺失,導致算法訓練的效果一般,檢出率及檢準率不足,導致難以商用。換言之,除非場景足夠通用、數據量足夠大,都難以訓練出一個有效的算法模型。

由于使用人群較小,需求并發少,云端租賃的商業邏輯不成立,云服務商不愿意提供此類服務。實際上找 ISV 協助開發難度也較大。
同時訓練數據量小,模型泛化能力不足,一種可行的思路是針對特定的場景,進行模型微調訓練,并進行針對性部署,每個場景下的模型都是進行過訓練的。

因此針對使用人群較小、數據量不足的場景,邊緣化部署就變成了更合理的選擇。

云、邊、端部署的特點和對比

人工智能算法落地的算力部署,往往有云、邊、端三種方式:

  • 云端:將計算資源(如CPU、GPU、存儲、網絡等)集中部署在遠程的數據中心,通過互聯網向用戶提供計算服務
  • 邊緣:計算資源部署在靠近數據源或用戶終端的邊緣節點上,這些邊緣節點可以是小型數據中心、基站、路由器、網關等設備,和終端設備在同一個局域網內
  • 終端:計算資源部署在用戶終端設備上,如智能手機、平板電腦、智能攝像頭、物聯網設備等
特性云端邊緣終端
算力強大,無限制中等,4T-200T,通常只支持 INT8較弱,通常小于 4T,通常只支持 INT8,設置 INT4
資源部署靈活,支持租賃靈活固定
模型定制缺乏支持支持
算力浪費較少較少潛在較多
并發處理難處理好處理無并發問題
網絡費用無網絡費用
數據隱私有風險安全安全

典型場景舉例

社區人臉門禁

社區人臉門禁場景是一個典型的智能安防應用,它利用人臉識別技術,實現對社區出入口的智能化管理。可以實現以下功能:

  • 業主刷臉直接進出小區、單元門
  • 訪客在線填寫信息,錄入人臉,
  • 記錄家政、快遞、外賣等人員的出入情況,并進行有效管理

同時我們需要兼顧:

  • 小區業主人臉數據屬于個人隱私數據,在采集、存儲、使用上,需要注意
  • 社區里通常有個機房,機房里已經部署了服務器,作為小區監控、社區服務的載體
  • 如果寬帶供應商除了問題,不應該影響小區業主的使用

為了實現這些功能:

  • 首先需要采集人臉數據,并形成人臉庫
  • 在小區大門、單元門等地,安裝人臉采集設備(門禁等),可以識別人臉
  • 人臉采集后,我們需要通過算法進行人臉比對

因此比較合理的方案架構,可能就是:

  • 云端:負責圖片的初步采集,支持業主、訪客等人員上傳人臉,并下發到社區邊緣計算設備,但不做圖片存儲
  • 邊緣:
    • 對人臉圖片進行編碼,形成特征值,并進行存儲,形成人臉庫
    • 對于終端能力較弱的,可以由邊緣進行人臉比對
    • 對人臉識別記錄進行存儲和匯總、分析
  • 終端:
    • 進行基本的人臉識別、人臉采集
    • 較強的終端可以直接進行人臉比對,并上報識別結果給社區服務器(邊緣)

后廚老鼠識別

后廚是食品加工的關鍵場所,一旦出現鼠患,將極大地增加食品污染的風險。目前食品安全作為政府監管的重要方向,監管需求逐漸提升。
另一方面識別老鼠的行動軌跡,能夠幫助企業規范后廚管理,提升連鎖店運營能力,保護企業形象。

實現上,就是希望在后廚安裝攝像機,或利用原有的攝像機,完成監控畫面采集,并對畫面中有老鼠的畫面和視頻進行識別分析。實現后廚老鼠識別的難點在于:

  • 由于涉及企業形象,公開的后廚老鼠數據往往是缺失的,因此目前老鼠識別算法并不成熟
  • 老鼠目標較小,且形態較多,皮鞋、帽子、桌腿等都可能被識別為老鼠,檢出和檢準率難以同時保障
  • 很多連鎖店無法為終端設備提供免費的網絡環境,需要借助物聯網卡,因此流量費較高

同時我們要綜合考慮終端設備和邊緣計算設備的成本及能力情況:

  • 目前市面上具有老鼠識別功能的攝像機較少,且價格相對較高,而支持定制的能力較弱
  • 具有邊緣計算能力的 AI 盒子供應商較多,產品價格相對較優,且內置 Linux 的系統,可以進行服務定制
  • 以 4T 算力的邊緣盒子為例,可以對 4 路攝像機進行單個算法的視頻分析

所以目前比較合理的方案架構是:

  • 終端(通常是 2-4 路攝像機):
    • 進行初步的篩查,例如移動偵測等
  • 邊緣
    • 作為視頻存儲介質
    • 對鼠患高發時段(夜間)的視頻進行初步篩查,重在檢出而非檢準
    • 將老鼠識別結果上報到云端
    • 其他必要的本地管理能力
  • 云端
    • 作為連鎖經營統一管理平臺
    • 對老鼠檢出結果進行進一步篩查,重在檢準
    • 生成老鼠活動軌跡、老鼠識別報告等

這里做一些額外的延伸。后廚還有一些其他的人工智能應用,例如垃圾桶是否敞開、是否戴口罩、是否戴帽子、是否有抽煙等,都可以通過邊緣計算盒子來完成。
剛剛有提到 4T 算力的邊緣盒子可以對 4 路攝像機進行單個算法的視頻分析。那個如果涉及到多個算法,又不想更換算力更強(更昂貴)的設備該怎么辦?常見的做法有幾種:

  • 從視頻識別改為抽幀圖片識別:視頻每秒可能多達 20 幀,如果改為每秒抽一幀進行分析,能夠大大降低算力要求
  • 訓練多合一的算法:一個算法支持多種目標檢測,比多個只支持單個目標檢測的算法要更經濟
  • 減少識別時間片段:各個服務的重點檢測時段不同,例如鼠患是 0-6 點,工作規范是 10-14 點、16-23 點,我們可以只針對風險高發時段進行檢測

未來展望

我們看得到的趨勢是,隨著技術發展以及計算資源價格的下降,終端和邊緣設備的計算能力會越來越強。
這也意味著很多原先云端才能做的服務,邊緣也可以做了;很多原先邊緣才能做的事情,終端也可以自行處理了。

這種計算模式的轉變,不僅優化了資源配置,也為人工智能的應用帶來了新的可能性。未來,我們或許能看到更多個性化、定制化的人工智能服務,它們將更加貼近我們的需求,讓生活變得更加智能和便捷。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/899892.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/899892.shtml
英文地址,請注明出處:http://en.pswp.cn/news/899892.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于Python設計的TEQC數據質量可視化分析軟件

標題:基于Python設計的TEQC數據質量可視化分析軟件 內容:1.摘要 本文旨在設計一款基于Python的TEQC數據質量可視化分析軟件。隨著全球導航衛星系統(GNSS)的廣泛應用,數據質量的評估變得至關重要。TEQC(TransEditQualityCheck&…

Flinksql--訂單寬表

參考: https://chbxw.blog.csdn.net/article/details/115078261 (datastream 實現) 一、ODS 模擬訂單表及訂單明細表 CREATE TABLE orders (order_id STRING,user_id STRING,order_time TIMESTAMP(3),-- 定義事件時間及 Watermark(允許5秒亂序&#x…

粒子濾波介紹

目錄 粒子濾波的主要流程可以分為以下 5 個步驟: 粒子濾波(PF) vs. ESKF(誤差狀態卡爾曼濾波) 粒子濾波的主要流程可以分為以下 5 個步驟: 初始化(Initialization) 生成 N 個粒子&…

一場國際安全廠商的交流會議簡記

今天參與了一場國際安全廠商A公司組織的交流會議 與會有國際TOP企業跨境企業 還有國內一些頭部商業公司。 A公司很有意思介紹了自己是怎么做安全運營中心SOC的。 介紹了很多內容,包括他們自己的員工量/設備量/事件量/SOC中心人員量,其中人員量只有個位數…

Java面試黃金寶典30

1. 請詳細列舉 30 條常用 SQL 優化方法 定義 SQL 優化是指通過對 SQL 語句、數據庫表結構、索引等進行調整和改進,以提高 SQL 查詢的執行效率,減少系統資源消耗,提升數據庫整體性能的一系列操作。 要點 從索引運用、查詢語句結構優化、數據…

花灑洗澡完畢并關閉后過段時間會突然滴水的原因探究

洗澡完畢后的殘留水 在洗澡的過程中,我們通常會使用到大量的水。這些水會通過花灑管子到達花灑頂噴流出。由于大頂噴花灑的噴頭較大,關閉后里面的存水會更多。 氣壓失衡后的滴水 當花灑關閉后,內部的水管和花灑頭中仍存有一定量的水。由于…

QSettings用法實戰(相機配置文件的寫入和讀取)

很多情況,在做項目開發的時候,將參數獨立出來是比較好的方法 例如:相機的曝光次數、曝光時長等參數,獨立成ini文件,用戶可以在外面修改即可生效,無需在動代碼重新編譯等工作 QSettings便可以實現該功能 內…

運維培訓班之最佳選擇(The best Choice for Operation and Maintenance Training Courses)

運維培訓班之最佳選擇 從面試官的角度聊聊培訓班對運維的幫助,同時給培訓班出身的運維一些建議~ 談到運維(尤其是零基礎非科班轉行的運維)找工作,培訓班是個不可回避的討論熱點。雖然本人也做過兼職運維培訓老師,多少…

網絡安全與防護策略

隨著信息技術的飛速發展,互聯網已成為現代社會不可或缺的一部分。從日常生活到企業運營,幾乎所有活動都離不開網絡。然而,網絡的開放性和廣泛性也使得網絡安全問題愈發嚴峻。無論是個人數據泄露,還是大規模的網絡攻擊,…

LLM 分詞器Tokenizer 如何從 0 到 1 訓練出來

寫在前面 大型語言模型(LLM)處理的是人類的自然語言,但計算機本質上只能理解數字。Tokenizer(分詞器) 就是架在自然語言和計算機數字表示之間的一座至關重要的橋梁。它負責將我們輸入的文本字符串分解成模型能夠理解的最小單元——Token,并將這些 Token 轉換成對應的數字…

【ArcGIS微課1000例】0142:如何從谷歌地球保存高清影像圖片

文章目錄 一、選取影像區域1. 搜索地圖區域2. 導入矢量范圍二、添加輸出圖層三、保存高清影像1. 地圖選項2. 輸出分辨率3. 保存圖像四、注意事項一、選取影像區域 首先需要選取影像區域,可通過以下方式快速定位。 1. 搜索地圖區域 在搜索框內輸入關鍵詞,例如青海湖,點擊【…

Unity注冊表修改分辨率:探索幕后設置與手動調控

Unity注冊表修改分辨率:探索幕后設置與手動調控 在Unity開發中,調整分辨率和顯示模式是開發過程中常見的需求,尤其是當我們打包并運行應用時,可能會遇到顯示模式不符合預期的情況。Unity在首次運行時會自動保存這些設置&#xff…

外部流輸入的 Layer

在 Android 的 SurfaceFlinger 體系中,外部流輸入的 Layer 通常通過 Sideband Stream 或 BufferQueue 機制傳遞給 SurfaceFlinger,然后由 HWC(Hardware Composer)或 OpenGL ES 進行合成。 1. 什么是外部流輸入的 Layer&#xff1f…

31-體測管理系統

介紹 技術: 基于 B/S 架構 SpringBootMySQLvueelementui 環境: Idea mysql maven jdk1.8 node 用戶端功能 1.系統首頁展示輪播圖及公告信息 2.測試項目:展示可以參加測試的項目列表 3.公告信息:公告信息列表及詳情 可進行點贊和收藏 4.在線留言 5.個人…

NVR接入錄像回放平臺EasyCVR視頻系統守護舌尖上的安全,打造“明廚亮灶”云監管平臺

一、方案背景 近年來,餐飲行業食品安全和衛生等問題頻發,比如后廚衛生臟亂差等,持續引發關注,這些事情導致連鎖反應,使其收益遭受損失。同時,給消費者造成了心理和生理上的傷害。 加強餐飲行業的監管成為…

Python辦公自動化(3)對Excel的操作

1.讀取excel文件 1.安裝工具 終端下載讀取excel文檔的工具庫: pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xlrd 若對版本有特殊需求: 刪除當前版本:pip3 uninstall xlrd 下載所需要的版本:pip3 install -i htt…

go語言:開發一個最簡單的用戶登錄界面

1.用deepseek生成前端頁面&#xff1a; 1.提問&#xff1a;請你用html幫我設計一個用戶登錄頁面&#xff0c;要求特效采用科技感的背景渲染加粒子流動&#xff0c;用css、div、span標簽&#xff0c;并給出最終合并后的代碼。 生成的完整代碼如下&#xff1a; <!DOCTYPE h…

blender二次元上色

前&#xff1a; 后&#xff1a;&#xff08;臉自己會發光) 參考&#xff1a;05-模型導入與材質整理_嗶哩嗶哩_bilibili

Mysql+Demo 獲取當前日期時間的方式

記錄一下使用Mysql獲取當前日期時間的方式 獲取當前完整的日期時間有常見的四種方式&#xff0c;獲取得到的默認格式(mysql的格式標準)是 %Y-%m-%d %H:%i:%s其它格式 %Y-%m-%d %H:%i:%s.%f方式一&#xff1a;now()函數 select now();mysql> select now(); -------------…

C#核心學習(六)面向對象--封裝(5)靜態成員及靜態構造函數和靜態類 以及和常量的區別

目錄 一、什么是靜態的&#xff1f;什么是常量&#xff1f; 1. ?靜態&#xff08;Static&#xff09;? 2. ?常量&#xff08;const&#xff09;? 二、類中的靜態成員有什么用&#xff1f; 1. ?共享數據 2. ?工具方法與全局配置 3. ?單例模式 三、靜態類和靜態成…