北大、螞蟻三個維度解構高效隱私保護機器學習:前沿進展+發展方向

在數據隱私日益重要的 AI 時代,如何在保護用戶數據的同時高效運行機器學習模型,成為了學術界和工業界共同關注的難題。

北大團隊最新完成的綜述《Towards Efficient Privacy-Preserving Machine Learning: A Systematic Review from Protocol, Model, and System Perspectives》系統性地梳理了當前隱私保護機器學習(PPML)領域的三大優化維度,首次提出跨協議、模型和系統三個層級的統一視角,為學術界和工業界提供了更加清晰的知識脈絡與方向指引。

本文由北京大學助理教授李萌課題組和螞蟻集團機構的多位研究者共同完成。論文題目及完整作者列表如下:

  • 論文標題:Towards Efficient Privacy-Preserving Machine Learning: A Systematic Review from Protocol, Model, and System Perspectives

  • 論文地址:https://arxiv.org/pdf/2507.14519

團隊還建立了一個長期維護的 GitHub 項目,持續收錄高質量 PPML 文獻,歡迎大家 star,并提出寶貴的意見和補充:

  • 文獻庫:https://github.com/PKU-SEC-Lab/Awesome-PPML-Papers

文章的總體結構如下:

層級一:協議層級優化:

盡管密碼學協議為數據隱私保護提供了嚴格的安全保證,但其應用于人工智能計算,仍面臨巨大開銷。本綜述指出當前協議設計主要存在以下核心痛點:1)基于不經意傳輸(OT)的協議有極高的通信開銷和基于同態加密(HE)的協議面臨嚴重計算瓶頸;2)現有協議忽視模型固有的結構特性(如稀疏性、量化魯棒性),因此缺乏 “模型感知” 的協議設計。

本綜述分別從人工智能模型的線性算子和非線性算子切入,主要討論了基于 OT 和 HE 的協議設計和發展脈絡。綜述中重點回答了在不同場景中,應該使用何種協議以及 HE 編碼方式。綜述還分析了在交互式和非交互式協議框架下的圖級協議,比如秘密分享和 HE 之間的轉換、全同態中的自舉方案。以下是關于編碼方案的總結:

層級二:模型層級優化:

本綜述強調在傳統明文機器學習模型中的設計(如 ReLU 剪枝、模型量化)在 PPML 中往往會導致高昂代價。綜述系統地歸納了當前 PPML 領域的四類模型層優化策略:1)線性層優化:比如高效卷積設計、低秩分解、線性層融合;2)非線性層 ReLU 和 GeLU 優化:比如多項式近似、剪枝和 GeLU 的替換;3)非線性層 Softmax 優化:比如昂貴算子的替換、KV cache 剪枝、注意力頭融合;4)低精度量化,包括 OT 和 HE 友好的量化算法。下表概括了線性層和非線性層的優化方案:

層級三:系統層級優化

本綜述指出,即便協議和模型層級已經得到優化,系統層級若無法 “感知協議特性”,將難以釋放真正性能。綜述中梳理了兩個方向的優化路徑:1)編譯器設計:從協議特性感知、靈活編碼、Bootstrapping 支持等方面展開了討論;2)GPU 設計:分別討論了操作層面加速與 PPML 系統層面的優化,通過對比現有 GPU 加速實現中典型 PPML 工作負載的執行時間,對相關技術進行了總結。

總結

本綜述強調,僅僅在某一層級優化已難以滿足大模型時代對隱私與效率的雙重要求。綜述提出必須從 “跨層級協同優化” 的角度重新設計 PPML 的方案,未來的研究方向包括:1)協議 - 模型 - 系統協同優化和設計;2)構建面向大模型隱私推理的隱私計算方案;3)面向邊緣設備部署的輕量化隱私計算方案。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/94596.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/94596.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/94596.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

計算機網絡:如何在實際網絡中進行子網劃分

在實際網絡中,子網劃分是通過“借位”將一個大的IP網絡分割為多個小的子網,以提高IP地址利用率、增強網絡安全性和簡化管理。以下是具體的實施步驟、原理和注意事項: 一、子網劃分的核心目的 提高IP利用率:避免大網絡中IP地址的浪費(例如一個C類地址默認支持254臺主機,若…

《第五篇》基于RapidOCR的圖片和PDF文檔加載器實現詳解

基于RapidOCR的圖片和PDF文檔加載器實現詳解 引言 在構建知識庫時,我們經常需要處理包含圖片和PDF文檔的數據。這些文檔中的文本信息通常以圖像形式存在,需要通過OCR技術來提取。本文將詳細介紹如何使用RapidOCR技術實現圖片和PDF文檔的文本提取加載器。 核心概念 RapidO…

[硬件電路-122]:模擬電路 - 信號處理電路 - 模擬電路與數字電路、各自的面臨的難題對比?

數字電路和模擬電路是電子技術的兩大基礎分支,它們分別處理不同類型的信號,并在設計方法、元件特性、應用場景等方面存在顯著差異。以下是兩者的詳細定義及異同對比:一、定義與核心概念1. 模擬電路(Analog Circuit)定義…

Linux多線程——線程控制

目錄 1.線程知識補充 1.1 線程私有資源 1.2 線程共享資源 1.3 原生線程庫 2、線程控制接口 2.1 線程創建 2.1.1 一批線程 2.2 線程等待 2.3 線程終止 2.4 線程實戰 2.5 其他接口 2.5.1 關閉線程pthread_cancel 2.5.2 獲取線程 ID pthread_self 2.5.3 線pthread_de…

Python爬蟲實戰:研究spiderfoot工具,構建網絡情報收集系統

1. 引言 1.1 研究背景 在數字化時代,互聯網公開信息已成為國家治理、企業決策與學術研究的戰略資源。據 Statista 統計,2023 年全球互聯網數據總量突破 120ZB,其中可通過公開渠道獲取的情報信息占比超 30%。傳統人工信息收集方式受限于效率與廣度,難以應對海量數據處理需…

在路由器openwrt上安裝openclas

在路由器openwrt上安裝openclas 名詞解釋 las: lash 運行效果圖 安裝 安裝教程參考: 官方:github.com 官方2:openclas.net 如果安裝完成后菜單上沒有,重啟路由后在“服務”菜單下 點擊運行會提示下載內核,按提示…

HIVE 窗口函數處理重復數據

窗口函數row_number(),結合OVER子句中的PARTITION BY和ORDER BY,為數據分組內的每一行生成一個唯一的序號。具體分析如下:函數作用:row_number():為每個分組內的行分配一個唯一的連續序號(從1開始&#xff…

自動駕駛控制算法——MPC控制算法

自動駕駛控制算法——MPC控制算法 文章目錄自動駕駛控制算法——MPC控制算法一、MPC 是什么?1.1 定義與核心思想1.2 MPC 與傳統控制器(如 PID)的區別1.3 自動駕駛中 MPC 的典型應用場景🚗 軌跡跟蹤控制(Trajectory Tra…

【DL學習筆記】各種卷積操作總結(深度可分離、空洞、轉置、可變形)

Vanilla Convolution 普通卷積 卷積通道數: 卷積核的數量決定輸出的張量的通道數nnn,輸入的張量和每一個核Kernel做卷積運算得到一個channel的輸出。輸入通道數CinC_{in}Cin?決定每一個卷積核的通道數 卷積輸出feature map的尺寸的計算公式&#xff1…

【Ubuntu】請問,`ip -a`顯示的“wlo1”是什么呀?

商量AI wlo1 是 Linux 系統中 無線網絡接口(Wi-Fi 網卡)的名稱,其命名遵循現代 Linux 的 可預測網絡接口命名規則(Predictable Network Interface Names)。以下是詳細解析:命名規則拆解 wlo1 的結構由三部分…

Excel商業智能分析報表 【銷售管理分析儀】

1.銷售漏斗(Sales Funnel)分析🌟🌟 銷售漏斗定義:科學反映商機狀態及銷售效率的銷售管理模型。適用場景:關系型銷售運營(需長期維護客戶關系的銷售模式)。核心功能:按銷售…

【論文閱讀|V2M: VISUAL 2-DIMENSIONAL MAMBA FOR IMAGE REPRESENTATION LEARNING】

論文題目:V2M: VISUAL 2-DIMENSIONAL MAMBA FOR IMAGE REPRESENTATION LEARNING 年份:2024 期刊會議: arXiv 代碼鏈接:https://github.com/wangck20/V2M 目錄 現階段存在的問題 1. 二維結構信息丟失 2. 一維 Mamba 架構的局限性 3. 提升視覺任務表現 相關研究 方法 二維…

服務器數據安全:利用阿里云OSS/騰訊云COS實現網站數據自動備份

更多云服務器知識,盡在hostol.com你的網站,就像一座你親手在數字海灘上堆砌起來的、精美絕倫的“沙堡”。你為它設計了獨特的風格,添置了豐富的內容,吸引了越來越多的游客前來參觀。每一篇文章,每一條評論,…

AdGuard 安卓修改版:全方位廣告攔截與隱私保護專家

AdGuard 安卓版是一款功能強大的廣告攔截軟件,能夠有效阻止網頁和應用程序中的廣告和跟蹤器,提升用戶的瀏覽體驗。它不僅提供了廣泛的廣告攔截功能,還通過多種隱私保護功能,確保用戶的個人信息安全。以下是 AdGuard 安卓版的詳細介…

Mysql中的鎖到底是什么?鎖的是什么?

MySQL InnoDB 的鎖:一次從“守衛”到“交通指揮中心”的深度之旅 MySQL InnoDB 的鎖。這個概念常常讓人覺得復雜抽象,但我們需要抓住它的底層設計哲學 忘記那些代碼和術語定義,我們先從最底層的問題開始思考: 思考一:為…

CVE-2020-24557

一、漏洞原理 CVE-2020-24557 是 D-Link 路由器(如 DIR-816L2) 中存在的一個 命令注入(Command Injection) 漏洞,其核心原理為: ①路由器的管理界面(Web 或 CGI 接口)在處理某些用戶…

proxychains——Linux代理工具

簡介 ProxyChains是一個UNIX程序,通過預加載動態庫(dlsym(),LD_PRELOAD)劫持動態鏈接程序中與網絡相關的libc函數,將連接重定向至SOCKS4a/5或HTTP代理。僅支持TCP協議(不支持UDP/ICMP等)。它的工作方式基本…

精確調控建筑環境,樓宇自控系統大幅提升居住舒適度

在現代城市化進程中,建筑環境的舒適度已成為衡量生活質量的重要指標。隨著科技的飛速發展,樓宇自控系統(Building Automation System, BAS)正以前所未有的精準度重新定義人與空間的互動關系。這套集成了物聯網、大數據和人工智能的…

Echarts中的水波圖、水球圖、水半球實現的詳細步驟(vue)

目錄 一、實現效果 二、實現步驟 1. 安裝ECharts和Liquid Fill插件 2. 創建一個組件 3.在創建的vue中引入ECharts和Liquid Fill插件 4.在組件中初始化ECharts和Liquid Fill插件 5.完整代碼 一、實現效果 Echarts中的水位圖(水波圖、水球圖、水半球)…

Vue父組件向子組件傳遞一個動態的值,子組件如何保持實時更新實時更新?

父組件 通過 :issueDeptId this.form109.issueDeptId傳數據到子組件 <inv-info ehco-data"selectOutInvId" :purposeId this.form109.purposeId:issueDeptId this.form109.issueDeptId:projectNo this.form109.projectNo:invPhysicIds this.form109.issuePh…