zkML-JOLT——更快的ZK隱私機器學習:Sumcheck +Lookup

1. 引言

ICME團隊開源的zkML項目:

  • https://github.com/ICME-Lab/jolt-atlas(Rust)

zkML-JOLT(JOLT ‘Atlas’)構建在a16z Crypto團隊的JOLT研究和實現基礎上,其性能比其他zkML項目快了3到7倍。

a16z Crypto研究團隊最近發布了一項重磅成果,宣布了他們的6倍加速(見2025年8月14日博客Jolt gets a 6× speedup — and we’re just getting started),展示了JOLT基于lookup查找表的方案結合sumcheck協議如何在僅使用CPU的情況下,顯著超越其他SNARK構建。其 “Twist and Shout(見2025年論文《Twist and Shout: Faster memory checking arguments via one-hot addressing and increments》)”優化證明了,當你不再試圖將一切都算術化,而是開始采用查找和稀疏性時,奇跡就會發生:

  • 減少審計的代碼。
  • 更快的證明者。
  • 幾乎是“證明者殺手”的證明。

2. 將JOLT用于zkML

如果將JOLT修改為適用于神經網絡推理呢?

  • 神經網絡本身包含大量的非線性操作、稀疏性和矩陣乘法操作。

當a16z團隊忙于革新通用zkVM時,ICME團隊則專注于另一個問題:

  • 使零知識機器學習在NovaNet中更具實用性。

事實證明,ML工作負載有一些非常特定的模式,與JOLT的lookup-heavy架構非常契合。在其他方法因ML操作的昂貴域運算而陷入困境時,JOLT的sumcheck+lookup組合能夠直接解決該問題。

傳統的基于電路的方法,在表示ReLU和SoftMax等非線性函數時,成本極其高昂。相比之下,lookup完全消除了電路表示的需求。Just One Lookup Table (JOLT) 從第一性原理開始設計,僅使用lookup argument。這一基礎性的設計選擇意味著,任何試圖將lookup集成到現有系統中的證明方案,都會在根本上處于劣勢。

在zkML JOLT (Atlas)中,消除了困擾其他方法的復雜性:

  • 沒有商多項式、沒有字節分解、沒有grand product、沒有permutation check,最重要的是——沒有復雜的電路。

對于矩陣-向量乘法(機器學習中的主導成本),zkML-JOLT 利用JOLT的高效批量sumcheck協議,提供卓越的性能。盡管基于GKR的方法可以通過像SpaGKR(見2024年論文Sparsity-Aware Protocol for ZK-friendly ML Models: Shedding Lights on Practical ZKML)這樣的稀疏性框架進行改進,但JOLT 'Atlas’通過其以查找為中心的架構和稀疏多項式承諾,天然受益于稀疏性——無需額外的優化層。

另一個有趣的優勢是——JOLT從不將其完整的查找表物化,查找表是結構化的,而不是顯式存儲的。雖然其他zkML項目由于物化的表約束而被鎖定在特定的量化方案中,JOLT的方案理論上支持靈活的量化支持,且可以擴展到浮點運算,而不受競爭對手面臨的嚴格預處理限制。這只是一個旁注,因為目前正在考慮的大多數模型都是量化的。

另一個顯著的優勢——通過“Twist and Shout”,JOLT不再需要將操作分解為更小的子表。這為之前不可能實現的預編譯功能打開了大門。現在,只要其evaluation table評估表是MLE結構化的,操作可以作為原語指令(或虛擬序列)添加,而不需要更為嚴格的“可分解”屬性。這大大擴展了可以直接高效集成到JOLT Atlas指令集中的操作范圍。

舉個小例子,以下是ICME團隊進行的端到端測試,對一個多分類模型進行了zkML項目的測試。

# zkML lib benchmarks (multi-class model: preprocessing + proving + verification)zkml-jolt ~0.7s # fastest
mina-zkml ~2.0s # relatively fast
ezkl 4-5s # significantly slower
deep-prove N/A # doesnt support gather op
zk-torch N/A # doesnt support reduceSum op

由此可知:

  • 良好的理論轉化為非常好的實踐結果。在測試的所有模型中,性能的數量級提升都得到了驗證。

3. 完整性與擴展性

目前,zkML-JOLT在CPU架構上運行,但GPU加速代表著下一個10倍性能提升的明確路徑。在評估競爭對手“1000倍加速”時,重要的是區分專用硬件的理論峰值性能與實際、可部署的實現。真正的性能比較應該在等效的硬件配置上進行。

此外,ICME團隊的研究揭示了zkML生態系統在完整性和正確性方面的顯著差距。許多聲稱支持ONNX的框架缺乏基本的組件,如內存一致性檢查——這是證明內存在執行過程中沒有被篡改的關鍵要求。如果沒有這些保障措施,這些實現無法合法地聲稱完全支持ONNX。

JOLT ‘Atlas’ 優先考慮性能和可驗證的正確性,確保其速度優勢不會以犧牲安全性或完整性為代價。盡管如此,zkML技術仍在持續進展中,請謹慎使用所有zkML!

4. 用例

ICME團隊正在將這項工作部署為其基于NIVC的證明者網絡(DeSCI for ZK)中的第一個專用證明者,NovaNet。NovaNet的姐妹項目Kinic已經利用這項技術創建了可移植且可驗證的AI內存,作為“AI的Plaid”——更多詳情可參見https://www.kinic.io/。

可驗證AI的更廣泛應用是具有變革性的。正如研究員Daniel Kang在2025年5月 zkSummit 13 ZK13: ZKTorch: Efficiently Compiling ML Models to Zero-Knowledge Proof Protocols - Daniel Kang中所概述的,用例涵蓋隱私保護的醫療推理、金融服務(包括貸款承保和算法交易),以及本地運行AI代理的驗證。每個用例都代表了一個信任和可審計性至關重要的市場,但當前的AI系統通常是黑箱操作。

zkML-JOLT通過提供實際部署所需的性能,同時保持數學上的正確性保證,使這些應用變得在實踐中可行。
愿意等待幾秒鐘,以便在你的個人AI代理轉賬2萬美元USDC之前進行zkML驗證嗎?ICME團隊認為,大多數人會看到可驗證機器學習在承擔更大責任的代理中的好處。

5. Folding JOLT

大多數zkVM和zkML項目是“簡潔可驗證的”,但不是“零知識的”——它們不能保留輸入/輸出、witness或中間計算的隱私。對于實際的、個人之間或公司間的AI代理,正確執行的加密證明必須與隱私保證結合。

ICME團隊的架構通過“Folding方案”實現了真正的零知識。可以使用2023年 HyperNova: Recursive arguments for customizable constraint systems論文中的技術來折疊JOLT驗證器,從而實現“零知識”隱私。這種方法還允許動態step size調整,使得在多種硬件配置上都能高效證明——無論是大型專用服務器硬件,還是個人計算機。

與其他需要大量內存和專用硬件的zkML框架不同,JOLT通過Folding實現的高效性使得能夠為特定的部署場景調整內存與速度的平衡。通過繼續folding,還可以用于大規模的zkML工作負載并行化。這種靈活性解鎖了以前在zkML領域中不切實際的用例——從消費級設備到資源受限的環境。

6. 展望

a16z Crypto團隊將繼續推進JOLT核心基礎設施的開發,發布包括:

  • streaming流式JOLT
  • 優化的Fiat-Shamir變換
  • 增強sumcheck協議和GPU加速等內容

以提供更多數量級的性能提升。JOLT 'Atlas’將從這一研究工作中受益,并為其做出貢獻。

而ICME團隊的產品開發推動了基于格的多項式承諾方案(PCS)和folding方案(2025年論文Neo: Lattice-based folding scheme for CCS over small fields and pay-per-bit commitments)的具體研究重點。這些將實現pay-per-bit按位計費結構、更小的域運算、可行的后量子安全性、folding中使用的同態性,以及動態公共參數生成——這些能力對于大規模的分布式zkML部署至關重要。

這一雙軌道方法確保了JOLT 'Atlas’保持在前沿技術的同時,解決了來自構建可驗證AI用戶應用程序時出現的實際部署挑戰。

參考資料

[1] ICME團隊2025年8月25日博客 Sumcheck good. Lookups good. JOLT good. Particularly for zero-knowledge machine learning

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/95184.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/95184.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/95184.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【大模型記憶-Mem0詳解-2】系統架構

概述 Mem0 實現了雙架構系統,通過兩種主要部署模型為 AI 應用提供智能內存能力: 托管平臺 :通過 MemoryClient 和 AsyncMemoryClient 類訪問的托管服務開源 :以 Memory 類為中心的自托管組件,具有可插拔提供程序 此架構…

[Java]PTA:jmu-Java-01入門-取數字浮點數

本題目要求讀入若干以回車結束的字符串表示的整數或者浮點數,然后將每個數中的所有數字全部加總求和。輸入格式:每行一個整數或者浮點數。保證在浮點數范圍內。輸出格式:整數或者浮點數中的數字之和。題目保證和在整型范圍內。輸入樣例:-123.01 234輸出樣例:7 9代碼…

FFmpeg音視頻處理解決方案

核心組件: ffmpeg:主要的命令行工具,用于轉碼、轉換格式等 ffprobe:用于分析多媒體文件信息的工具 ffplay:簡單的媒體播放器 主要功能: ? 格式轉換(轉碼) ? 視頻裁剪、合并 ? 調整…

機器學習回顧——決策樹詳解

決策樹基礎概念與應用詳解1. 決策樹基礎概念1.1 什么是決策樹決策樹是一種樹形結構的預測模型,其核心思想是通過一系列規則對數據進行遞歸劃分。它模擬人類決策過程,廣泛應用于分類和回歸任務。具體結構包括:內部節點:表示對某個特…

Linux開發必備:yum/vim/gcc/make全攻略

目錄 1.學習yum、apt?具,進?軟件安裝 1-1 什么是軟件包 1-2 yum/apt具體操作 2. 編輯器Vim 2-1 Linux編輯器-vim的引入 2-2 vim的基本概念 2-3 vim的基本操作 2-4 vim正常模式命令集 2-5 vim末?模式命令集 3. 編譯器gcc/g 3-1 背景知識 3-2 gcc編譯選…

【Linux系統】萬字解析,進程間的信號

前言: 上文我們講到了,進程間通信的命名管道與共享內存:【Linux系統】命名管道與共享內存-CSDN博客?????? 本文我們來講一講,進程的信號問題 點個關注! 信號概念 信號是OS發送給進程的異步機制!所謂異…

AI時代SEO關鍵詞實戰解析

內容概要 隨著人工智能技術深度融入搜索引擎的運行機制,傳統的SEO關鍵詞研究方法正經歷著根本性的變革。本文聚焦于AI時代背景下,如何利用智能化的策略精準定位目標用戶,實現搜索可見度的實質性躍升。我們將深入探討AI技術如何革新關鍵詞研究…

Spring Boot + Spring MVC 項目結構

下面一個既能返回 JSP 頁面,又能提供 JSON API 的 Spring Boot Spring MVC 項目結構,這樣你就能同時用到 Controller 和 RestController 的優勢。 🏗 項目結構 springboot-mvc-mixed/ ├── src/main/java/com/example/demo/ │ ├── …

通俗易懂的講解下Ceph的存儲原理

Ceph存儲原理解析 要理解 Ceph 的存儲原理,我們可以用一個 “分布式倉庫” 的比喻來拆解 —— 把 Ceph 想象成一個由多個 “倉庫管理員”(硬件節點)共同打理的大型倉庫,能高效存儲、管理海量貨物(數據)&…

軟件測試小結(1)

一、什么是測試?1.1 生活中常見的測試例如去商場買衣服:①、選擇一件符合審美的衣服 -> 外觀測試;②、穿上身上試試是否合身 -> 試穿測試;③、 看看衣服的材料是否純棉 -> 材料測試;④、 詢問衣服的價格 ->…

Python未來3-5年技術發展趨勢分析:從AI到Web的全方位演進

Python作為全球最流行的編程語言之一,在開發者社區中占據核心地位。其簡潔語法、豐富庫生態和跨領域適用性,使其在AI、Web開發、數據科學等領域持續領先。本文基于當前技術演進趨勢(如2023-2024年的開源項目、社區討論和行業報告)…

【ComfyUI】SDXL Turbo一步完成高速高效的圖像生成

今天演示的案例是一個基于 ComfyUI 與 Stable Diffusion XL Turbo 的圖生圖工作流。整體流程通過加載輕量化的 Turbo 版本模型,在文本編碼與調度器的配合下,以極快的推理速度完成從提示詞到高質量圖像的生成。 配合演示圖可以直觀感受到,簡潔…

基于 GPT-OSS 的在線編程課 AI 助教追問式對話 API 開發全記錄

本文記錄了如何在 3 天內使用 GPT-OSS 開源權重搭建一個 在線編程課 AI 助教追問式對話 API&#xff0c;從需求分析、數據準備到微調與部署全流程實戰。 1?? 需求與指標 回答準確率 ≥ 95%響應延遲 < 1 秒支持多學生并發提問 2?? 數據準備 收集課程問答對清理無效數據…

YOLO v11 目標檢測+關鍵點檢測 實戰記錄

流水賬記錄一下yolo目標檢測 1.搭建pytorch 不做解釋 看以往博客或網上搜都行 2.下載yolo源碼 &#xff1a; https://github.com/ultralytics/ultralytics 3.樣本標注工具&#xff1a;labelme 自己下載 4.準備數據集 4.1 新建一個放置數據集的路徑4.2 構建訓練集和測試集 運行以…

uniApp 混合開發全指南:原生與跨端的協同方案

uniApp 作為跨端框架&#xff0c;雖能覆蓋多數場景&#xff0c;但在需要調用原生能力&#xff08;如藍牙、傳感器&#xff09;、集成第三方原生 SDK&#xff08;如支付、地圖&#xff09; 或在現有原生 App 中嵌入 uniApp 頁面時&#xff0c;需采用「混合開發」模式。本文將系統…

【大模型】使用MLC-LLM轉換和部署Qwen2.5 0.5B模型

目錄 ■準備工作 下載模型 安裝依賴 安裝基礎依賴 安裝mlc-llm ■權重轉換 ■生成配置文件 ■模型編譯 GPU版本編譯 CPU版本編譯 ■啟動服務 啟動GPU服務 啟動CPU服務 ■服務測試 ■擴展 優化量化版本(可選,節省內存) INT4量化版本 調整窗口大小以節省內存…

云計算學習100天-第43天-cobbler

目錄 Cobbler 基本概念 命令 搭建cobbler 網絡架構 Cobbler 基本概念 Cobbler是一款快速的網絡系統部署工具&#xff0c;比PXE配置簡單 集中管理所需服務&#xff08;DHCP、DNS、TFTP、WEB&#xff09; 內部集成了一個鏡像版本倉庫 內部集成了一個ks應答文件倉庫 提供…

接口測試:如何定位BUG的產生原因

1小時postman接口測試從入門到精通教程我們從在日常功能測試過程中對UI的每一次操作說白了就是對一個或者多個接口的一次調用&#xff0c;接口的返回的內容(移動端一般為json)經過前端代碼的處理最終展示在頁面上。http接口是離我們最近的一層接口&#xff0c;web端和移動端所展…

GPIO的8種工作方式

GPIO的8種工作方式&#xff1a;一、4 種輸入模式1.1 Floating Input 浮空輸入1.2 Pull-up Input 上拉輸入1.3 Pull-down Input 下拉輸入1.4 Analog Input 模擬輸入二、4種輸出模式2.1 General Push-Pull Output 推挽輸出2.2 General Open-Drain Output 開漏輸出2.3…

LeetCode算法日記 - Day 29: 重排鏈表、合并 K 個升序鏈表

目錄 1. 重排鏈表 1.1 題目解析 1.2 解法 1.3 代碼實現 2. 合并 K 個升序鏈表 2.1 題目解析 2.2 解法 2.3 代碼實現 1. 重排鏈表 143. 重排鏈表 - 力扣&#xff08;LeetCode&#xff09; 給定一個單鏈表 L 的頭節點 head &#xff0c;單鏈表 L 表示為&#xff1a; L…