EAGLE-2:一種高效無損的推測性采樣方法,提升LLM的推理速度。

歡迎關注我的公眾號:Halo咯咯

01。概述

北京大學的研究人員聯合微軟研究院、滑鐵盧大學以及Vector研究所共同推出了EAGLE-2,這是一種利用上下文感知的動態草圖樹來增強推測性采樣的方法。EAGLE-2在先前的EAGLE方法基礎上進行了改進,不僅顯著提升了速度,同時保持了生成文本的質量。該方法根據上下文動態調整草圖樹,并利用草圖模型的置信度分數來近似接受率。

EAGLE-2通過上下文動態調整草圖樹,優化了推測性采樣過程。該方法包含兩個主要階段:擴展和重新排名。首先,在擴展階段,草圖模型從草圖樹的最新層輸入最有希望的節點,以形成下一層。草圖模型的置信度分數近似于接受率,從而可以高效地預測和驗證代幣。隨后,在重新排名階段,驗證過程中為原始語言模型(LLM)的輸入選擇具有較高接受概率的代幣。這種兩階段的方法確保草圖樹能夠適應上下文,顯著提高了代幣的接受率和整體效率。該方法消除了多次前向傳遞的需求,從而加快了推理過程,同時不影響生成文本的質量。

圖片

02。EAGLE特點

  • EAGLE技術以其卓越的性能獲得第三方評估機構的認證,成為迄今為止最快的推測性方法。

  • 在gpt-fast上實現2倍速度提升,在標準解碼(13B參數模型)上快3倍,比Lookahead(13B參數模型)快2倍,比Medusa(13B參數模型)快1.6倍。

  • EAGLE技術在生成文本的分布上能夠保證與傳統解碼方法的一致性。此外,它可在1至2天內完成訓練,并在8個RTX 3090 GPU上進行測試,使得即使是GPU資源有限的研究人員也能夠承擔得起。

  • EAGLE技術還可以與其他并行技術如vLLM、DeepSpeed、Mamba、FlashAttention、量化技術以及硬件優化等相結合使用。

圖片

03。EAGLE2性能

在多輪對話場景中,EAGLE-2實現了大約4.26倍的加速;在代碼生成任務中,其速度提升高達5倍。在草擬-驗證周期內生成的平均代幣數量顯著高于其他方法,大約是標準推測性采樣的兩倍。這種性能提升使EAGLE-2成為實時自然語言處理應用的寶貴工具。

圖片

性能評估還表明,EAGLE-2在不同任務和大型語言模型(LLM)上實現了3.05倍至4.26倍的加速比率,比之前的EAGLE方法提升了20%至40%。它保持了生成文本的分布,確保了在提高速度的同時不損失輸出質量。EAGLE-2在涵蓋六項任務和三個系列的大型語言模型的廣泛測試中展現了最佳性能,證實了其魯棒性和高效率。

參考:

1.https://arxiv.org/abs/2406.16858

2.https://github.com/SafeAILab/EAGLE

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/37663.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/37663.shtml
英文地址,請注明出處:http://en.pswp.cn/web/37663.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python列表、元組、集合、字典整理

特征對比 下面是Python中列表、元組、集合和字典的特征對比表格: 特征列表 (List)元組 (Tuple)集合 (Set)字典 (Dictionary)定義符號[ ]( ){ }{ }可變性可變不可變可變可變有序性有序有序無序無序元素訪問通過索引訪問,索引從0開始通過索引訪問&#x…

一個啟動腳本例子

一、全部代碼 #!/bin/bash DATE$(date %Y%m%d)SOURCE"abc.jar" TARGET"backup/abc.jar.jew.$DATE"if [ -f "$SOURCE" ]; thencp "$SOURCE" "$TARGET" firm -f abc.jar mv abc_1.jar abc.jarpidNumps -ef | grep $SOURCE |…

【源碼+文檔+調試講解】基于vue的線上點餐系統

摘要 隨著信息技術在管理上越來越深入而廣泛的應用,管理信息系統的實施在技術上已逐步成熟。本文介紹了線上點餐系統的開發全過程。通過分析線上點餐系統管理的不足,創建了一個計算機管理線上點餐系統的方案。文章介紹了線上點餐系統的系統分析部分&…

電腦提示vcomp140.dll缺失怎么解決?vcomp140.dll是什么文件?

當你的電腦提示vcomp140.dll缺失的時候,你就應該要注意了,因為這個提示的出現,代表你的某個程序開不了!想要程序能正常運行,那么只要修復好這個vcomp140.dll文件就可以了,下面我們就來給大家詳細的說說說vc…

超詳細之IDEA上傳項目到Gitee完整步驟

1. 注冊gitee 賬號密碼,gitee官網地址:Gitee官網,注冊完成后,登錄。 2. 創建倉庫,在主頁左下角有新建按鈕,點擊新建后會進入到此頁面填寫倉庫信息。 3. 創建完成后復制倉庫地址 4. 打開IntelliJ IDEA新建或…

python自動化之schedule

目錄 代碼(以每5秒1次為例): 每5分鐘1次 每2小時1次 每天18:00執行 用到的庫:schedule,time 實現的效果:按秒來運行任務,按分鐘來運行任務,按小時來運行任務,按天來運行任務 代…

鴻蒙3.0WebView網絡錯誤問題

背景,榮耀9x,混淆才會出這個問題。 [ERROR:ssl_client_socket_impl.cc(981)] handshake failed; returned -1, SSL error code 1, net_error -2 NetError.java int SSLClientSocketImpl::DoHandshake() {crypto::OpenSSLErrStackTracer err_tracer(FRO…

Oracle新特性速遞:未來數據庫技術的無限可能

文章目錄 一、自治數據庫:智能化與自動化的革命二、機器學習集成:智能數據分析的新境界三、區塊鏈技術:確保數據完整性與透明性四、云原生數據庫:靈活擴展與快速部署五、人工智能優化器:智能查詢執行計劃《Oracle從入門…

centos7搭建zookeeper 集群 1主2從

centos7搭建zookeeper 集群 準備前提規劃防火墻開始搭建集群192.168.83.144上傳安裝包添加環境變量修改zookeeper 的配置 192.168.83.145 和 192.168.83.146 配置 啟動 集群 準備 vm 虛擬機centos7系統zookeeper 安裝包FinalShell或者其他shell工具 前提 虛擬機安裝好3臺cen…

為什么我的Skype點數不見了?如何重新激活 Skype 點數?

您超過180天沒有使用過點數打電話功能,點數暫時封存在您的賬戶里面,需要您手動激活(目前必須要登錄網頁版skype) 可再次使用。 如何重新激活 Skype 點數? 登錄到你的帳戶 . 選擇 重新激活信用額度 .注意: …

MiniTest

1.編輯case文件first_test.py import minium class FirstTest(minium.MiniTest): def test_get_system_info(self): 2.編輯配置文件config.json { "project_path": "path/to/project", "dev_tool_path": "path/to/cli", "…

【Python】 Joblib:高效的Python作業調度和緩存工具

那年夏天我和你躲在 這一大片寧靜的海 直到后來我們都還在 對這個世界充滿期待 今年冬天你已經不在 我的心空出了一塊 很高興遇見你 讓我終究明白 回憶比真實精彩 🎵 王心凌《那年夏天寧靜的海》 在Python數據科學和機器學習中,處理…

喜訊!安全狗榮獲“2023年網絡安全技術支撐優秀單位”稱號

6月6日,由中共廈門市委網絡安全和信息化委員會辦公室(以下簡稱“廈門市委網信辦”)主辦的2023年網絡安全技術支撐優秀單位頒獎儀式在廈門成功舉行。 作為國內云原生安全領導廠商,安全狗受邀出席此次活動。 會上,安全狗…

預約小程序源碼,云開發技術,無需服務器

介紹: 很多企業的業務都需要通過服務預約來完成,比如酒店、美容、家政等等。 但很多商家因缺少合適的服務預訂工具,而不知道如何讓客戶盡快預約。 這種情況下,制作一個自己的預約小程序,客戶只需要掃碼或者在微信里…

Eureka的橋梁:服務消費者交互全解析

Eureka的橋梁:服務消費者交互全解析 在微服務架構中,服務發現是確保服務間有效通信的關鍵機制。Eureka,作為Netflix開源的服務發現框架,扮演著服務注冊中心的角色,為服務消費者和服務提供者提供了一個動態的服務注冊與…

調用基類的純虛函數,如何知道純虛函數會調用哪個派生類(子類)中的實現。

在 C 中,調用基類的純虛函數實際上是通過運行時多態性來決定調用哪一個派生類的實現。這種機制是通過虛函數表(vtable)和虛函數指針(vptr)實現的。下面我們來詳細探討一下這個過程。 虛函數表和虛函數指針 虛函數表&a…

開放簽電子簽章系統(企業版)V2.0.5版本詳細更新內容

本次版本迭代間隔1月之久,新功能主要是增加文件的簽署記錄并生成報告,其次優化支持非A4規格的簽約文件(這個費時很久,主要原因是推翻之前的位置計算的邏輯,重新計算坐標位置),詳細更新內容如下&…

WebKit與CSSOM視圖模塊:探索現代Web布局的協同進化

WebKit與CSSOM視圖模塊:探索現代Web布局的協同進化 在當今快速發展的Web技術領域,WebKit作為眾多流行瀏覽器的渲染引擎,其對CSS對象模型(CSSOM)視圖模塊的支持至關重要。CSSOM視圖模塊為開發者提供了一組豐富的API&am…

HarmonyOS--開發者證書地址

初級證書:華為開發者學堂 高級證書:華為開發者學堂

【Qt】QSettings使用

1. 介紹 QSettings類提供持久的跨平臺的應用程序設置存儲。 2. 使用 /*********************************************************/ /* main.cpp */ int main(int argc, char *argv[]) {QApplication a(argc, argv);//Settings設置a.setOrganizationName("custom"…