【論文筆記】Transformer^2: 自適應大型語言模型

在這里插入圖片描述

Code repo: https://github.com/SakanaAI/self-adaptive-llms


摘要

自適應大型語言模型(LLMs)旨在解決傳統微調方法的挑戰,這些方法通常計算密集且難以處理多樣化的任務。本文介紹了Transformer2(Transformer-Squared),一種新穎的自適應框架,通過在推理時選擇性地調整權重矩陣的單個奇異分量來實時適應未見過的任務。Transformer2在參數數量較少且效率更高的情況下,持續優于LoRA等常用方法。此外,Transformer2在不同LLM架構和模態(包括視覺語言任務)中表現出色,代表了自適應LLMs的重大進步。

引言

自適應LLMs代表了人工智能的重大進步,提供了一個框架,使模型能夠實時調整以適應不同的任務和動態環境。傳統的LLM訓練方法試圖在一次廣泛的訓練會話中優化模型的多種能力,這在實踐中難以實現。相比之下,自適應模型提供了一種更靈活和高效的方法,允許模型根據手頭的任務動態修改其行為。

相關工作

  • 自適應LLMs:定義為一組LLMs或一個獨立的LLM,能夠響應其操作環境或內部狀態的變化而評估和修改其行為。
  • 低秩適應:如LoRA,通過引入小的可訓練低秩矩陣來實現任務特定的更新。
  • SVD用于LLM微調:使用SVD來近似原始權重矩陣,以提高效率。

方法

在這里插入圖片描述

Transformer2

Transformer2的構建包括兩個主要步驟:

  1. 奇異值微調(SVF):通過RL學習緊湊且可組合的專家向量,基于基礎模型權重的SVD。

  2. 自適應策略:在推理時動態組合SVF訓練的專家向量,提供三種不同的自適應策略:

    • 提示工程:構建新的“適應”提示,直接詢問LLM分類輸入提示。
    • 分類專家:使用專門的系統處理任務識別。
    • 少樣本適應:通過線性插值在K個學習到的SVF向量之間進行加權組合。

實驗

實驗評估了Transformer2在多個任務和模型上的表現:

  1. SVF性能:在GSM8K、MBPP-Pro和ARC-Easy任務上,SVF提供了顯著且一致的性能提升。
  2. 自適應性能:在未見過的任務(如MATH、Humaneval、ARC-Challenge)上,Transformer2的自適應策略展示了改進。

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

結論

本文介紹了Transformer2,提供了一個實現自適應LLMs的新藍圖。通過SVF和三種自適應策略,Transformer2展示了在提高模型適應性和任務特定性能方面的優勢。未來的工作可以集中在模型合并和高效適應技術上,以實現更強大的自適應LLMs。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895730.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895730.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895730.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HTTP的“對話”邏輯:請求與響應如何構建數據橋梁?

一、前言 作為現代互聯網通信的基石,HTTP協議定義了客戶端與服務器之間的“對話規則”。每一次網頁加載、API調用或文件傳輸的背后,都離不開精心構造的HTTP請求與響應。請求中封裝了用戶的意圖——從請求方法、資源路徑到提交的數據;響應則承…

安裝 Docker Desktop 修改默認安裝目錄到指定目錄

Docker Desktop安裝目錄設置 Docker Desktop 默認安裝位置 (C:\Program Files\Docker\Docker) 是這個 ,導致系統盤占用過大,大概2G ; 那么如何安裝到其他磁盤呢? 根據docker desktop 官網 Docker Desktop install 我們可以看到&a…

基于實例詳解pytest鉤子pytest_generate_tests動態生成測試的全過程

關注開源優測不迷路 大數據測試過程、策略及挑戰 測試框架原理,構建成功的基石 在自動化測試工作之前,你應該知道的10條建議 在自動化測試中,重要的不是工具 作為一名軟件開發人員,你一定深知有效測試策略的重要性,尤其…

Kotlin Lambda

Kotlin Lambda 在探索Kotlin Lambda之前,我們先回顧下Java中的Lambda表達式,Java 的 Lambda 表達式是 Java 8 引入的一項強大的功能,它使得函數式編程風格的代碼更加簡潔和易于理解。Lambda 表達式允許你以一種更簡潔的方式表示實現接口&…

C#學習之DataGridView控件

目錄 一、DataGridView控件常用屬性、方法、事件匯總表 1. 常用方法、屬性和事件匯總 二、DataGridView 控件的常用方法調用 1. DataBind() 方法 2. Clear() 方法 3. Refresh() 方法 4. Sort() 方法 5. ClearSelection() 方法 6. BeginEdit() 方法 7. EndEdit() 方法…

本地事務簡介

本地事務簡介 1 事務基本性質 數據庫事務的幾個特性:原子性(Automicity)、一致性(Consistency)、隔離性或獨立性(islation)和持久性(Durability),簡稱ACID。 原子性:一系列的操作,其整體不可拆分,要么同時成功&#…

PyQt組態軟件 拖拽設計界面測試

PyQt組態軟件測試 最近在研究PyQt,嘗試寫個拖拽設計界面的組態軟件,目前實現的功能如下: 支持拖入控件,鼠標拖動控件位置 拖動控件邊緣修改控件大小支持屬性編輯器,修改當前選中控件的屬性 拖動框選控件,點選控件 控…

軟件評測師復習之計算機網絡(4)

目錄 (一)1.網絡功能和分類2.OSI七層模型3.TCP/IP協議4.傳輸介質(二)1.通信方式和交換方式2.IP地址3.IPv64.網絡規劃與設計5.磁盤冗余陣列6.網絡存儲技術(一) 1.網絡功能和分類 計算機網絡功能:數據通信、資源共享、負載均衡、高可靠性 按分布范圍和拓撲結構劃分: 網絡分類…

機器學習-1:線性回歸

常用的線性回歸模型主要有以下這些 簡單線性回歸多元線性回歸多項式回歸嶺回歸套索回歸彈性網絡回歸逐步回歸 一.簡單的一元線性回歸 1.導入必備的庫 #導入必備的庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.model_selection …

SQL SERVER的PARTITION BY應用場景

SQL SERVER的PARTITION BY關鍵字說明介紹 PARTITION BY關鍵字介紹具體使用場景排名計算累計求和分組求最值分組內百分比計算分組內移動平均計算分組內數據分布統計分組內數據偏移計算 總結 PARTITION BY關鍵字介紹 在SQL SERVER中,關鍵字PARTITION BY主要用于窗口函…

NO.18十六屆藍橋杯備戰|循環嵌套|乘法表|斐波那契|質數|水仙花數|(C++)

循環嵌套 循環嵌套的使? while , do while , for ,這三種循環往往會嵌套在?起才能更好的解決問題,就是我們所說的:循環嵌套。這三種循環都可以任意嵌套使? ?如: 寫?個代碼,打印?個乘法?…

leetcode - hot100 - python - 專題一:哈希

1、兩數之和 簡單 題目: 給定一個整數數組 nums 和一個整數目標值 target,請你在該數組中找出 和為目標值 target 的那 兩個 整數,并返回它們的數組下標。你可以假設每種輸入只會對應一個答案,并且你不能使用兩次相同的元素。你可…

JavaEE-SpringBoot快速入門

文章目錄 本節目標Maven什么是Maven創建一個Maven項目maven項目功能maven的依賴管理全球倉庫, 私服, 本地服務器, 配置國內鏡像 第一個SpringBoot項目創建項目運行SpringBoot程序 SpringBoot原理初步Web服務器 總結 本節目標 了解什么是maven, 配置國內源使用Springboot創建項…

【Viper】配置格式與支持的數據源與go案例

Viper 是一個用于 Go 應用程序的配置管理庫,支持多種配置格式和數據源。 安裝依賴 go get github.com/spf13/viper go get github.com/spf13/viper/remote go get go.etcd.io/etcd/client/v3"github.com/spf13/viper/remote"要寫在etcd客戶端import里 1…

【C/C++】后綴表達式 藍橋杯/ACM備賽

核心考點:1.棧的應用 2.字符串處理 題目描述 所謂后綴表達式是指這樣的一個表達式:式中不再引用括號,運算符號放在兩個運算對象之后,所有計算按運算符號出現的順序,嚴格地由左而右新進行(不用考慮運算符的…

【AI實踐】deepseek支持升級git

當前Windows 11 WSL的git是2.17,Android Studio提示需要升級到2.19版本 網上找到指導文章 安裝git 2.19.2 cd /usr/src wget https://www.kernel.org/pub/software/scm/git/git-2.19.2.tar.gz tar xzf git-2.19.2.tar.gz cd git-2.19.2 make prefix/usr/l…

QEMU 搭建 Ubuntu x86 虛擬機

1. 安裝 QEMU 在 Ubuntu 系統中,可以通過以下命令安裝 QEMU: sudo apt-get update sudo apt-get install qemu-system-x86_64 qemu-kvm libvirt-daemon libvirt-clients bridge-utils virt-manager2. 創建虛擬硬盤鏡像 qemu-img create -f raw ubuntu…

Linux驅動層學習:Linux 設備樹

設備樹是一種數據結構,包含多個節點,用于描述硬件設備及其配置信息,它通常用于嵌入式系統中,尤其是在Linux操作系統中,幫助操作系統識別和管理硬件資源,設備樹不是代碼,而是一種用數據描述硬件信…

金蝶云星空與釘釘高效數據集成案例分享

金蝶云星空數據集成到釘釘的技術案例分享 在企業信息化系統中,數據的高效流動和實時反饋是提升業務效率的關鍵。本文將聚焦于一個具體的系統對接集成案例:如何將金蝶云星空的數據集成到釘釘,并實現審核狀態的回傳提示。 本次集成方案名為“…

圖形渲染(一)——Skia、OpenGL、Mesa 和 Vulkan簡介

1.Skia —— 2D 圖形庫 Skia 是一個 2D 圖形庫,它的作用是為開發者提供一個高層次的繪圖接口,方便他們進行 2D 圖形渲染(比如繪制文本、形狀、圖像等)。Skia 本身不直接管理 GPU 或進行底層的渲染工作,而是通過 底層圖…