論文略讀：Prefix-Tuning: Optimizing Continuous Prompts for Generation

論文略讀：Prefix-Tuning: Optimizing Continuous Prompts for Generation

web/2025/7/12 7:46:15/文章來源:https://blog.csdn.net/qq_40206371/article/details/149196099

2021 ACL

固定預訓練LM，為LM添加可訓練，任務特定的前綴
- 這樣就可以為不同任務保存不同的前綴
- 這種前綴可以看成連續可微的soft prompt，相比于離散的token，更好優化，效果更好
訓練的時候只需要更新prefix部分的參數，固定LM部分的參數即可

對于自回歸模型，在句子前面添加前綴，得到 z = [PREFIX; x; y]

對于encoder-decoder模型：Encoder和Decoder都增加了前綴，得到 z = [PREFIX; x; PREFIX0; y]
- Encoder端增加前綴是為了引導輸入部分的編碼
- Decoder 端增加前綴是為了引導后續token的生成
- Prefix-tuning略優于Infix-tuning
  - Infix-tuning形式為 [x; INFIX; y]
  - Prefix-tuning形式為 [PREFIX; x; y]
直接學習參數效果不好，需要使用MLP對Pθ進行reparameter修正
- Pθ[i,:] = MLP(Pθ'[i,:])

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/88246.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/88246.shtml
英文地址，請注明出處：http://en.pswp.cn/web/88246.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

CSS基礎選擇器、文本屬性、引入方式及Chorme調試工具

CSS基礎選擇器、文本屬性、引入方式及Chorme調試工具

CSS基礎 1.1 CSS簡介 CSS 是層疊樣式表 ( Cascading Style Sheets ) 的簡稱. 有時我們也會稱之為 CSS 樣式表或級聯樣式表。 CSS 是也是一種標記語言 CSS 主要用于設置 HTML 頁面中的文本內容（字體、大小、對齊方式等）、圖片的外形（寬高、邊…

閱讀更多...

RabbitMQ 高級特性之事務

RabbitMQ 高級特性之事務

1. 簡介與 MySQL、Redis 一樣，RabbitMQ 也支持事務。事務中的消息，要么全都發送成功，要么全部發送失敗，不會出現一部分成功一部分失敗的情況。2. 使用事務發送消息spring 中使用 RabbitMQ 開啟事務需要兩步：第一步&…

閱讀更多...

iframe 的同源限制與反爬機制的沖突

iframe 的同源限制與反爬機制的沖突

一、事件背景A域名接入了動態防護（Bot 防護、反爬蟲機制），同時第三方業務B域名通過內嵌iframe的方式調用了A域名下的一個鏈接。二、動態防護介紹：動態防護（也稱為 Bot 防護、反爬蟲機制）是網站為了防止自動…

閱讀更多...

Rust 的 Copy 語義：深入淺出指南

Rust 的 Copy 語義：深入淺出指南

在 Rust 中，Copy 是一個關鍵的特性，它定義了類型的復制行為。理解 Copy 語義對于掌握 Rust 的所有權系統和編寫高效代碼至關重要。一、核心概念：Copy vs Move特性Copy 類型非 Copy 類型 (Move)賦值行為按位復制 (bitwise copy)所有權轉移 (ow…

閱讀更多...

Qt的信號與槽（二）

Qt的信號與槽（二）

Qt的信號與槽（二）1.自定義槽2.通過圖形化界面來生成自定義槽3.自定義信號3.信號和槽帶參數4.參數數量5.connect函數的設計🌟hello，各位讀者大大們你們好呀🌟🌟 🚀🚀系列專欄&#xf…

閱讀更多...

Java研學-MongoDB(三)

Java研學-MongoDB(三)

三文檔相關 7 文檔統計查詢① 語法： // 精確統計文檔數慢準 dahuang> db.xiaohuang.countDocuments({條件}) 4 // 粗略統計文檔數快大致準 dahuang> db.xiaohuang.estimatedDocumentCount({條件}) 4② 例子： // 精確統計文檔數 name為奔波兒灞…

閱讀更多...

TCP協議格式與連接釋放

TCP協議格式與連接釋放

TCP報文段格式 TCP雖然是面向字節流的，但TCP傳送帶數據單元確是報文段。TCP報文段分為首部和數據段部分，而TCP的全部功能體現在它在首部中各字段的作用。因此，只有弄清TCP首部各字段的作用才能掌握TCP的工作原理。 TCP報文段首部的前20字節是…

閱讀更多...

CSS05：結構偽類選擇器和屬性選擇器

CSS05：結構偽類選擇器和屬性選擇器

結構偽類選擇器 /*ul的第一個子元素*/ ul li:first-child{background: #0af6f6; }/*ul的最后一個子元素*/ ul li:last-child{background: #d27bf3; } /*選中p1：定位到父元素，選擇當前的第一個元素選擇當前p元素的父級元素，選中父級元素的第…

閱讀更多...

使用策略模式 + 自動注冊機制來構建旅游點評系統的搜索模塊

使用策略模式 + 自動注冊機制來構建旅游點評系統的搜索模塊

? 目標： 搜索模塊支持不同內容類型（攻略、達人、游記等）每種搜索邏輯用一個策略類表示自動注冊（基于注解 Spring 容器）新增搜索類型時，只需添加一個類一個注解，無需改工廠、注冊表等&#x…

閱讀更多...

第八十九篇大數據開發中的數據算法：貪心策略 - 生活中的“精打細算”藝術

第八十九篇大數據開發中的數據算法：貪心策略 - 生活中的“精打細算”藝術

在資源有限的世界里，貪心算法教會我們：局部最優的累積，往往是通往全局最高效的捷徑。本文通過3個生活化場景原創圖表，揭示大數據開發中最實用的優化策略。目錄一、貪心算法核心思想：當下即最優二、三大核心應用場景詳解…

閱讀更多...

【論文閱讀】Dynamic Few-Shot Visual Learning without Forgetting

【論文閱讀】Dynamic Few-Shot Visual Learning without Forgetting

系統概述如下： (a) 一個基于卷積神經網絡（ConvNet）的識別模型，該模型包含特征提取器和分類器； (b) 一個少樣本分類權重生成器。這兩個組件都是在一組基礎類別上訓練的，我們為這些類別準備了大量訓練數據。在測試階段，權重生成器會接收少量新類別的訓練數據以及基礎類別的…

閱讀更多...

HTML應用指南：利用GET請求獲取全國山姆門店位置信息

HTML應用指南：利用GET請求獲取全國山姆門店位置信息

山姆會員店作為全球知名的零售品牌，自進入中國市場以來，始終致力于為消費者提供高品質商品與便捷的購物體驗。隨著新零售業態的快速發展，門店位置信息的獲取變得愈發重要。品牌通過不斷拓展門店網絡，目前已覆蓋多個一、二線城市&a…

閱讀更多...

java ThreadLocal源碼分析

java ThreadLocal源碼分析

寫個demo測試下：private static void testThreadLocal() {ThreadLocal<Integer> threadLocal new ThreadLocal<>();new Thread(){Overridepublic void run() {threadLocal.set(9527);System.out.println("curr thread: " Thread.currentThr…

閱讀更多...

后端Web實戰（項目管理）

后端Web實戰（項目管理）

Restful風格我們的案例是基于當前最為主流的前后端分離模式進行開發在前后端分離的開發模式中，前后端開發人員都需要根據提前定義好的接口文檔，來進行前后端功能的開發。后端開發人員：必須嚴格遵守提供的接口文檔進行后端功能開發&#…

閱讀更多...

Leetcode 3604. Minimum Time to Reach Destination in Directed Graph

Leetcode 3604. Minimum Time to Reach Destination in Directed Graph

Leetcode 3604. Minimum Time to Reach Destination in Directed Graph 1. 解題思路2. 代碼實現題目鏈接：3604. Minimum Time to Reach Destination in Directed Graph 1. 解題思路這一題思路上就是一個廣度優先遍歷，我們不斷考察當前時間點以及位置…

閱讀更多...

OpenXR Runtime切換工具-OpenXR-Runtime-Switcher

OpenXR Runtime切換工具-OpenXR-Runtime-Switcher

在開發VR時，有時有多個設備，大家可能也會選擇不同的串流工具，OpenXR類似于默認瀏覽器，如果設置錯誤可能導致游戲無法串流。推薦一個工具，可以設置默認的OpenXR工具。 OpenXR-Runtime-Switcher 對于沒有的設備&#…

閱讀更多...

Opencv探索之旅：從像素變化到世界輪廓的奧秘

Opencv探索之旅：從像素變化到世界輪廓的奧秘

在你已經能熟練地為圖像施展“降噪”、“縮放”等魔法之后，你的探索之旅來到了一個全新的領域。你可能會好奇：我們人類能輕易地識別出照片中杯子的邊緣、建筑的輪廓，那計算機是如何“看見”這些邊界的呢？僅僅依靠濾波和顏色變換&a…

閱讀更多...

Ubuntu 22.04 + MySQL 8 無密碼登錄問題與 root 密碼重置指南

Ubuntu 22.04 + MySQL 8 無密碼登錄問題與 root 密碼重置指南

背景場景在 Ubuntu 系統中使用 apt 或 deb 包方式安裝 MySQL 8 時： 初次安裝后會自動初始化數據庫；但沒有提示 root 初始密碼；導致 mysql -u root -p 無法登錄。為了解決該問題，通常我們使用 --skip-grant-tables 方式跳過權限…

閱讀更多...

題解：P13017 [GESP202506 七級] 線圖

題解：P13017 [GESP202506 七級] 線圖

首先明白定義： 線圖 L(G)L(G)L(G) 的頂點對應原圖 GGG 的邊，當且僅當原圖中的兩條邊有公共頂點時，對應的線圖頂點之間有一條邊。不難想到，對于原圖中的每個頂點 vvv，其度數 d(v)d(v)d(v) 對應的邊集可以形成 (d(v)2)\…

閱讀更多...

c++ duiLib環境集成2

c++ duiLib環境集成2

繼續上一篇，現在需要把控制臺隱藏，只顯示調用duiLib框架顯示的窗口。右鍵項目 → 屬性 → 鏈接器 → 系統 → ?子系統?改為窗口(/SUBSYSTEM:WINDOWS)。原來是這樣：修改為：運行報錯：需要修改入口函數為WinMain。如下…

閱讀更多...

最新文章