sparse transformer 常見稀疏注意力

sparse transformer 常見稀疏注意力

news/2025/6/21 14:38:37/文章來源:https://blog.csdn.net/weixin_42357472/article/details/136435397

參考：
https://zhuanlan.zhihu.com/p/259591644

主要就是降低transformer自注意力模塊的復雜度
復雜度主要就是 Q · K^T影響的，稀疏注意力就是在Q點乘K的轉置這模塊做文章

下列式一些sparse transformer稀疏注意力方法

a、transformer原始的， Q · K^T，其中 K^T 表示 K 的轉置
b、每個token與前后三個做自注意力計算
c、膨脹注意力（dilated attention）：每個token與前后三個做自注意力計算，但這三個有間隔，就是比如第一個token看右面3,5，7
d、全局token是第一二個token看所有的token，3及后面的token只看· K^T 矩陣的1、2token；sliding劃窗見b
在這里插入圖片描述

a、全局token是第一二個token看所有的token，3及后面的token只看· K^T 矩陣的1、2token
b、劃窗
c、見上面c
d、random
e、Q矩陣的123token 看 · K^T123token；Q矩陣的456token 看 · K^T456token 。。。。
在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/719534.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/719534.shtml
英文地址，請注明出處：http://en.pswp.cn/news/719534.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

b站小土堆pytorch學習記錄—— P17 土堆說卷積操作

b站小土堆pytorch學習記錄—— P17 土堆說卷積操作

文章目錄一、前置知識什么是卷積操作二、代碼一、前置知識什么是卷積操作推薦幾個高贊博客： 卷積最容易理解的解釋卷積神經網絡（CNN）詳細介紹及其原理詳解還有pytorch官網的動態圖： pytorch卷積二、代碼 import t…

閱讀更多...

MyBatis源碼分析之基礎支持層反射

MyBatis源碼分析之基礎支持層反射

(/≧▽≦)/~┴┴ 嗨~我叫小奧 ??? 👀👀👀 個人博客：小奧的博客 👍👍👍：個人CSDN ??????：傳送門 🍹 本人24應屆生一枚，技術和水平有限&am…

閱讀更多...

PowerShell禁止運行腳本解決方案

PowerShell禁止運行腳本解決方案

錯誤代碼 CategoryInfo : SecurityError: (:) []，ParentContainsErrorRecordException FullyQualifiedErrorId : UnauthorizedAccess在計算機上啟動 Windows PowerShell 時，執行策略很可能是 Restricted（默認設置）。 Restricted …

閱讀更多...

圖像分類應用

圖像分類應用

先留一段圖像分類代碼，空閑時間再做分析： 創建神經網絡： import torch from torch import nn import torch.nn.functional as F class MyAlexNet(nn.Module):def __init__(self):super(MyAlexNet, self).__init__()self.c1nn.Conv2d(in_cha…

閱讀更多...

二刷代碼隨想錄算法訓練營第十天 | 232.用棧實現隊列、 225. 用隊列實現棧

二刷代碼隨想錄算法訓練營第十天 | 232.用棧實現隊列、 225. 用隊列實現棧

目錄一、232. 用棧實現隊列二、225. 用隊列實現棧一、232. 用棧實現隊列題目鏈接：力扣文章講解：代碼隨想錄視頻講解： 棧的基本操作！ | LeetCode：232.用棧實現隊列題目： 請你僅使用兩個棧實現先…

閱讀更多...

Vision Pro開發者學習路線

Vision Pro開發者學習路線

官方給到的Vision Pro開發者學習路線： 1. 學習基礎知識： - 學習 Xcode、Swift 和 SwiftUI 的基礎知識，包括語法、UI 設計等。 - 掌握 ARKit 和 SwiftUI 的使用，了解如何創建沉浸式增強現實體驗。 2. 學習 3D 建模&#xf…

閱讀更多...

『Linux從入門到精通』第 ? 期 - System V 共享內存

『Linux從入門到精通』第 ? 期 - System V 共享內存

文章目錄 💐專欄導讀💐文章導讀🐧共享內存原理🐧共享內存相關函數🐦key 與 shmid 區別 🐧代碼實例 💐專欄導讀 🌸作者簡介：花想云 ，在讀本科生一枚&#xff0…

閱讀更多...

CentOS7安裝DockerCompose和Docker鏡像倉庫的配置

CentOS7安裝DockerCompose和Docker鏡像倉庫的配置

CentOS7安裝DockerCompose 1.下載 Linux下需要通過命令下載： # 安裝 curl -L https://github.com/docker/compose/releases/download/1.23.1/docker-compose-uname -s-uname -m > /usr/local/bin/docker-compose2.修改文件權限修改文件權限： # …

閱讀更多...

YOLOv9獨家原創改進|加入幽靈卷積Ghost Convolution模塊，輕量化！

YOLOv9獨家原創改進|加入幽靈卷積Ghost Convolution模塊，輕量化！

專欄介紹：YOLOv9改進系列 | 包含深度學習最新創新，主力高效漲點！！！ 一、論文摘要由于內存和計算資源有限，在嵌入式設備上部署卷積神經網絡是困難的。特征圖中的冗余是那些成功的細胞神經網絡的一個重要特征…

閱讀更多...

【網站項目】158企業人事管理系統

【網站項目】158企業人事管理系統

🙊作者簡介：擁有多年開發工作經驗，分享技術代碼幫助學生學習，獨立完成自己的項目或者畢業設計。代碼可以私聊博主獲取。🌹贈送計算機畢業設計600個選題excel文件，幫助大學選題。贈送開題報告模板&#xff…

閱讀更多...

突破編程_C++_字符串算法（判斷字符串是否包含）

突破編程_C++_字符串算法（判斷字符串是否包含）

1 算法題 ：判斷一個字符串是否包含另一個字符串的所有字符（不一定連續） 1.1 題目含義判斷一個字符串（稱為“主字符串”或“大字符串”）是否包含另一個字符串（稱為“子字符串”或“小字符串”&#xff09…

閱讀更多...

代碼隨想錄算法訓練營第31天—貪心算法05 | ● 435. 無重疊區間 ● *763.劃分字母區間 ● *56. 合并區間

代碼隨想錄算法訓練營第31天—貪心算法05 | ● 435. 無重疊區間 ● 763.劃分字母區間 ● 56. 合并區間

435. 無重疊區間 https://programmercarl.com/0435.%E6%97%A0%E9%87%8D%E5%8F%A0%E5%8C%BA%E9%97%B4.html 考點貪心算法重疊區間我的思路先按照區間左坐標進行排序，方便后續處理進行for循環，循環范圍是0到倒數第二個元素如果當前區間和下一區間重疊…

閱讀更多...

在Linux以命令行方式（靜默方式/非圖形化方式）安裝MATLAB（正版）

在Linux以命令行方式（靜默方式/非圖形化方式）安裝MATLAB（正版）

1.根據教程，下載windows版本matlab，打開圖形化界面，選擇linux版本的只下載不安裝 2.獲取安裝文件夾 3.獲取許可證 4.安裝 （1）跳過引用文章的2.2章節 （2）本文的安裝文件夾代替引用文章的解壓IS…

閱讀更多...

Java進階（鎖）——鎖的升級，synchronized與lock鎖區別

Java進階（鎖）——鎖的升級，synchronized與lock鎖區別

目錄引出Java中鎖升級synchronized與lock鎖區別緩存三兄弟：緩存擊穿、穿透、雪崩緩存擊穿緩存穿透緩存雪崩總結引出 Java進階（鎖）——鎖的升級，synchronized與lock鎖區別 Java中鎖升級看一段代碼： public class…

閱讀更多...

Fastwhisper + Pyannote 實現 ASR + 說話者識別

Fastwhisper + Pyannote 實現 ASR + 說話者識別

文章目錄前言一、faster-whisper簡單介紹二、pyannote.audio介紹三、faster-whisper pyannote.audio 實現語者識別四、多說幾句前言最近在研究ASR相關的業務，也是調研了不少模型，踩了不少坑，ASR這塊，目前中文普通話效果最好的…

閱讀更多...

Scrapy與分布式開發(1.1)：課程導學

Scrapy與分布式開發(1.1)：課程導學

Scrapy與分布式開發：從入門到精通，打造高效爬蟲系統課程大綱在這個專欄中，我們將一起探索Scrapy框架的魅力，以及如何通過Scrapy-Redis實現分布式爬蟲的開發。在本課程導學中，我們將為您簡要介紹課程的學習目標、內容…

閱讀更多...

Verilog Coding Styles For Improved Simulation Efficiency論文學習記錄

Verilog Coding Styles For Improved Simulation Efficiency論文學習記錄

原文基于Verilog-XL仿真器，測試了以下幾種方式對仿真效率的影響。 1. 使用 Case 語句而不是 if / else if 語句八選一多路選擇器 case 實現效率比 if / else if 提升 6% 。 2. 如果可以盡量不使用 begin end 語句使用 begin end 的 ff 觸發器比不使用 begin end …

閱讀更多...

初學者學習51還是STM32

初學者學習51還是STM32

初學者學習51還是STM32 在嵌入式系統領域，51和STM32是兩種常見的單片機架構。對于初學者來說，選擇學習哪種架構可能會成為一個難題。本文將對初學者學習51和STM32進行比較，以幫助讀者做出明智的選擇。 1. 51架構 51架構是指Intel 8051系列…

閱讀更多...

深度相機xyz點云文件三維坐標和jpg圖像文件二維坐標的相互變換函數

深度相機xyz點云文件三維坐標和jpg圖像文件二維坐標的相互變換函數

深度相機同時拍攝xyz點云文件和jpg圖像文件。xyz文件里面包含三維坐標[x,y,z]和jpg圖像文件包含二維坐標[x，y],但是不能直接進行變換，需要一定的步驟來推演。下面函數是通過box二維框[xmin, ymin, xmax, ymax, _, _ ]去截取xyz文件中對應box里面的點云…

閱讀更多...

MyCAT學習——在openEuler22.03中安裝MyCAT2（網盤下載版）

MyCAT學習——在openEuler22.03中安裝MyCAT2（網盤下載版）

準備工作因為MyCAT 2基于JDK 1.8開發。也需要在虛擬機中安裝JDK（JDK官網就能下載，我這提供一個捷徑） jdk-8u401-linux-x64.rpmhttps://pan.baidu.com/s/1ywcDsxYOmfZONpmH9oDjfw?pwdrhel下載對應的tar安裝包,以及對應的jar包安裝程序包…

閱讀更多...

最新文章