sparse transformer 常見稀疏注意力

參考:
https://zhuanlan.zhihu.com/p/259591644

主要就是降低transformer自注意力模塊的復雜度
復雜度主要就是 Q · K^T影響的,稀疏注意力就是在Q點乘K的轉置這模塊做文章
在這里插入圖片描述

下列式一些sparse transformer稀疏注意力方法

a、transformer原始的 , Q · K^T,其中 K^T 表示 K 的轉置
b、每個token與前后三個做自注意力計算
c、膨脹注意力(dilated attention):每個token與前后三個做自注意力計算,但這三個有間隔,就是比如第一個token看右面3,5,7
d、全局token是第一二個token看所有的token,3及后面的token只看· K^T 矩陣的1、2token;sliding劃窗見b
在這里插入圖片描述

a、全局token是第一二個token看所有的token,3及后面的token只看· K^T 矩陣的1、2token
b、劃窗
c、見上面c
d、random
e、Q矩陣的123token 看 · K^T123token;Q矩陣的456token 看 · K^T456token 。。。。
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/719534.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/719534.shtml
英文地址,請注明出處:http://en.pswp.cn/news/719534.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

b站小土堆pytorch學習記錄—— P17 土堆說卷積操作

文章目錄 一、前置知識什么是卷積操作 二、代碼 一、前置知識 什么是卷積操作 推薦幾個高贊博客: 卷積最容易理解的解釋 卷積神經網絡(CNN)詳細介紹及其原理詳解 還有pytorch官網的動態圖: pytorch卷積 二、代碼 import t…

MyBatis源碼分析之基礎支持層反射

(/≧▽≦)/~┴┴ 嗨~我叫小奧 ??? 👀👀👀 個人博客:小奧的博客 👍👍👍:個人CSDN ??????:傳送門 🍹 本人24應屆生一枚,技術和水平有限&am…

PowerShell禁止運行腳本解決方案

錯誤代碼 CategoryInfo : SecurityError: (:) [],ParentContainsErrorRecordException FullyQualifiedErrorId : UnauthorizedAccess在計算機上啟動 Windows PowerShell 時,執行策略很可能是 Restricted(默認設置)。 Restricted …

圖像分類應用

先留一段圖像分類代碼,空閑時間再做分析: 創建神經網絡: import torch from torch import nn import torch.nn.functional as F class MyAlexNet(nn.Module):def __init__(self):super(MyAlexNet, self).__init__()self.c1nn.Conv2d(in_cha…

二刷代碼隨想錄算法訓練營第十天 | 232.用棧實現隊列、 225. 用隊列實現棧

目錄 一、232. 用棧實現隊列 二、225. 用隊列實現棧 一、232. 用棧實現隊列 題目鏈接:力扣 文章講解:代碼隨想錄 視頻講解: 棧的基本操作! | LeetCode:232.用棧實現隊列 題目: 請你僅使用兩個棧實現先…

Vision Pro開發者學習路線

官方給到的Vision Pro開發者學習路線: 1. 學習基礎知識: - 學習 Xcode、Swift 和 SwiftUI 的基礎知識,包括語法、UI 設計等。 - 掌握 ARKit 和 SwiftUI 的使用,了解如何創建沉浸式增強現實體驗。 2. 學習 3D 建模&#xf…

『Linux從入門到精通』第 ? 期 - System V 共享內存

文章目錄 💐專欄導讀💐文章導讀🐧共享內存原理🐧共享內存相關函數🐦key 與 shmid 區別 🐧代碼實例 💐專欄導讀 🌸作者簡介:花想云 ,在讀本科生一枚&#xff0…

CentOS7安裝DockerCompose和Docker鏡像倉庫的配置

CentOS7安裝DockerCompose 1.下載 Linux下需要通過命令下載: # 安裝 curl -L https://github.com/docker/compose/releases/download/1.23.1/docker-compose-uname -s-uname -m > /usr/local/bin/docker-compose2.修改文件權限 修改文件權限: # …

YOLOv9獨家原創改進|加入幽靈卷積Ghost Convolution模塊,輕量化!

專欄介紹:YOLOv9改進系列 | 包含深度學習最新創新,主力高效漲點!!! 一、論文摘要 由于內存和計算資源有限,在嵌入式設備上部署卷積神經網絡是困難的。特征圖中的冗余是那些成功的細胞神經網絡的一個重要特征…

【網站項目】158企業人事管理系統

🙊作者簡介:擁有多年開發工作經驗,分享技術代碼幫助學生學習,獨立完成自己的項目或者畢業設計。 代碼可以私聊博主獲取。🌹贈送計算機畢業設計600個選題excel文件,幫助大學選題。贈送開題報告模板&#xff…

突破編程_C++_字符串算法(判斷字符串是否包含)

1 算法題 :判斷一個字符串是否包含另一個字符串的所有字符(不一定連續) 1.1 題目含義 判斷一個字符串(稱為“主字符串”或“大字符串”)是否包含另一個字符串(稱為“子字符串”或“小字符串”&#xff09…

代碼隨想錄算法訓練營第31天—貪心算法05 | ● 435. 無重疊區間 ● *763.劃分字母區間 ● *56. 合并區間

435. 無重疊區間 https://programmercarl.com/0435.%E6%97%A0%E9%87%8D%E5%8F%A0%E5%8C%BA%E9%97%B4.html 考點 貪心算法重疊區間 我的思路 先按照區間左坐標進行排序,方便后續處理進行for循環,循環范圍是0到倒數第二個元素如果當前區間和下一區間重疊…

在Linux以命令行方式(靜默方式/非圖形化方式)安裝MATLAB(正版)

1.根據教程,下載windows版本matlab,打開圖形化界面,選擇linux版本的只下載不安裝 2.獲取安裝文件夾 3.獲取許可證 4.安裝 (1)跳過引用文章的2.2章節 (2)本文的安裝文件夾代替引用文章的解壓IS…

Java進階(鎖)——鎖的升級,synchronized與lock鎖區別

目錄 引出Java中鎖升級synchronized與lock鎖區別 緩存三兄弟:緩存擊穿、穿透、雪崩緩存擊穿緩存穿透緩存雪崩 總結 引出 Java進階(鎖)——鎖的升級,synchronized與lock鎖區別 Java中鎖升級 看一段代碼: public class…

Fastwhisper + Pyannote 實現 ASR + 說話者識別

文章目錄 前言一、faster-whisper簡單介紹二、pyannote.audio介紹三、faster-whisper pyannote.audio 實現語者識別四、多說幾句 前言 最近在研究ASR相關的業務,也是調研了不少模型,踩了不少坑,ASR這塊,目前中文普通話效果最好的…

Scrapy與分布式開發(1.1):課程導學

Scrapy與分布式開發:從入門到精通,打造高效爬蟲系統 課程大綱 在這個專欄中,我們將一起探索Scrapy框架的魅力,以及如何通過Scrapy-Redis實現分布式爬蟲的開發。在本課程導學中,我們將為您簡要介紹課程的學習目標、內容…

Verilog Coding Styles For Improved Simulation Efficiency論文學習記錄

原文基于Verilog-XL仿真器,測試了以下幾種方式對仿真效率的影響。 1. 使用 Case 語句而不是 if / else if 語句 八選一多路選擇器 case 實現效率比 if / else if 提升 6% 。 2. 如果可以盡量不使用 begin end 語句 使用 begin end 的 ff 觸發器比不使用 begin end …

初學者學習51還是STM32

初學者學習51還是STM32 在嵌入式系統領域,51和STM32是兩種常見的單片機架構。對于初學者來說,選擇學習哪種架構可能會成為一個難題。本文將對初學者學習51和STM32進行比較,以幫助讀者做出明智的選擇。 1. 51架構 51架構是指Intel 8051系列…

深度相機xyz點云文件三維坐標和jpg圖像文件二維坐標的相互變換函數

深度相機同時拍攝xyz點云文件和jpg圖像文件。xyz文件里面包含三維坐標[x,y,z]和jpg圖像文件包含二維坐標[x,y],但是不能直接進行變換,需要一定的步驟來推演。 下面函數是通過box二維框[xmin, ymin, xmax, ymax, _, _ ]去截取xyz文件中對應box里面的點云…

MyCAT學習——在openEuler22.03中安裝MyCAT2(網盤下載版)

準備工作 因為MyCAT 2基于JDK 1.8開發。也需要在虛擬機中安裝JDK(JDK官網就能下載,我這提供一個捷徑) jdk-8u401-linux-x64.rpmhttps://pan.baidu.com/s/1ywcDsxYOmfZONpmH9oDjfw?pwdrhel下載對應的tar安裝包,以及對應的jar包 安裝程序包…