每日Attention學習18——Grouped Attention Gate

模塊出處

[ICLR 25 Submission] [link] UltraLightUNet: Rethinking U-shaped Network with Multi-kernel Lightweight Convolutions for Medical Image Segmentation


模塊名稱

Grouped Attention Gate (GAG)


模塊作用

輕量特征融合


模塊結構

在這里插入圖片描述


模塊特點
  • 特征融合前使用Group Conv進行處理,比標準卷積更加輕量
  • 將融合得到的粗特征視為Spatial Attention Map, 并與Encoder特征相乘,從而實現名字中"Gate"的效果
  • 相較于特征融合模塊,也可以視為一種利用輔助信息(Decoder)特征以增強Encoder特征的增強模塊

模塊代碼
import torch
import torch.nn as nn
import torch.nn.functional as Fclass GAG(nn.Module):def __init__(self, F_g, F_l, F_int, kernel_size=1, groups=1):super(GAG,self).__init__()if kernel_size == 1:groups = 1self.W_g = nn.Sequential(nn.Conv2d(F_g, F_int, kernel_size=kernel_size,stride=1,padding=kernel_size//2,groups=groups, bias=True),nn.BatchNorm2d(F_int))self.W_x = nn.Sequential(nn.Conv2d(F_l, F_int, kernel_size=kernel_size,stride=1,padding=kernel_size//2,groups=groups, bias=True),nn.BatchNorm2d(F_int))self.psi = nn.Sequential(nn.Conv2d(F_int, 1, kernel_size=1,stride=1,padding=0,bias=True),nn.BatchNorm2d(1),nn.Sigmoid())self.activation = nn.ReLU(inplace=True)def forward(self,g,x):g1 = self.W_g(g)x1 = self.W_x(x)psi = self.activation(g1+x1)psi = self.psi(psi)return x*psiif __name__ == '__main__':x1 = torch.randn([1, 64, 44, 44])x2 = torch.randn([1, 64, 44, 44])gag = GAG(F_g=64, F_l=64, F_int=64//2, kernel_size=3, groups=64//2)out = gag(x1, x2)print(out.shape)  # [1, 64, 44, 44]

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894702.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894702.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894702.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

響應式編程_04Spring 5 中的響應式編程技術棧_WebFlux 和 Spring Data Reactive

文章目錄 概述響應式Web框架Spring WebFlux響應式數據訪問Spring Data Reactive 概述 https://spring.io/reactive 2017 年,Spring 發布了新版本 Spring 5, Spring 5 引入了很多核心功能,這其中重要的就是全面擁抱了響應式編程的設計思想和實…

C/C++編譯器

C/C 代碼是不可跨平臺的,Windows 和 Unix-like 有著不同的 API,C/C 在不同平臺有著不同編譯器。 MSVC Windows 平臺,MSVC 是 Visual Studio 中自帶的 C/C 編譯器。 GCC Unix-like 平臺,GCC 原名 GNU C Compiler,后…

python gltf生成預覽圖

使用Python生成GLTF模型的預覽圖 隨著3D技術的不斷發展,GLTF(GL Transmission Format)逐漸成為了Web和移動應用程序中最流行的3D文件格式之一。GLTF文件不僅能以較小的體積存儲復雜的3D模型,還支持動畫、材質、光照和紋理等特性。…

html中的表格屬性以及合并操作

表格用table定義,標簽標題用caption標簽定義;用tr定義表格的若干行;用td定義若干個單元格;(當單元格是表頭時,用th標簽定義)(th標簽會略粗于td標簽) table的整體外觀取決…

【JavaScript】《JavaScript高級程序設計 (第4版) 》筆記-Chapter3-語言基礎

三、語言基礎 ECMAScript 的語法很大程度上借鑒了 C 語言和其他類 C 語言,如 Java 和 Perl。ECMAScript 中一切都區分大小寫。無論是變量、函數名還是操作符,都區分大小寫。 所謂標識符,就是變量、函數、屬性或函數參數的名稱。標識符可以由…

【前端】【Ts】【知識點總結】TypeScript知識總結

一、總體概述 TypeScript 是 JavaScript 的超集,主要通過靜態類型檢查和豐富的類型系統來提高代碼的健壯性和可維護性。它涵蓋了從基礎數據類型到高級類型、從函數與對象的類型定義到類、接口、泛型、模塊化及裝飾器等眾多知識點。掌握這些內容有助于編寫更清晰、結…

基于Springboot+vue的租車網站系統

基于SpringbootVue的租車網站系統是一個現代化的在線租車平臺,它結合了Springboot的后端開發能力和Vue的前端交互優勢,為用戶和汽車租賃公司提供了一個高效、便捷、易用的租車體驗和管理工具。以下是對該系統的詳細介紹: 一、系統架構 ?后…

藍橋杯之c++入門(二)【輸入輸出(上)】

目錄 前言1.getchar和 putchar1.1 getchar()1.2 putchar() 2.scanf和 printf2.1 printf2.1.1基本用法2.1.2占位符2.1.3格式化輸出2.1.3.1 限定寬度2.1.3.2 限定小數位數 2.2 scanf2.2.1基本用法2.2.2 占位符2.2.3 scanf的返回值 2.3練習練習1&#xff1a…

我的鴻蒙學習之旅:探索萬物互聯的新宇宙

在科技飛速發展的今天,操作系統領域的創新層出不窮。華為鴻蒙系統的出現,猶如一顆璀璨的新星,照亮了萬物互聯的未來之路。懷著對新技術的好奇與渴望,我踏上了學習鴻蒙的征程,這段經歷充滿了挑戰與驚喜,也讓…

Docker數據卷管理及優化

一、基礎概念 1.docker數據卷是一個可供容器使用的特殊目錄,它繞過了容器的文件系統,直接將數據存在宿主機上。 2.docker數據卷的作用: 數據持久化:即使容器被刪除或重建數據卷中的數據仍然存在 數據共享:多個容器可以…

java:mysql切換達夢數據庫(五分鐘適配完成)

背景 因為項目需要國產數據庫的支持,選擇了達夢數據庫,由于我們之前使用的是MySQL今天我們就來說一說,如何快速的切換到達夢數據庫,原本這一章我打算寫VIP章節的后續想想,就純分享。畢竟是國產數據庫遷移數據庫 這里…

在游戲本(6G顯存)上本地部署Deepseek,運行一個14B大語言模型,并使用API訪問

在游戲本6G顯存上本地部署Deepseek,運行一個14B大語言模型,并使用API訪問 環境說明環境準備下載lmstudio運行lmstudio 下載模型從huggingface.co下載模型 配置模型加載模型測試模型API啟動API服務代碼測試 deepseek在大語言模型上的進步確實不錯&#xf…

[leetcode]兩數之和等于target

源代碼 #include <iostream> #include <list> #include <iterator> // for std::prev using namespace std; int main() { int target 9; list<int> l{ 2, 3, 4, 6, 8 }; l.sort(); // 確保列表是排序的&#xff0c;因為雙指針法要求輸入是…

C# OpenCV機器視覺:學生注意力監測

小王是一位充滿活力的年輕教師&#xff0c;剛接手了一個新班級。他滿心歡喜地準備在課堂上大顯身手&#xff0c;把自己的知識毫無保留地傳授給學生。可沒上幾節課&#xff0c;他就發現了一個讓人頭疼的問題&#xff1a;課堂上總有那么幾個學生注意力不集中&#xff0c;要么偷偷…

DeepSeek R1技術報告關鍵解析(6/10):DeepSeek-R1 vs. OpenAI-o1-1217:性能對比分析

1. 為什么要對比 DeepSeek-R1 和 OpenAI-o1-1217&#xff1f; 在當前的大模型競爭中&#xff0c;OpenAI 的 o1-1217 被認為是推理能力較強的模型之一。 而 DeepSeek-R1 作為一個采用強化學習優化推理能力的開源模型&#xff0c;其性能是否能夠與 OpenAI-o1-1217 競爭&#xf…

PyQt6/PySide6 的 QTableView 類

QTableView 是 PyQt6 或 PySide6 庫中用于顯示二維表格數據的控件。它是一個非常強大且靈活的控件&#xff0c;適用于展示和編輯表格數據。QTableView 通常與 QAbstractItemModel 的子類&#xff08;如 QStandardItemModel 或自定義模型&#xff09;一起使用&#xff0c;以提供…

【嵌入式】C語言多文件編程與內聯函數

文章目錄 0 前言1 從C語言編譯說起2 重復定義錯誤&#xff08;ODR violation&#xff09;和條件編譯3 內聯函數inline和static inline4 總結 0 前言 最近在研究ARM內核代碼時&#xff0c;看到core_cm3.h中有大量的內聯函數&#xff0c;為此查閱了很多資料&#xff0c;也和朋友討…

10分鐘本地部署Deepseek-R1

10分鐘本地部署DeepSeek-R1 什么是DeepSeek-R1快速本地部署DeepSeek-R1Ollama下載Ollama安裝檢查是否安裝成功 安裝DeepSeek-R1模型模型使用測試 什么是DeepSeek-R1 DeepSeek-R1是中國的深度求索&#xff08;DeepSeek&#xff09;公司開發的智能助手。其具有極佳的語義理解和生…

Office / WPS 公式、Mathtype 公式輸入花體字、空心字

注&#xff1a;引文主要看注意事項。 1、Office / WPS 公式中字體轉換 花體字 字體選擇 “Eulid Math One” 空心字 字體選擇 “Eulid Math Two” 2、Mathtype 公式輸入花體字、空心字 2.1 直接輸入 花體字 在 mathtype 中直接輸入 \mathcal{L} L \Large \mathcal{L} L…

Python小游戲29乒乓球

import pygame import sys # 初始化pygame pygame.init() # 屏幕大小 screen_width 800 screen_height 600 screen pygame.display.set_mode((screen_width, screen_height)) pygame.display.set_caption("打乒乓球") # 顏色定義 WHITE (255, 255, 255) BLACK (…