day46/60

@浙大疏錦行

DAY 46 通道注意力(SE注意力)

知識點回顧:

  1. 不同CNN層的特征圖:不同通道的特征圖
  2. 什么是注意力:注意力家族,類似于動物園,都是不同的模塊,好不好試了才知道。
  3. 通道注意力:模型的定義和插入的位置
  4. 通道注意力后的特征圖和熱力圖

內容參考

作業:

  1. 今日代碼較多,理解邏輯即可
  2. 對比不同卷積層特征圖可視化的結果(可選)

ps:

  • 我這里列出來的是通道注意力中的一種,SE注意力
  • 為了保證收斂方便對比性能,今日代碼訓練輪數較多,比較耗時
  • 目前我們終于接觸到了模塊,模塊本質上也是對特征的進一步提取,整個深度學習就是在圍繞特征提取展開的,后面會是越來越復雜的特征提取和組合步驟
  • 新增八股部分,在本講義目錄中可以看到----用問答的形式記錄知識點

今天的內容被拆開到2天完成,不然任務量有點大,熱圖順移到明天


我將用生活中常見的 **“圖書館檢索”“動物特長分工”** 等場景,把這些深度學習概念轉化為直觀易懂的內容,并通過比喻加深理解。

一、知識點通俗解釋 + 趣味比喻

1. 不同 CNN 層的特征圖:不同通道的特征圖

含義:CNN 每一層卷積后輸出的特征圖,可看作從不同角度提取圖像的信息;而每個特征圖的 “通道”,類似 RGB 圖像的紅、綠、藍通道,各自捕捉不同類型的特征。淺層特征圖聚焦邊緣、紋理等基礎元素,深層特征圖則捕捉物體形狀、語義等抽象信息。
比喻:把特征圖想象成?“圖書館的檢索卡片”?,通道就是?“不同的檢索關鍵詞”?。

?
  • 淺層網絡:用 “直線”“曲線” 等關鍵詞標記圖像,比如在貓的圖片里,某個通道專門找胡須的直線,另一個通道找毛發的曲線,這些卡片(特征圖)記錄的是零散的局部細節。
  • 深層網絡:改用 “貓耳”“貓尾” 等關鍵詞,通道們合作標注出完整的貓的輪廓。此時的卡片(特征圖)更抽象,能直接關聯到 “貓” 這個概念。
  • 不同通道:每個通道像一位 “專精館員”,有的只關注線條(紋理通道),有的只找顏色(色彩通道),各自從圖像里 “檢索” 特定信息。
2. 什么是注意力:注意力家族,類似于動物園,都是不同的模塊,好不好試了才知道

含義:注意力機制是一類讓模型聚焦重要信息、忽略次要信息的技術,包含多種不同類型的模塊(如通道注意力、空間注意力、自注意力等),每種模塊通過不同方式分配 “注意力權重”,提升模型性能。實際效果需通過實驗驗證。
比喻:把注意力機制比作?“動物園的動物特工隊”?:

?
  • 注意力家族:動物園里有不同動物(模塊),老鷹擅長高空偵查(全局信息捕捉),狐貍擅長潛入尋找目標(局部細節挖掘)。模型遇到任務時,可以 “雇傭” 不同動物(選擇不同模塊),讓它們用特長找關鍵信息。
  • 好不好試了才知道:就像派老鷹和狐貍同時執行任務,有時老鷹一眼鎖定目標更高效,有時狐貍靠靈活走位找到線索更好用。模型訓練時也需要嘗試不同注意力模塊,看哪種組合在特定任務(如貓狗分類)中表現最佳。
3. 通道注意力:模型的定義和插入的位置

含義:通道注意力模塊通過學習每個通道的重要性,為不同通道分配權重,增強關鍵通道(如識別貓的 “貓耳”“貓尾” 特征通道)的信號,抑制無關通道。通常插入在卷積層之后,用于調整特征圖的通道信息。
比喻:通道注意力是?“圖書館的資源調度員”?:

?
  • 模型定義:調度員分析所有檢索卡片(特征圖的通道),給 “貓耳”“貓尾” 等關鍵卡片貼上 “加急處理” 標簽(高權重),給記錄雜線的卡片貼上 “普通” 標簽(低權重),讓后續流程優先處理重要信息。
  • 插入位置:調度員在圖書館的中間環節工作,當館員們(卷積層)剛整理完檢索卡片(輸出特征圖),調度員就立刻介入,調整卡片的優先級,再交給下一個部門(后續網絡層)。
4. 通道注意力后的特征圖和熱力圖

含義:經過通道注意力加權后,特征圖中關鍵通道的信息被增強,次要通道被削弱;熱力圖則可視化通道注意力的權重分布,高亮顯示模型關注的重點通道。
比喻

?
  • 特征圖:類似?“重點標注版檢索卡片”?,調度員處理后,“貓耳”“貓尾” 等關鍵卡片顏色變深、字號變大(權重提升),雜線卡片顏色變淡(權重降低),讓后續流程一眼看清重點。
  • 熱力圖:好比?“調度員的工作記錄”?,用紅色高亮標注出被賦予高權重的通道(如 “貓耳” 通道),藍色表示低權重通道,直觀展示模型更關注圖像的哪些信息維度。

二、核心要點總結表

知識點核心概念比喻場景關鍵作用
不同 CNN 層的特征圖分層提取圖像特征,通道聚焦不同信息圖書館檢索卡片與關鍵詞從局部到整體抽象特征提取
注意力機制多種模塊聚焦重要信息動物園動物特工隊提升模型對關鍵信息的敏感度
通道注意力加權調整特征圖的通道重要性圖書館資源調度員增強關鍵通道,抑制次要通道
注意力后的特征圖與熱力圖增強關鍵信息,可視化權重分布重點標注卡片與工作記錄優化特征表達,直觀展示關注點
?

通過這些比喻,復雜的深度學習概念變得像生活故事一樣好理解。如果想進一步了解某部分細節,隨時可以告訴我!



error:

import matplotlib.pyplot as plt
import numpy as npdef visualize_feature_maps(feature_maps, title='Feature Maps'):num_maps = feature_maps.shape[0]size = int(np.ceil(np.sqrt(num_maps)))fig, axes = plt.subplots(size, size, figsize=(10, 10))fig.suptitle(title)for idx, ax in enumerate(axes.flat):if idx < num_maps:ax.imshow(feature_maps[idx], cmap='viridis')ax.axis('off')plt.show()
import torch
# 設置模型為評估模式
model.eval()# 定義需要可視化的卷積層
layers_to_visualize = [model.conv1, model.conv2, model.conv3]  # 需根據實際模型結構調整for idx, layer in enumerate(layers_to_visualize):# 注冊鉤子函數獲取該層的輸出activation = {}  def get_activation(name):def hook(model, input, output):activation[name] = output.detach()return hooklayer.register_forward_hook(get_activation(f'layer_{idx}'))# 前向傳播with torch.no_grad():_ = model(test_image.unsqueeze(0))# 獲取該層的特征圖feature_maps = activation[f'layer_{idx}'].squeeze(0).cpu().numpy()# 可視化特征圖visualize_feature_maps(feature_maps, title=f'Feature Maps of Layer {idx+1}')

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/86729.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/86729.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/86729.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

提升創作效率:輕松調用固定素材與模板

日常工作和生活中&#xff0c;我們經常需要復制粘貼不同類型的數據&#xff0c;如文本、圖片、文件等。使用剪切板管理工具可以快速訪問之前復制的內容&#xff0c;而無需反復切換應用進行復制操作。 這款綠色便攜版應用&#xff0c;無需安裝&#xff0c;雙擊即開&#xff0c;…

【C++】組合模式

目錄 一、模式核心概念與結構二、C 實現示例&#xff1a;文件系統三、組合模式的關鍵特性四、應用場景五、組合模式與其他設計模式的關系六、C 標準庫中的組合模式應用七、優缺點分析八、實戰案例&#xff1a;圖形編輯器九、實現注意事項如果這篇文章對你有所幫助&#xff0c;渴…

C++包管理工具:conan2持續集成 (CI) 教程

1.持續集成 (CI) ? 這是一個高級主題&#xff0c;需要具備 Conan 的基礎知識。請先閱讀并練習用戶教程。本節面向設計和實施涉及 Conan 包的生產 CI 管道的 DevOps 和構建工程師。如果不是這種情況&#xff0c;您可以跳過本節。 持續集成 (CI) 對不同用戶和組織有不同的含義…

免費SSL證書一鍵申請與自動續期

免費SSL證書申請與自動續期教程 本文介紹如何通過樂此加密&#xff08;www.letsencrypt.top) 實現免費SSL證書一鍵配置和自動續期 一、準備工作 服務器要求 Linux 系統&#xff08;推薦 Ubuntu/CentOS&#xff09;已安裝 curl 和 crontab擁有 sudo 權限的用戶 域名驗證 確保域…

【NLP】自然語言項目設計

目錄 項目簡介 要求 需要考慮的問題 硬件需求和環境配置 n卡驅動配置 以cuda11.8 版本為例 下載對應的cudnn(version11) 安裝GPU版本的torch 安裝gpu版本的TensorFlow 檢查cuda安裝情況 項目簡介 訓練一個模型&#xff0c;實現歌詞仿寫生成 任務類型&#xff1a;文本…

設計模式:觀察者模式 (Observer) 案例詳解

目錄 一、引言&#xff1a;為什么需要觀察者模式&#xff1f; 二、觀察者模式的核心原理 1. 角色劃分 2. 類圖關系 三、經典案例解析 案例1&#xff1a;天氣監測系統 案例2&#xff1a;股票價格監控系統 案例3&#xff1a;MVC架構中的模型-視圖分離 案例4&#xff1a;J…

CTF-Misc:開啟全方位解題之旅

目錄 一、CTF-Misc 入門指引二、基礎技能儲備2.1 文件格式識別2.2 基礎工具使用 三、信息搜集技巧3.1 搜索引擎技巧3.2 網絡信息挖掘 四、編碼轉換奧秘4.1 常見編碼類型4.2 編碼轉換工具 五、隱寫分析秘籍5.1 圖片隱寫5.1.1 LSB 隱寫5.1.2 顏色通道與 Exif 信息5.1.3 圖片修復與…

Adobe創意套件深度挖掘:效率倍增與靈感迸發的新玩法

最近在深入體驗奧地利Blueskyy藝術學院的Adobe正版教育訂閱&#xff0c;并研究全家桶時有不少新發現&#xff0c;忍不住想和大家分享一下。 先簡單說下這個訂閱的感受&#xff1a; Firefly 積分。 這應該是我用過Firefly積分最多的版本&#xff0c;1500點/周。對于我們這些創意…

左神算法之有序二維矩陣中的目標值查找

有序二維矩陣中的目標值查找 目錄 有序二維矩陣中的目標值查找1. 題目描述2. 問題解釋3. 解決思路方法一&#xff1a;逐行二分查找&#xff08;適合行數較少的情況&#xff09;方法二&#xff1a;利用行列有序特性&#xff08;最優解&#xff09; 4. 代碼實現5. 總結 1. 題目描…

深入理解AVL樹及其旋轉操作

AVL樹的概念 二叉搜索樹雖可以縮短查找的效率&#xff0c;但如果數據有序或接近有序二叉搜索樹將退化為單枝樹&#xff0c;查找元素相當于在順序表中搜索元素&#xff0c;效率低下。因此&#xff0c;兩位俄羅斯的數學家G.M.Adelson-Velskii和E.M.Landis在1962年發明了一種方法…

URL帶有中文會引入哪些問題

處理含中文字符的 URL 1 為什么會出現“亂碼”或崩潰&#xff1f; URL 標準&#xff08;RFC 3986&#xff09;規定&#xff1a;除少數保留字符外&#xff0c;URL 只能包含 ASCII。中文屬于 Unicode&#xff0c;因此必須先轉換。如果直接把 https://example.com/路徑/ 這樣的字…

結構體字段能否單獨加 mut

你問的這個問題在 Rust 里很常見&#xff1a; 一、結構體字段能否單獨加 mut 1. 結構體字段能否單獨加 mut&#xff1f; 不能。Rust 中&#xff0c;mut 是用來修飾變量綁定的&#xff0c;可變性是綁定的屬性&#xff0c;而不是結構體字段本身的屬性。 你不能寫&#xff1a; …

scGPT-spatial 復現

文章目錄 ? 總體流程總覽&#xff08;從 H5AD 到模型訓練&#xff09;&#x1f527; 步驟 1&#xff1a;讀取 H5AD 文件并做基礎預處理&#x1f9f1; 步驟 2&#xff1a;構造訓練樣本輸入&#xff08;token、value&#xff09;&#x1f4e6; 步驟 3&#xff1a;使用 DataColla…

運放電壓跟隨器為什么要加電阻

運放電壓跟隨器為什么要加電阻 我們常見運放的電壓跟隨器如下&#xff1a; 有時候會看見電路中加兩個電阻&#xff1a; 作用就是保護運放&#xff0c;起限流電阻的作用。 當輸入電壓高的時候&#xff0c;運放內部存在鉗位二極管&#xff0c;此電阻就能限流。 并不是所有運放…

MinerU 2.0部署

簡介 MinerU 2.0使用sglang加速&#xff0c;與之前差別較大&#xff0c;建議按照官方的Docker鏡像的方式啟動。 Docker鏡像 Dockerfile 這是官方的Dockerfile # Use the official sglang image FROM lmsysorg/sglang:v0.4.7-cu124# install mineru latest RUN python3 -m …

黑馬python(十七)

目錄&#xff1a; 1.數據可視化-地圖-基礎案例 2.全國疫情地圖 3.河南省疫情地圖繪制 4.基礎柱狀圖構建 5.基礎時間線柱狀圖繪制 6.動態GDP柱狀圖繪制 1.數據可視化-地圖-基礎案例 圖示有點對的不準&#xff0c;可以通過后面的參數 2.全國疫情地圖 3.河南省疫情地圖繪制…

Segment Anything in High Quality之SAM-HQ論文閱讀

摘要 最近的 Segment Anything Model(SAM)在擴展分割模型規模方面取得了重大突破,具備強大的零樣本能力和靈活的提示機制。盡管 SAM 在訓練時使用了 11 億個掩碼,其掩碼預測質量在許多情況下仍不理想,尤其是對于結構復雜的目標。我們提出了 HQ-SAM,使 SAM 能夠精確地分割…

深入理解_FreeRTOS的內部實現(2)

1.事件組 事件組結構體&#xff1a; 事件組 “不關中斷” 的核心邏輯 事件組操作時&#xff0c;優先選擇 “關調度器” 而非 “關中斷” &#xff0c;原因和實現如下&#xff1a; 關調度器&#xff08;而非關中斷&#xff09; FreeRTOS 提供 taskENTER_CRITICAL()&#xff08;…

【圖論題典】Swift 解 LeetCode 最小高度樹:中心剝離法詳解

文章目錄 摘要描述題解答案題解代碼分析思路來源&#xff1a;樹的“中心剝離法”構造鄰接表和度數組循環剝葉子終止條件 示例測試及結果時間復雜度空間復雜度總結 摘要 樹是一種重要的數據結構&#xff0c;在許多應用里&#xff0c;我們希望選一個根&#xff0c;讓這棵樹的高度…

Docker的介紹與安裝

? Docker 對初學者的簡單解釋和應用場景 1.什么是 Docker&#xff1f; 簡單來說&#xff0c;Docker 就像一個“裝箱子”的工具&#xff0c;這個箱子叫做“容器”。 你寫的程序和它運行需要的環境&#xff08;比如操作系統、軟件、工具&#xff09;都裝進一個箱子里。這個箱…