簡單記錄/推薦兩篇博客,后續細化寫一下:
圖像中的各類 attention
https://blog.csdn.net/weixin_44505185/article/details/127013204
Cross-attention的直觀理解
首先理解,cross-attention 是兩個不同向量間的相關計算,一般Q叫做查詢向量,K=V,V是被查詢向量;
簡單來講,對圖像而言,cross-attention可以看做:
將重要特征的強弱程度權重系數矩陣施加到圖像特征V上,得到最終的帶有注意力權重分布的圖像特征,在特征圖V上屬于Q的特征會被加強,不屬于Q的特征會被減弱。
https://blog.csdn.net/kdongyi/article/details/137084791