stn算子_深度學習常用算子（二）

1、Tensor維度變換

1)Flatten

作用：將輸入tensor中從start_axis維度到end_axis維度合并為1維

2)Reshape

作用：將輸入Tensor描述轉換為新的shape

3)FreespaceExtract

作用：將h維變成1，其他維度不變，從而完成對h的采樣，采樣值所在位置由輸入的index參數決定

4)Pack

作用：Pack算子為TensorFlow原生算子，最新的版本已經改名為：Stack。該算子以指定的軸axis，將一個維度為R的張量數組轉變成一個維度為R+1的張量。

5)Pad

作用：進行數據擴充

6)Permute

作用：調整Tensor的輸入維度順序

7)ShuffleChannel

作用：調整C維的排序

使用網絡：ShuffleNet

8)Title

作用：將輸入數據在每個維度上復制指定次數來生成輸出數據

2、Tensor單個元素運算

1)Rsqrt

公式：y = 1 / sqrt{x}

2)Scale

公式：y(x)=scale*x+bias

3)AbsVal

公式：y(x)=|x|

4)Power

公式：f(x)= (scale * x + shift) ^ power

3、分類

Softmax

公式：

作用：通常作為分類網絡的最后一層，輸出每類的概率

4、畫框

1)ClipBoxes

作用：將輸入的框坐標限制在[0,img_w-1]和[0,img_h-1]之間。

2)DecodeBoxes

作用：將輸入框的長寬坐標轉換為描點坐標(框中心點坐標和長寬)，然后進行修正，修正后再替換回長寬坐標

3)DetectPostProcess

作用：

(1)對輸入的框進行修正；

(2)按照得分進行排序；

(3)使用NMS進行過濾；

(4)每個分類取前N個框輸出。

4)FasterRcnnPredictions

作用：獲取得分最高的N個框，需要進行NMS處理。

使用網絡：MaskRcnn

5)FSRDectionOutput

作用：獲取得分最高的N個框，需要進行NMS處理

輸入數據：每個分類的得分數據、roi坐標、roi偏移、feature map的長和寬

使用網絡：FasterRcnn

6)GenerateRPNProposals

作用：根據輸入rois坐標和得分，輸出排序和NMS處理后的前N個框，框坐標形式為左上角和右下角

使用網絡：Mask Rcnn

7)Proposal

作用：根據錨點前后得分、錨點偏移、原始圖片的長寬縮放，來獲取得分最高的N個預選框；

特點：對特征圖上的每個點，生成scale*ratio個固定大小的窗口；即候選窗口是該算子生成的。

8)SsdDetectionOutput

作用：用來生成預測框相對原圖的真實坐標，并對所有預測框進行過濾，得到最終物體檢測的結果。輸出的每個預測框的信息包括image id ,lable, confidence以及四個坐標值。

使用網絡：SSD

8)SsdPriorBox

作用：生成預選框

使用網絡：SSD

5、拼接

Concat：實現多個算子的拼接

6、旋轉/縮放/平移/剪切

spatial transform

參考：https://blog.csdn.net/qq_39422642/article/details/78870629

作用：在CNN之前對feature map進行旋轉、縮放、平移、剪切等操作

使用網絡：Spatial Transformer Networks(STN)

————————————————

原文鏈接：https://blog.csdn.net/zhuhaodonglei/article/details/100014178

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/532096.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/532096.shtml
英文地址，請注明出處：http://en.pswp.cn/news/532096.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！