1、Tensor維度變換
1)Flatten
作用:將輸入tensor中從start_axis維度到end_axis維度合并為1維
2)Reshape
作用:將輸入Tensor描述轉換為新的shape
3)FreespaceExtract
作用:將h維變成1,其他維度不變,從而完成對h的采樣,采樣值所在位置由輸入的index參數決定
4)Pack
作用:Pack算子為TensorFlow原生算子,最新的版本已經改名為:Stack。該算子以指定的軸axis,將一個維度為R的張量數組轉變成一個維度為R+1的張量。
5)Pad
作用:進行數據擴充
6)Permute
作用:調整Tensor的輸入維度順序
7)ShuffleChannel
作用:調整C維的排序
使用網絡:ShuffleNet
8)Title
作用:將輸入數據在每個維度上復制指定次數來生成輸出數據
2、Tensor單個元素運算
1)Rsqrt
公式:y = 1 / sqrt{x}
2)Scale
公式:y(x)=scale*x+bias
3)AbsVal
公式:y(x)=|x|
4)Power
公式:f(x)= (scale * x + shift) ^ power
3、分類
Softmax
公式:
作用:通常作為分類網絡的最后一層,輸出每類的概率
4、畫框
1)ClipBoxes
作用:將輸入的框坐標限制在[0,img_w-1]和[0,img_h-1]之間。
2)DecodeBoxes
作用:將輸入框的長寬坐標轉換為描點坐標(框中心點坐標和長寬),然后進行修正,修正后再替換回長寬坐標
3)DetectPostProcess
作用:
(1)對輸入的框進行修正;
(2)按照得分進行排序;
(3)使用NMS進行過濾;
(4)每個分類取前N個框輸出。
4)FasterRcnnPredictions
作用:獲取得分最高的N個框,需要進行NMS處理。
使用網絡:MaskRcnn
5)FSRDectionOutput
作用:獲取得分最高的N個框,需要進行NMS處理
輸入數據:每個分類的得分數據、roi坐標、roi偏移、feature map的長和寬
使用網絡:FasterRcnn
6)GenerateRPNProposals
作用:根據輸入rois坐標和得分,輸出排序和NMS處理后的前N個框,框坐標形式為左上角和右下角
使用網絡:Mask Rcnn
7)Proposal
作用:根據錨點前后得分、錨點偏移、原始圖片的長寬縮放,來獲取得分最高的N個預選框;
特點:對特征圖上的每個點,生成scale*ratio個固定大小的窗口;即候選窗口是該算子生成的。
8)SsdDetectionOutput
作用:用來生成預測框相對原圖的真實坐標,并對所有預測框進行過濾,得到最終物體檢測的結果。輸出的每個預測框的信息包括image id ,lable, confidence以及四個坐標值。
使用網絡:SSD
8)SsdPriorBox
作用:生成預選框
使用網絡:SSD
5、拼接
Concat:實現多個算子的拼接
6、旋轉/縮放/平移/剪切
spatial transform
參考:https://blog.csdn.net/qq_39422642/article/details/78870629
作用:在CNN之前對feature map進行旋轉、縮放、平移、剪切等操作
使用網絡:Spatial Transformer Networks(STN)
————————————————
版權聲明:本文為CSDN博主「gapostal」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/zhuhaodonglei/article/details/100014178