這里一般有常見的幾種方法:
1)將圖像縮放成大小一致后再輸入,如RCNN算法
2)roi pooling:這里允許輸入圖像的大小不一樣,后續根據指定的固定大小來求解池化的核大小,以此來得到相同大小的特征圖,如我目標是得到7*7的特征圖,這時候我有一個圖像是14*14,有一個圖像是21*21,則前一個圖像的池化卷積核為2*2,后一個池化卷積核為3*3這樣就保證了最后得到的特征圖都是7*7,這種方法稱之為roi pooling,但是會出現浮點數,這種方法直接取整,導致特征不完整,主要用在FASTER RCNN,在MASKrcnn中有所改進,用的是roi align算法,保留了浮點數然后根據雙線性插值后取值。