Deep Residual Learning for Image Recognition,由Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun于2016年發表在CVPR上
1512.03385 (arxiv.org)https://arxiv.org/pdf/1512.03385
下圖中,左側為VGG19網絡,中間為34層的普通網絡,右側為34層的深度殘差網絡ResNet。
從圖中可以直觀感受到ResNet的特點:
- ResNet直接使用stride=2的卷積做下采樣,并且用average pool層替換了全連接層。?
- ResNet在網絡中引入了殘差模塊,輸入和輸出進行跳躍連接,綜合形成殘差單元。
- 同時,當feature map大小降低一半時,feature map的數量增加一倍,圖中虛線就表示feature map數量發生了改變,ResNet通過這種變化保持網絡層的復雜度。