深度學習之卷積神經網絡 AlexNet

AlexNet 是 2012年ILSVRC 比賽冠軍，遠超第二名的CNN，比LeNet更深，用多層小卷積疊加來替換單個的大卷積，結構如下圖所示。
??
在這里插入圖片描述

結構

原始圖片： $256 ? 256 ? 3$
圖像處理：
- 1.隨機的剪切，將 $256 ? 256$ 的圖片剪切成為 $224 ? 224$ 的圖片
- 2.對 $224 ? 224$ 的圖像做了一些旋轉和位置變換
- 3.對 $224 ? 224$ 的圖像做了一個圖像大小的擴大，變成 $227 ? 227$ 的圖片
備注：實際輸入AlexNet網絡的圖片是一個 $227 ? 227 ? 3$ 的圖片信息
激勵函數：論文中是：sigmoid，但是實際比賽的時候，使用的是ReLU
總參數量：60956032

input： $227 ? 227 ? 3$
filter： $3 ? 11 ? 11$
stripe： $4$
padding： $0$
filter size/depth： $48 ? 2$
output： $55 ? 55 ? 48 ? 2$
神經元數目： $55 ? 55 ? 48 ? 2$
參數個數： $(3 ? 11 ? 11 + 1) ? 48 ? 2 = 34944$
連接方式：
- 使用雙GPU來進行卷積操作，這個卷積操作和普通卷積一樣
- 兩個GPU并行的進行卷積操作，每個GPU只負責其中48個卷積核的計算
- 效果：可以并行的計算模型，模型執行效率可以得到提升，并且將GPU之間的通信放到網絡結構偏后的位置，可以降低信號傳輸的損耗"

非線性激活函數：ReLU

使用Max Pooling，并且提出池化核和步長，使池化核之間存在重疊，提升了特征的豐富性。

防止過擬合的方法：Dropout，Data augmentation（數據增強）

大數據訓練：百萬級ImageNet圖像數據

GPU實現：在每個GPU中放置一半核（或神經元），還有一個額外的技巧：GPU間的通訊只在某些層進行。

LRN歸一化：對局部神經元的活動創建了競爭機制，使得其中響應比較大的值變得相對更大，并抑制其它反饋較小的神經元，增強了模型的泛化能力。本質上，LRN是仿造生物學上活躍的神經元對于相鄰神經元的抑制現象（側抑制）

在AlexNet引入了一種特殊的網絡層次，即：Local Response Normalization(LRN, 局部響應歸一化)，主要是對ReLU激活函數的輸出進行局部歸一化操作，公式如下：

其中a表示第i個卷積核在(x,y)坐標位置經過激活函數的輸出值，這個式子的含義就是輸出一個值和它前后的n個值做標準化。k、n、α、β是超參數，在AlexNet網絡中分別為：2、5、10^-4、0.75，N為卷積核總數。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/453790.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/453790.shtml
英文地址，請注明出處：http://en.pswp.cn/news/453790.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！