深度學習（06）-- Network in Network（NIN）

文章目錄

目錄
- 1.NIN 結構
- 2.MLP卷積
- 3.全局均值池化
- 4.總體網絡架構
- 5.NIN補充
- - 5.1 廣義線性模型（GLM）的局限性
  - 5.2 CCCP層
  - 5.3 1*1卷積核作用（補充）
- 6.手勢識別RGB圖像--NIN結構

經典CNN中的卷積層就是用線性濾波器對圖像進行內積運算，在每個局部輸出后面跟著一個非線性的激活函數，最終得到的叫作特征圖。
這種卷積濾波器是一種廣義線性模型。所以用CNN進行特征提取時，其實就隱含地假設了特征是線性可分的，可實際問題往往不是線性可分的。
GLM的抽象能力比較弱，比線性模型更有表達能力的非線性函數近似器（比如MLP,徑向基神經）

5.2 CCCP層

MLPconv=CONV + MLP，因為conv是線性的，mlp是非線性的，mlp能夠得到更高的抽象，泛化能力更強。

跨通道時，mlpconv=卷積層 + 1×1卷積層，此時mlpconv層也叫cccp層
在這里插入圖片描述

5.3 1*1卷積核作用（補充）

在這里插入圖片描述

6.手勢識別RGB圖像–NIN結構

在這里插入圖片描述
收斂緩慢，且震蕩
加了一層softmax ，第一三塊后加了BatchNormalization，基本解決了

代碼實現：

def NIN(input_shape=(64,64,3), classes=6):X_input = Input(input_shape)"block 1"X = Conv2D(filters=4, kernel_size=(5,5), strides=(1,1), padding='valid', activation='relu', name='conv1')(X_input)X = BatchNormalization(axis=3)(X)X = Conv2D(filters=4, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp1')(X)X = Conv2D(filters=4, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp2')(X)X = MaxPooling2D((2,2), strides=(2,2), name='maxpool1')(X)"block 2"X = Conv2D(filters=8, kernel_size=(3,3), strides=(1,1), padding='valid', activation='relu', name='conv2')(X)X = BatchNormalization(axis=3)(X)X = Conv2D(filters=8, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp3')(X)X = Conv2D(filters=8, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp4')(X)X = AveragePooling2D((2,2), strides=(2,2), name='maxpool2')(X)"block 3"X = Conv2D(filters=16, kernel_size=(3,3), strides=(1,1), padding='valid', activation='relu', name='conv3')(X)X = BatchNormalization(axis=3)(X)X = Conv2D(filters=16, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp5')(X)X = Conv2D(filters=16, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp6')(X)X = MaxPooling2D((2,2), strides=(2,2), name='maxpool3')(X)"block 4"X = Conv2D(filters=6, kernel_size=(3,3), strides=(1,1), padding='same',  activation='relu', name='conv4')(X)X = BatchNormalization(axis=3)(X)X = Conv2D(filters=6, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp7')(X)X = Conv2D(filters=6, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp8')(X)X = AveragePooling2D((6,6), strides=(1,1), name='Avepool1')(X)"flatten"X = Flatten()(X)X = Dense(classes, activation='softmax', name='fc1')(X)model = Model(inputs=X_input, outputs=X, name='NIN')return model

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/445303.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/445303.shtml
英文地址，請注明出處：http://en.pswp.cn/news/445303.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！