深度學習篇---層與層之間搭配

在深度學習中，各種層（比如卷積層、激活函數、池化層等）的搭配不是隨意的，而是像 “搭積木” 一樣有規律 —— 每一層的作用互補，組合起來能高效提取特征、穩定訓練，最終提升模型性能。下面用通俗易懂的方式介紹最常見的層搭配邏輯和應用場景。

在講搭配前，先簡單回顧幾個核心層的 “功能”（像認識積木的形狀和用途）：

這是最經典的 “鐵三角” 搭配，幾乎所有卷積網絡都會用到，核心目的是高效提取特征并保持訓練穩定。

邏輯：
卷積層先提取特征（比如圖像中的邊緣）→ BN 層讓特征分布穩定（避免后續層 “不適應”）→ 激活函數（如 ReLU）過濾無效特征（把負數特征變成 0，保留有用的正數特征）。
為什么這樣排？
BN 要放在激活函數前：如果先激活（比如 ReLU 會把負數變成 0），會破壞數據的分布特性，BN 就難以穩定分布了。
應用場景：所有需要提取基礎特征的地方，比如 CNN 的前幾層（提取邊緣、顏色塊等）。

在一組基礎塊后加池化層，目的是逐步縮小特征圖，聚焦更重要的特征。

邏輯：
先通過 1-2 個 “卷積→BN→激活” 提取細節特征（比如小邊緣、紋理）→ 池化層（如最大池化）保留區域內最顯著的特征（比如 “這個區域有垂直邊緣”），同時把特征圖尺寸縮小一半（比如從 28x28 變成 14x14）。
作用：
減少參數（避免過擬合），同時增大 “感受野”（讓后面的層能看到更大范圍的輸入，比如從看 10x10 區域變成看 20x20 區域）。
應用場景：幾乎所有 CNN 的中間層，比如 LeNet、AlexNet 中，每經過 2-3 個卷積層就會接一個池化層。

當網絡很深（比如超過 50 層）時，單純堆疊基礎塊會出現 “退化”（層數越多，性能反而下降），殘差連接就是解決這個問題的 “特效藥”。

典型結構：
輸入 → 卷積→BN→ReLU → 卷積→BN → 加上輸入（殘差連接） → ReLU
（可以理解為：“主力部隊” 走卷積層提取特征，“偵察兵” 走捷徑直接把原始輸入傳過去，最后兩者匯合）
邏輯：
深層網絡的梯度容易在反向傳播時 “衰減到 0”（梯度消失），導致參數無法更新。殘差連接讓梯度能通過 “捷徑” 傳回淺層，保證深層參數也能被優化。
應用場景：所有深層網絡，比如 ResNet（18/34/50 層）、ResNeXt 等，殘差塊是它們能訓練到上百層的核心。

網絡的最后需要把提取的特征 “轉化” 為輸出結果（比如分類的類別概率），這部分搭配的核心是匯總特征并輸出預測。

邏輯：
經過多輪卷積和池化后，特征圖已經包含全局信息（比如 “這張圖有貓的耳朵、爪子”）→ 全局平均池化（把每個特征圖壓縮成一個數值，相當于 “總結” 每個特征的平均重要性）→ 全連接層把這些總結后的特征映射到類別數（比如 10 類分類就輸出 10 個值）→ Softmax 把數值轉換成概率（比如 “是貓的概率 90%”）。
為什么用全局池化？
替代傳統的全連接層可以減少參數，防止過擬合（全連接層參數太多，容易記住訓練數據的細節）。
應用場景：圖像分類、文本分類等需要輸出類別概率的任務，比如 ResNet、VGG 的最后幾層。

為了防止模型 “死記硬背” 訓練數據（過擬合），會在合適的位置加入 Dropout 層，作用是隨機 “關掉” 部分神經元，強迫模型學習更魯棒的特征。

典型位置：激活函數后，比如?卷積→BN→ReLU→Dropout。
邏輯：訓練時隨機讓一部分神經元不工作（比如 10% 的概率被關掉），模型就不能依賴某個特定神經元的輸出，只能學習更通用的特征（比如 “識別貓不能只看耳朵，還要看整體形狀”）。
注意：Dropout 只在訓練時生效，推理（預測）時會關掉，避免結果波動。
應用場景：數據量小、容易過擬合的任務，比如小樣本圖像分類、簡單的全連接網絡。

整體結構：
輸入 → 初始卷積→BN→ReLU→池化 → 多個殘差塊（每個殘差塊含2-3個卷積層） → 全局池化 → 全連接層 → Softmax

整體結構：
輸入 → backbone（類似ResNet的卷積+殘差塊，提取特征） → 頸部（額外卷積層，融合不同尺度特征） → 頭部（卷積層輸出目標位置和類別）

整體結構：
下采樣（卷積+池化，縮小尺寸提取特征） → 上采樣（反卷積，恢復尺寸） → 跳躍連接（把下采樣的細節特征傳給上采樣，保留邊緣信息） → 最后卷積層輸出每個像素的類別

深度學習中層的搭配不是 “隨便堆”，而是遵循 3 個原則：

記住這些原則，就能理解為什么某個層要放在另一個層后面 —— 就像做菜時 “先切菜、再翻炒、最后調味”，每一步都為最終的 “美味”（模型性能）服務。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/91437.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/91437.shtml
英文地址，請注明出處：http://en.pswp.cn/web/91437.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！