卷積神經網絡經典架構演進

LeNet-5

網絡架構

輸入 32x32
卷積C1 6@28x28
池化S2 6@14x14
卷積C3 16@10x10
池化S4 16@5x5
全連接F5 120
全連接F6 84
輸出 10
LeNet-5網絡架構示例圖
LeNet-5網絡架構示例圖

核心貢獻

  1. 卷積-池化交替結構:奠定CNN基礎范式
  2. 特征層次提取:從邊緣→部件→對象
  3. 端到端訓練:原始像素到最終分類
  4. 權值共享:大幅減少參數

技術規格

  • 輸入尺寸:32×32灰度圖像
  • 卷積核:5×5
  • 池化:2×2平均池化
  • 激活函數:Sigmoid
  • 首次應用于手寫數字識別(MNIST)

AlexNet

突破性架構設計

AlexNet網絡架構示例圖
AlexNet網絡架構示例圖

革命性創新

  1. ReLU激活函數

    • 解決梯度消失問題
    • 加速訓練收斂
    • 計算效率高于Sigmoid/Tanh
  2. Dropout正則化

    • 在全連接層使用
    • 防止過擬合
    • 提升泛化能力
  3. 重疊池化

    • 池化步長(2)小于窗口大小(3)
    • 提升特征豐富性
    • 減少過擬合
  4. 多GPU并行

    • 首次分布式訓練
    • 跨GPU通信優化

卷積網絡結構優化之路

1. VGG

輸入224x224
2x卷積64
最大池化
2x卷積128
最大池化
3x卷積256
最大池化
3x卷積512
最大池化
3x卷積512
最大池化
全連接x3
輸出1000

核心思想

  • 同構塊設計:所有卷積層使用3×3小核
  • 深度堆疊:16-19層網絡
  • 特征傳遞:每塊通道數翻倍

3×3卷積優勢

  • 相同感受野下參數更少:2層3×3 vs 1層5×5
    • 參數量:2×(32C2) = 18C2 vs 25C2
  • 更多非線性變換
  • 決策函數更具判別性

2. ResNet

核心問題:深度網絡退化現象

跳躍連接
輸入
權重層
權重層
輸出

殘差塊設計
y=F(x,Wi)+xy = \mathcal{F}(x, {W_i}) + xy=F(x,Wi?)+x

創新價值

  1. 解決梯度消失問題
  2. 允許訓練1000+層網絡
  3. 特征復用與傳播

Inception結構

1×1卷積

核心功能

  1. 降維壓縮
    • 減少通道數
    • 控制計算量
  2. 特征重組
    • 跨通道信息整合
    • 增強特征表達能力
  3. 非線性增強
    • 添加ReLU激活
    • 提升模型表達能力
降維操作
256通道
64通道
1x1卷積64
256@28x28
輸出64@28x28

計算量對比

  • 直接5×5卷積:256×256×5×5×28×28 = 1.28G FLOPs
  • 1×1降維后:256×64×1×1×28×28 + 64×256×5×5×28×28 = 0.15G FLOPs
  • 計算量減少88%

Inception模塊

設計哲學

“讓網絡自己選擇最優特征尺度” - Christian Szegedy

基礎Inception模塊

輸入
1x1卷積
3x3卷積
5x5卷積
3x3最大池化
特征拼接
輸出
Inception示例圖
Inception示例圖

創新特點

  1. 并行多尺度處理

    • 1×1卷積:捕獲局部特征
    • 3×3卷積:中等感受野
    • 5×5卷積:大感受野
    • 池化:空間不變性
  2. 瓶頸設計

    • 每個分支前使用1×1卷積降維
    • 平衡計算復雜度
  3. 特征多樣性

    • 不同感受野特征融合
    • 增強模型表達能力

GoogleNet(了解)

網絡架構全景

Inception示例圖
Inception示例圖

核心成就

  • 2014 ImageNet冠軍(Top-5錯誤率6.67%)
  • 僅500萬參數(AlexNet的1/12)
  • 計算量1.5G FLOPs(AlexNet的1/3)

創新設計

  1. Inception模塊堆疊:9個模塊化單元
  2. 中間輔助分類器:2個輔助輸出
  3. 高效特征金字塔:寬度漸增,深度漸減

卷積神經網絡特征可視化

理解CNN的"視覺世界"

可視化方法

  1. 第一層濾波器可視化

    原始圖像
    第一層卷積
    濾波器權重
    邊緣/紋理模式
  2. 特征圖激活可視化

    輸入圖像
    卷積層
    選擇特定特征圖
    上采樣回原圖
    激活區域可視化
  3. 最大激活圖像

    選擇神經元
    搜索數據集
    找到最大激活圖像
    理解神經元響應

層次化特征學習

特征抽象層次

可視化示例
邊緣
紋理
部件
Gabor濾波器
淺層特征
網格/環狀模式
中層特征
物體部件
深層特征
完整物體
高級語義
  1. 淺層(Conv1-2)

    • 邊緣檢測器
    • 顏色對比區域
    • 方向敏感紋理
  2. 中層(Conv3-4)

    • 紋理組合
    • 重復圖案
    • 簡單形狀
  3. 深層(Conv5+)

    • 物體部件(眼睛、車輪)
    • 復雜結構
    • 類別特定特征

經典CNN架構對比分析

架構創新點參數量計算量Top-5錯誤率
LeNet-5首CNN實踐6萬->1%(MNIST)
AlexNetReLU/Dropout6000萬1.1G FLOPs15.3%
VGG-16同構3×3塊1.38億15.5G FLOPs7.3%
Inception v3多尺度融合2400萬5G FLOPs5.6%
ResNet-50殘差連接2560萬4.1G FLOPs4.9%

總結

  1. 特征學習優于特征工程

    • CNN自動學習層次化特征
    • 端到端訓練消除人工干預
  2. 架構創新驅動性能突破

    • ReLU解決梯度消失
    • 殘差連接實現深度訓練
    • Inception優化計算效率
  3. 可視化解鎖黑箱

    • 特征可視化揭示網絡工作原理
    • 指導網絡設計與優化
    • 增強模型可解釋性
  4. 未來方向

    • 神經架構搜索(NAS)
    • 注意力機制融合
    • 多模態聯合學習
    • 輕量化部署

“卷積神經網絡不僅改變了計算機視覺,更重塑了我們對學習的理解。” - Geoffrey Hinton

經典CNN架構的演進歷程,展現了一條從手工特征到自主學習、從淺層網絡到深層架構、從單一尺度到多尺度融合的技術進化之路。這些創新奠定了現代深度學習的基礎,也為未來人工智能的發展指明了方向。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/88023.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/88023.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/88023.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mybatis/mybatis-plus添加數據,自增id的值為負數

1、問題概述?使用mybatis-plus的insert方法添加數據的時候,數據雖然添加成功了,但是返回值為false,提示添加失敗。當觀察數據的時候,發現數據的自增主鍵id的值盡然為-1,或者無規律的長串負數,如…

商業創業融資項目計劃書PPT模版

創業融資計劃書PPT模版,營銷模式分析PPT模版,創業計劃書PPT模版,互聯網電商創業推廣手冊PPT模版,商業項目計劃書PPT模版,高端商業計劃通用PPT模版,商業計劃書,科技商業PPT模版 商業創業融資項目…

新人如何入門學習 STM32?

作為一個在嵌入式領域摸爬滾打了近10年的老兵,看到這個問題時我的思緒瞬間回到了當年那個懵懂的自己。說實話,2014年那個夏天,24歲的我剛從機械專業畢業卻被調劑到了廈門某馬的電子部門,第一次聽到"STM32"這個詞的時候&…

clickhouse數據庫表和doris數據庫表遷移starrocks數據庫時建表注意事項總結

目錄零、前言一、clickhouse數據庫表在starrocks數據庫建表時問題總結1.1 數據類型類問題:1.2 數據導出階段:二、doris 數據庫表在starrocks數據庫建表時問題總結2.1 properties不支持的屬性(直接刪除):2.2 properties…

社區云管家 - 智慧生活新方式 ——仙盟創夢IDE

社區服務熱門推薦數字化時代的社區服務新形態?在數字化浪潮席卷日常生活的今天,一個集多功能于一體的綜合社區官網正成為連接居民與社區服務的核心紐帶。這類平臺以 “一站式解決生活需求” 為核心,將看房、外賣、物業、快遞、求職、生鮮、出行、文具打…

MongoDB GridFS

MongoDB GridFS 引言 MongoDB 是一種高性能、可擴展的文檔存儲系統,它提供了靈活的數據模型和豐富的查詢功能。在處理大量非結構化數據時,MongoDB 的 GridFS 功能尤為突出。GridFS 是一種用于存儲和檢索大文件的解決方案,它可以存儲任意大小的文件,并將其分解為多個較小的…

Linux中程序的limits中的Max open files的配置由哪些參數決定

在 Linux 中,程序的 Max open files(最大打開文件數,即 ulimit -n)由多個層級的參數共同控制,具體如下: 1. 內核級全局限制(系統默認上限) 由 /proc/sys/fs/file-max 控制&#xff0…

git clone xxx.git 提示報錯:fatal: Unable to find remote helper for ‘http‘

[rootroot /home]# git clone http://gitlab.xxx.qunar.com/xx/xxx.git Cloning into ‘xxx’… fatal: Unable to find remote helper for ‘http’ 我今天在Linux服務器上執行git clone一個倉庫的代碼到機器上,但是執行的時候提示上面的錯誤,我就很詫異…

【機器學習筆記Ⅰ】10 特征工程

特征工程(Feature Engineering)詳解 特征工程是機器學習和數據科學中的核心環節,旨在通過對原始數據的轉換、組合和提取,構建更適合模型的高質量特征。其質量直接決定模型性能上限(“數據和特征決定了模型的上限&#…

20250708-03-string結構及命令詳解_筆記

一、字符串操作1. set命令1)set命令詳解基本語法與參數命令格式:set key value [ex 秒數]/[px 毫秒數][nx]/[xx]有效期設置:ex參數:以秒為單位設置過期時間,如set a 1 ex 10表示1…

SpringBoot3-集成MybatisPlus

此次操作是在多模塊下進行的&#xff0c;SpringBoot3-規劃多模塊目錄 添加管理依賴 根模塊 zibocoder-parent 的 pom.xml 中添加 MybatisPlus bom 管理依賴 <properties>...<mybatis-plus.version>3.5.12</mybatis-plus.version>... </properties> <…

部署MongoDB

環境:CentOS7 添加 MongoDB 官方 YUM 倉庫 sudo vi /etc/yum.repos.d/mongodb-org-6.0.repo 將以下內容粘貼到文件中(以 MongoDB 6.0 為例): [mongodb-org-6.0] name=MongoDB Repository baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/6.0/x86…

重學前端002 --響應式網頁設計 CSS 基礎

文章目錄css 樣式特殊說明根據在這里 Freecodecamp 實踐&#xff0c;調整順序后做的總結。 css 樣式 body {background-color: red; # 跟background-image 不同時使用background-image: url(https://cdn.freecodecamp.org/curriculum/css-cafe/beans.jpg);font-family: sans-…

Zig高并發爬取數據簡潔模版

上文中我們介紹了Zig語言得爬蟲的有些優劣勢&#xff0c;想必大家對于自身項目選擇那種語言做爬蟲應該有些思路了&#xff0c;今天我將使用Zig的標準庫來構建一個簡單的高并發爬蟲模板。由于Zig的異步機制和標準庫中的http模塊&#xff0c;我們可以實現一個基于事件循環的爬蟲。…

IS-IS 協議 | LSP 傳輸與鏈路狀態數據庫同步機制

略作整理&#xff0c;待校。IS-IS 中 SRM 與 SSN 標志的作用及協同機制 SRM 和 SSN 標志的作用 在 IS-IS 協議中&#xff0c;SRM 和 SSN 是兩個關鍵標志&#xff0c;用于控制和優化 LSP&#xff08;Link State PDU,鏈路狀態信息&#xff09;在網絡中的泛洪與同步過程。 一、SRM…

xxl-job 改造適配pg數據后的Jenkins自動部署

接上文適配pg數據庫之后需要進行部署&#xff0c;便有了此文 1.下載并安裝Jenkins如下&#xff1a; https://mirrors.jenkins.io/war-stable/2.504.3/jenkins.war nohup java -jar jenkins.war --httpPort8080 & 啟動Jenkins并解鎖安裝需要的環境&#xff0c;git&#xff0…

數據庫Oracle從入門到精通!第四天(并發、鎖、視圖)

八、并發控制數據庫是一個共享資源&#xff0c;可以為多個應用程序所共享&#xff0c;這些程序可以串行執行&#xff08;排隊執行&#xff09;&#xff0c;但是很多情況下&#xff0c;可能出現多個程序或一個程序中的多個進程并行的執行&#xff0c;這就是數據庫的并行操作&…

EXCEL(帶圖)轉html

文章目錄敘述1、效果2、excel 轉換主邏輯3、其他補充3.0 主前端bootstrap3.1 my.css&#xff1a;3.2 my.js3.3 入口home.html3.4 Data.ashx敘述 要實現H5 展示excel 查詢 了一下沒有好的辦法,自己寫了一個,簡單記錄一下 1、效果 用bootstrap 根據sheet做了一個菜單。 2、exc…

小程序富文本Editor插入圖片、超鏈接、公式等的一次嘗試

小程序插入圖片 通過EditorContext.insertImage接口可以實現圖片的插入&#xff1a; EditorContext.insertImage({src,width,height,data, })如何插入超鏈接、公式、視頻、表格等等? 通過EditorContext.insertCustomBlock應該是可以實現的&#xff0c;具體實現方式我沒有了…

傳輸層協議TCP、UDP

傳輸層協議TCP、UDP 1、TCP和UDP報文格式 傳輸層協議TCPvsUDP 傳輸層主要兩個傳輸協議&#xff0c;分別是TCP和UDP&#xff0c;負責提供流量控制、排序服務和錯誤校驗。 &#xff08;1&#xff09;TCP是面向連接的&#xff0c;一般用于傳輸數據量比較少&#xff0c;且對可靠性要…