動學學深度學習07-現代卷積神經網絡

動學學深度學習pytorch

參考地址:https://zh.d2l.ai/

文章目錄

  • 動學學深度學習pytorch
    • 1-第07章-現代卷積神經網絡
      • 1. AlexNet
        • 1.1 AlexNet 的核心貢獻是什么?
        • 1.2 AlexNet 與 LeNet 的主要區別有哪些?
        • 1.3 為什么 AlexNet 需要 GPU 訓練?
      • 2. VGG
        • 2.1 VGG 的核心設計思想是什么?
        • 2.2 VGG-11 的架構如何定義?
        • 2.3 為什么 VGG 計算量大于 AlexNet?
      • 3. NiN(Network in Network)
        • 3.1 NiN 如何解決全連接層的問題?
        • 3.2 NiN 的核心模塊是什么?
        • 3.3 NiN 的參數量為何顯著減少?
      • 4. GoogLeNet(Inception)
        • 4.1 Inception 塊的設計動機是什么?
        • 4.2 Inception 塊如何降低計算復雜度?
        • 4.3 GoogLeNet 的架構特點?
      • 5. 批量規范化(BatchNorm)
        • 5.1 批量規范化的作用是什么?
        • 5.2 批量規范化的計算流程?
        • 5.3 為什么批量規范化能正則化?
      • 6. ResNet(殘差網絡)
        • 6.1 殘差塊如何解決深層網絡退化問題?
        • 6.2 ResNet-18 的架構特點?
        • 6.3 為什么殘差連接有效?
      • 7. DenseNet(稠密連接網絡)
        • 7.1 DenseNet 與 ResNet 的核心區別?
        • 7.2 DenseNet 的關鍵模塊?
        • 7.3 為什么 DenseNet 參數更少?


1-第07章-現代卷積神經網絡

1. AlexNet

1.1 AlexNet 的核心貢獻是什么?

AlexNet 首次在大規模視覺競賽中證明:學習到的特征可以超越手工設計的特征,標志著深度學習在計算機視覺領域的重大突破。

1.2 AlexNet 與 LeNet 的主要區別有哪些?
  • 深度更深:8 層 vs LeNet 的 5 層
  • 激活函數:使用 ReLU 而非 Sigmoid
  • 參數規模:卷積通道數是 LeNet 的 10 倍,全連接層參數量達 1GB
  • 正則化:使用 Dropout 和大量數據增強(翻轉、裁切、變色)
1.3 為什么 AlexNet 需要 GPU 訓練?
  • 計算需求:大規模矩陣乘法和卷積操作(312 TFLOPS vs CPU 的 1 TFLOPS)
  • 內存需求:早期 GPU 顯存有限(3GB GTX580),需雙 GPU 并行設計

2. VGG

2.1 VGG 的核心設計思想是什么?

通過重復使用統一的 VGG塊(3×3 卷積 + ReLU + 2×2 最大池化)構建深層網絡,強調“更深更窄”的卷積比“更淺更寬”更有效。

2.2 VGG-11 的架構如何定義?
conv_arch = ((1,64), (1,128), (2,256), (2,512), (2,512))  # (卷積層數, 輸出通道數)
2.3 為什么 VGG 計算量大于 AlexNet?
  • 更深的卷積層(8 層 vs 5 層)
  • 更大的全連接層輸入(25088 vs 6400)

3. NiN(Network in Network)

3.1 NiN 如何解決全連接層的問題?

1×1 卷積層 替代全連接層,實現逐像素的 MLP,保留空間結構的同時減少參數量。

3.2 NiN 的核心模塊是什么?

NiN塊:1 個 3×3 卷積 + 2 個 1×1 卷積(逐像素 MLP)
最后用 全局平均池化層 替代全連接層輸出。

3.3 NiN 的參數量為何顯著減少?

取消全連接層后,參數量從 AlexNet 的 1GB 降至 NiN 的 10MB(Fashion-MNIST 示例)。

4. GoogLeNet(Inception)

4.1 Inception 塊的設計動機是什么?

通過 多尺度并行路徑(1×1、3×3、5×5 卷積 + 3×3 池化)高效提取圖像特征,解決“多大卷積核最合適”的問題。

4.2 Inception 塊如何降低計算復雜度?
  • 1×1 卷積降維:在 3×3 和 5×5 卷積前減少通道數(如 192→96)
  • 通道合并:四條路徑輸出在通道維度拼接。
4.3 GoogLeNet 的架構特點?
  • 9 個 Inception 塊堆疊
  • 全局平均池化層替代全連接層
  • 參數量僅為 AlexNet 的 1/12(6M vs 60M)

5. 批量規范化(BatchNorm)

5.1 批量規范化的作用是什么?

通過規范化中間層輸入(減均值除方差),加速收斂,減少對初始化和學習率的敏感性,同時具有正則化效果。

5.2 批量規范化的計算流程?
BN(x) = γ * (x - μ_B) / sqrt(σ2_B + ε) + β
  • μ_B 和 σ2_B:當前批次的均值和方差
  • γ 和 β:可學習的縮放和偏移參數
5.3 為什么批量規范化能正則化?

訓練中引入的批次統計噪聲(μ_B 和 σ2_B 的隨機性)相當于隱式正則化,類似于 Dropout 的效果。

6. ResNet(殘差網絡)

6.1 殘差塊如何解決深層網絡退化問題?

通過 跳躍連接(Skip Connection)使網絡能夠學習 殘差映射 F(x) = H(x) - x,而非直接擬合 H(x),確保新增層至少不劣于原網絡。

6.2 ResNet-18 的架構特點?
  • 4 個殘差模塊(每個含 2 個殘差塊)
  • 通道數逐模塊翻倍(64→128→256→512)
  • 全局平均池化層輸出(512→10)
6.3 為什么殘差連接有效?
  • 數學保證:嵌套函數類 F ? F’,新增層可退化為恒等映射
  • 梯度傳播:跳躍連接緩解梯度消失,支持訓練 152 層網絡。

7. DenseNet(稠密連接網絡)

7.1 DenseNet 與 ResNet 的核心區別?
  • 連接方式:ResNet 是 相加(x + F(x)),DenseNet 是 通道拼接([x, F(x)])
  • 特征復用:每一層接收前面所有層的特征圖作為輸入。
7.2 DenseNet 的關鍵模塊?
  • 稠密塊(DenseBlock):每層輸出通道數為增長率(如 32),輸入通道數線性增長(增長率 × 層數)。
  • 過渡層(Transition Layer):1×1 卷積降維 + 2×2 平均池化降采樣。
7.3 為什么 DenseNet 參數更少?
  • 特征復用減少冗余參數
  • 過渡層控制通道數(如 1024→512)
  • 增長率(32)遠小于 ResNet 的通道增量(256→512)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/919676.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/919676.shtml
英文地址,請注明出處:http://en.pswp.cn/news/919676.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

詳細講解Java中的反射和經典面試題(保姆級別)

1.1 反射的概述:專業的解釋(了解一下):是在運行狀態中,對于任意一個類,都能夠知道這個類的所有屬性和方法;對于任意一個對象,都能夠調用它的任意屬性和方法;這種動態獲取…

MyCAT完整實驗報告

MyCAT完整實驗報告 ? 前言 剛剛看了一下前面的那篇MyCAT的文章 感覺有一些問題 所以拿出一篇文章再說一下 單獨構建了完整的實驗環境 這樣會全面一點 ? 安裝MyCAT #跳過? 主從配置 #不多追溯 因為我們選擇的主從 也可以做雙主機 但我們后邊再說? 環境搭建 一、環境規劃 服務…

機器翻譯論文閱讀方法:頂會(ACL、EMNLP)論文解析技巧

更多內容請見: 機器翻譯修煉-專欄介紹和目錄 文章目錄 一、論文選擇:快速判斷論文價值 1.1 關注核心會議與子領域 1.2 篩選標準 1.3 預讀篩選 1.4 快速定位關鍵信息 二、精讀解析 2.1 問題定義(5分鐘) 2.2 方法解剖(15分鐘) 2.3 實驗深挖(20分鐘) 2.4 批判性思考(10分…

Transformer模型實戰篇

引入 基于Transformers的NLP解決方案的步驟如下:(以文本分類為例) 導入相關包,General,可以詢問ai需要導什么包加載數據集,Data_loader,Datasets數據集劃分,測試機,驗證集…

深入(流批【牛批】框架)Flink的機制

flink本身是專注有狀態的無限流處理,有限流處理【batch批次】是無限流處理的一中特殊情況!應用場景實時ETL 集成流計算現有的諸多數據通道和SQL靈活的加工能力,對流式數據進行實時清洗、歸并和結構化 處理;同時,對離線…

Git 2.15.0 64位安裝步驟Windows詳細教程從下載到驗證(附安裝包下載)

一、下載后雙擊運行 安裝包下載:https://pan.quark.cn/s/7200b32a1ecf,找到下載好的文件:?Git-2.15.0-64-bit.exe?雙擊這個文件,就會彈出安裝向導窗口,點 ??“Next”(下一步)?? 二、選擇…

在職老D滲透日記day23:sqli-labs靶場通關(第29關-31關)http參數過濾

5.29.第29關 http參數過濾 閉合5.29.1.手動注入(1)判斷注入類型、注入點閉合(2)有回顯,優先用聯合查詢注入,判讀字段數?id1&id2 order by 3 -- ?id1&id2 order by 4 --(3)…

Spring Boot整合Amazon SNS實戰:郵件訂閱通知系統開發

Spring Boot整合Amazon SNS實戰引言配置服務總結新用戶可獲得高達 200 美元的服務抵扣金 亞馬遜云科技新用戶可以免費使用亞馬遜云科技免費套餐(Amazon Free Tier)。注冊即可獲得 100 美元的服務抵扣金,在探索關鍵亞馬遜云科技服務時可以再額…

LeetCode_動態規劃1

動態規劃1.動態規劃總結1.1 01背1.1.1 二維數組1.1.2 一維數組1.2 完全背包2.斐波那契數(力扣509)3.爬樓梯(力扣70)4.使用最小花費爬樓梯(力扣746)5.不同路徑(力扣62)6.不同路徑 II(力扣63)7.整數拆分(力扣343)8.不同的二叉搜索樹(力扣96)9.分割等和子集(力扣416)10.最后一塊石…

【STM32】HAL庫中的實現(九):SPI(串行外設接口)

SPI 接口通信原理 SPI(Serial Peripheral Interface)是全雙工主從通信協議,特點是: 信號線功能SCK串行時鐘MOSI主設備輸出,從設備輸入MISO主設備輸入,從設備輸出CS(NSS)片選信號&am…

Git常用操作大全(附git操作命令)

Git常用操作大全 一、基礎配置 1.1 設置用戶名和郵箱 git config --global user.name "你的名字" git config --global user.email "你的郵箱"1.2 查看配置 git config --list二、倉庫管理 2.1 初始化本地倉庫 git init2.2 克隆遠程倉庫 git clone <倉庫…

詳解flink table api基礎(三)

文章目錄1.使用flink的原因&#xff1a;2. Flink支持兩種模式&#xff1a;3. flink table api工作原理&#xff1a;4. Flink table api 使用5. select語句&flink table api&#xff1a;6. 使用flink table api 創建table7. 使用flink table api 寫流式數據輸出到表或sink8.…

Vue2+Vue3前端開發_Day5

參考課程: 【黑馬程序員 Vue2Vue3基礎入門到實戰項目】 [https://www.bilibili.com/video/BV1HV4y1a7n4] ZZHow(ZZHow1024) 自定義指令 基本語法&#xff08;全局 & 局部注冊&#xff09; 介紹&#xff1a;自己定義的指令&#xff0c;可以封裝一些 DOM 操作&#xff0c…

機器學習--決策樹2

目錄 第一代裁判&#xff1a;ID3 與信息增益的 “偏愛” 第二代裁判&#xff1a;C4.5 用 “增益率” 找平衡 第三代裁判&#xff1a;CART 的 “基尼指數” 新思路 遇到連續值&#xff1f;先 “砍幾刀” 再說 給決策樹 “減肥”&#xff1a;剪枝的學問 動手試試&#xff1…

yggjs_react使用教程 v0.1.1

yggjs_react是一個用于快速創建React項目的工具&#xff0c;它集成了Vite、TypeScript、Zustand和React Router等現代前端技術棧&#xff0c;幫助開發者快速搭建高質量的React應用。 快速入門 快速入門部分將指導您如何安裝yggjs_react工具、創建新項目并啟動開發服務器。 安…

vulhub可用的docker源

這一塊不太容易找&#xff0c;我試了好幾個源&#xff0c;下面是20250820測試可用源 編輯方法sudo mkdir -p /etc/docker sudo vim /etc/docker/daemon.json 配置內容 [1] {"registry-mirrors" : ["https://docker.registry.cyou", "https://docker-…

基于YOLOv8-SEAttention與LLMs融合的農作物害蟲智能診斷與防控決策系統

1. 引言 1.1 研究背景與意義 農作物蟲害是制約農業產量與質量的重要因素。據FAO報告&#xff0c;全球每年因病蟲害造成的糧食損失高達 20%–40%。傳統人工巡查與經驗診斷具有時效性差、成本高與專業人才不足等缺陷。近年來&#xff0c;計算機視覺特別是目標檢測技術在農業檢測…

從零開始構建GraphRAG紅樓夢知識圖譜問答項目(三)

文章結尾有CSDN官方提供的學長的聯系方式&#xff01;&#xff01; 歡迎關注B站從零開始構建一個基于GraphRAG的紅樓夢項目 第三集01 搭建后端服務 創建一個python文件server.py 完整源碼放到文章最后了。 1.1 graphrag 相關導入 # GraphRAG 相關導入 from graphrag.query.cont…

S32K328(Arm Cortex-M7)適配CmBacktrace錯誤追蹤

CmBacktrace 相當于重寫了hard_fault函數&#xff0c;在hard_fault函數里面去分析SCB寄存器的信息和堆棧信息&#xff0c;然后把這些信息打印出來(或者寫到flash)&#xff1b;通過使用串口輸出產生hard_fault的堆棧信息&#xff0c;然后利用addr2line工具反推出具體的代碼執行函…

AI研究引擎的簡單技術實現步驟

產品愿景與核心功能 1.1 產品使命 “洞見 Weaver”是一個全棧AI Web應用,旨在將用戶的復雜研究問題,通過AI驅動的動態思維導圖和結構化報告,轉化為一次沉浸式的、可追溯的視覺探索之旅。我們的使命是,將AI復雜的推理過程透明化,將人類的探索直覺與AI的分析能力無縫結合,…