網絡中的網絡 NiN

一、全連接層問題

1、卷積層的參數:輸入的通道數乘以輸出的通道數再乘以窗口的高寬

2、全連接層的參數就是輸入的元素個數乘以輸出的元素個數,也就是輸入的通道數乘以輸入的高寬,再乘以輸出的通道數乘以輸出的高寬,賊大的量級

3、一個卷積層后跟兩個全連接層(1*1卷積,步幅1,無填充,輸出形狀跟卷積層輸出一樣,起到全連接作用):1×1卷積層相當于一個全連接層,它所做的操作是,按照像素去逐一做的全連接層

二、NiN架構

1、無全連接層

2、交替使用NiN塊和步幅為2的最大池化層(逐步減小高寬和增大通道數)

3、最后使用全局平均池化層得到輸出(輸出通道數是類別數),全局池化層它的高寬等于輸入的高寬,等價于對一個類別來說,把它的平均拿出來,把這個值當做類別的預測,再加上soft max就能得到我們的預測了,這樣我們就可以不用使用全連接層了,減少我們所占用內存的參數個數

三、總結

1、NiN使用由一個卷積層和多個1×1卷積層組成的塊。該塊可以在卷積神經網絡中使用,以允許更多的每像素非線性。

2、NiN去除了容易造成過擬合的全連接層,將它們替換為全局平均匯聚層(即在所有位置上進行求和)。該匯聚層通道數量為所需的輸出數量(例如,Fashion-MNIST的輸出為10)。

3、移除全連接層可減少過擬合,同時顯著減少NiN的參數。

4、NiN的設計影響了許多后續卷積神經網絡的設計。

四、代碼

1、NiN塊

import torch
from torch import nn
from d2l import torch as d2ldef nin_block(in_channels, out_channels, kernel_size, strides, padding):return nn.Sequential(nn.Conv2d(in_channels, out_channels, kernel_size, strides, padding),nn.ReLU(),nn.Conv2d(out_channels, out_channels, kernel_size=1), nn.ReLU(),nn.Conv2d(out_channels, out_channels, kernel_size=1), nn.ReLU())

2、NiN模型

net = nn.Sequential(nin_block(1, 96, kernel_size=11, strides=4, padding=0),nn.MaxPool2d(3, stride=2),nin_block(96, 256, kernel_size=5, strides=1, padding=2),nn.MaxPool2d(3, stride=2),nin_block(256, 384, kernel_size=3, strides=1, padding=1),nn.MaxPool2d(3, stride=2),nn.Dropout(0.5),# 標簽類別數是10nin_block(384, 10, kernel_size=3, strides=1, padding=1),nn.AdaptiveAvgPool2d((1, 1)),# 將四維的輸出轉成二維的輸出,其形狀為(批量大小,10)nn.Flatten())

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41974.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41974.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41974.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

NLP簡介

自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自…

【算法】(C語言):冒泡排序、選擇排序、插入排序

冒泡排序 從第一個數據開始到第n-1個數據,依次和后面一個數據兩兩比較,數值小的在前。最終,最后一個數據(第n個數據)為最大值。從第一個數據開始到第n-2個數據,依次和后面一個數據兩兩比較,數值…

關于用戶咨詢華為擎云L410筆記本安裝Windows系統的說明

同樣也是單位購買的華為擎云L410 KLVU-WDU0筆記本電腦,國產UOS系統某些軟件用著不是很方便,用戶咨詢是否能夠安裝Windows10或者Windows7? 帶著種種疑問也做了一些查詢,之前也給一些國產設備更改過操作系統,之前的國產設…

計算機網絡淺談—什么是 OSI 模型?

開放系統通信(OSI)模型是一個代表網絡通信工作方式的概念模型。 思維導圖 什么是 OSI 模型? 開放系統互連 (OSI) 模型是由國際標準化組織創建的概念模型,支持各種通信系統使用標準協議進行通信。簡單而言,OSI 為保證…

智能交通(3)——Learning Phase Competition for Traffic Signal Control

論文分享 https://dl.acm.org/doi/pdf/10.1145/3357384.3357900https://dl.acm.org/doi/pdf/10.1145/3357384.3357900 論文代碼 https://github.com/gjzheng93/frap-pubhttps://github.com/gjzheng93/frap-pub 摘要 越來越多可用的城市數據和先進的學習技術使人們能夠提…

Laravel框架詳解及使用方法

Laravel是一款開源的PHP Web應用程序框架,它基于MVC(模型-視圖-控制器)架構,以其簡單易學、靈活性強、安全性高和強大的社區支持而廣受開發者喜愛。以下是對Laravel框架的詳細解析及使用方法: 一、Laravel框架簡介 1…

刷題——在二叉樹中找到最近公共祖先

在二叉樹中找到兩個節點的最近公共祖先_牛客題霸_牛客網 int lowestCommonAncestor(TreeNode* root, int o1, int o2) {if(root NULL) return -1;if((root->val o1) || (root->val o2)) return root->val;int left lowestCommonAncestor(root->left, o1, o2);i…

【pytorch19】交叉熵

分類問題的loss MSECross Entropy LossHinge Loss (SVN用的比較多) ∑ i m a x ( 0 , 1 ? y i ? h θ ( x i ) ) \sum_imax(0,1-y_i*h_\theta(x_i)) ∑i?max(0,1?yi??hθ?(xi?)) Entropy(熵) Uncertainty(…

ESP32——物聯網小項目匯總

商品級ESP32智能手表 [文章鏈接] 用ESP32,做了個siri?!開源了! [文章鏈接]

IPsec連接 和 SSL連接

Psec和SSL連接是兩種用于保障網絡通信安全的技術 IPsec 通常用于連通兩個局域網,主要是網對網的連接,如分支機構與總部之間,或者本地IDC與云端VPC的子網連接。適合站點間的穩定通訊需求以及對網絡層安全有嚴格要求的場合。要求兩端有固定的網…

UDP協議:獨特之處及其在網絡通信中的應用

在網絡通信領域,UDP(用戶數據報協議,User Datagram Protocol)是一種廣泛使用的傳輸層協議。與TCP(傳輸控制協議,Transmission Control Protocol)相比,UDP具有其獨特的特點和適用場景…

對數據采集、數據存儲和數據處理流程

對數據采集、數據存儲和數據處理流程 數據采集是指從各種來源收集原始數據的過程,這通常包括傳感器、網站、社交媒體、API等。它涉及設置抓取工具、爬蟲技術或直接從數據庫獲取數據。數據存儲則涉及到將采集到的數據安全、高效地保存起來,常見的有關系型…

EDEM-FLUENT耦合報錯幾大原因總結(持續更新)

寫在前面,本篇內容主要是來源于自己做仿真時的個人總結,以及付費請教專業老師。每個人由于工況不一樣,所以報錯原因千奇百怪,不能一概而論,本篇內容主要是為本專欄讀者在報錯時提供大致的糾錯方向,從而達到少走彎路的效果,debug的過程需要大家一點點試算。問題解答在文 …

02STM32環境搭建新建工程

STM32環境搭建&新建工程 軟件安裝:開發方式&新建工程步驟&架構 個人心得 軟件安裝: 安裝Keil5 MDK 安裝器件支持包 軟件注冊 安裝STLINK驅動 安裝USB轉串口驅動 開發方式&新建工程步驟&架構 STM32開發方式: 1.寄存器 …

什么是倒退型自閉癥?

在星貝育園自閉癥兒童康復學校,作為一位致力于自閉癥兒童教育與康復的老師,我深知家長們面對“倒退型自閉癥”這一概念時的困惑與憂慮。今天,就讓我以專業的身份,為大家揭開倒退型自閉癥的神秘面紗,共同探討這一特殊現…

mysql中的遞歸函數recursive

遞歸部門 WITH recursive dept_tree AS (SELECTsd.mine_id AS mine_id,sd.dept_id AS dept_id,sd.tenant_id AS tenant_id,sd.order_num,sd.dept_name AS topName,sd.dept_id AS topIdFROMsys_dept sdWHERE<!-- 加上or后也會查詢出dept節點 sd.parent_id #{deptId} or sd.…

uniapp H5頁面設置跨域請求

記錄一下本地服務在uniapp H5頁面訪問請求報跨域的錯誤 這是我在本地起的服務端口號為8088 ip大家可打開cmd 輸入ipconfig 查看 第一種方法 在源碼視圖中配置 "devServer": {"https": false, // 是否啟用 https 協議&#xff0c;默認false"port&q…

跨界客戶服務:拓展服務邊界,創造更多價值

在當今這個日新月異的商業時代&#xff0c;跨界合作已不再是新鮮詞匯&#xff0c;它如同一股強勁的東風&#xff0c;吹散了行業間的壁壘&#xff0c;為企業服務創新開辟了前所未有的廣闊天地。特別是在客戶服務領域&#xff0c;跨界合作正以前所未有的深度和廣度&#xff0c;拓…

一文理解 Treelite,Treelite 為決策樹集成模型的部署和推理提供了高效、靈活的解決方案

&#x1f349; CSDN 葉庭云&#xff1a;https://yetingyun.blog.csdn.net/ 一、什么是 Treelite&#xff1f; Treelite 是一個專門用于將決策樹集成模型高效部署到生產環境中的機器學習模型編譯器&#xff0c;特別適合處理大批量數據的推理任務&#xff0c;能夠顯著提升推理性能…

[Vite]Vite插件生命周期了解

[Vite]Vite插件生命周期了解 Chunk和Bundle的概念 Chunk&#xff1a; 在 Vite 中&#xff0c;chunk 通常指的是應用程序中的一個代碼片段&#xff0c;它是通過 Rollup 或其他打包工具在構建過程中生成的。每個 chunk 通常包含應用程序的一部分邏輯&#xff0c;可能是一個路由視…