機器學習——深度學習之卷積神經網絡（CNN）——AlexNet卷積神經網絡結構

news/2025/9/18 8:20:12/文章來源:https://blog.csdn.net/qq_45769063/article/details/106780571

目錄

一、AlexNet卷積神經網絡結構模型

1、數據庫ImageNet

2、AlexNet第一層卷積層

二、AlexNet卷積神經網絡的改進

1、非線性變化函數的改變——ReLU

2、最大池化（Max Pooling）概念的提出——卷積神經網絡通用

1）池化層

2）最大池化

問題1：在AlexNet中，后向傳播時，池化后特征圖像的梯度怎么傳給池化前的圖像？——贏者通吃法

3）池化過程的功能和效果

3、隨機丟棄（Drop Out）

問題2：為什么參數要乘以（1-p）？

4、增加訓練樣本

5、利用2片GPU進行加速

? 三、AlexNet的效果

四、AlexNet中的參數

一、AlexNet卷積神經網絡結構模型

1998年LeNet卷積神經網絡

2013年AlexNet卷積神經網絡

AlexNet卷積神經網絡相較于LeNet卷積神經網絡其實本質上沒有改變，只是在一些細節上進行了改善

1、數據庫ImageNet

數據庫：ImageNet

樣本數據：120萬

類別：1000類

2、AlexNet第一層卷積層

第一層卷積層的相關參數

圖像大小：227*227*3

卷積核大小：11*11*3

卷積核個數：96個

步長：【4，4】

特征圖像大小：55*55*96，圖上看起來是48，實際上是96，將96分成兩個48給兩個GPU進行處理

二、AlexNet卷積神經網絡的改進

1、非線性變化函數的改變——ReLU

2、最大池化（Max Pooling）概念的提出——卷積神經網絡通用

1）池化層

在LeNet中這一層叫做降采樣層，Alex將其改名為池化層Pooling

2）最大池化

LeNet中這一層所做的事情是將紅色區域的所有值的平均值作為輸出，變成右邊的一個藍色像素格子

但是在AlexNet中，是將紅色區域中最大的像素值作為輸出，變成右邊的一個藍色像素格子的值

問題1：在AlexNet中，后向傳播時，池化后特征圖像的梯度怎么傳給池化前的圖像？——贏者通吃法

答：在LeNet中前向傳播是平均池化，后向傳播時將池化后的特征每一個格子的梯度平均分給池化前的圖像

但是在AlexNet中由于是最大池化得到的池化后的特征圖像，因此在后向傳播的梯度處理上，也是基于此。將上圖中藍色格子的梯度直接傳播賦值給池化前紅色區域的像素值最大的格子，其余的格子的梯度設置為0，這就是贏者通吃法則

3）池化過程的功能和效果

功能：

降采樣

非線性操作——因此池化用的是最大池化，和RULE函數進行非線性轉換的效果是一樣的

效果：

只有最大像素值有關，其余像素的梯度均設置為0，這樣導致的結果就是參與前向計算的神經元減少，降低了過擬合的可能

3、隨機丟棄（Drop Out）

訓練用丟棄神經元后的神經網絡，測試的時候需要用完整的神經網絡

注：隨機丟棄可以隨機地激活一部分神經元，會使得參數穩定化，避免了過擬合

問題2：為什么參數要乘以（1-p）？

答：望賜教

4、增加訓練樣本

有的時候參數過多，訓練樣本不夠，這樣就會導致待測參數的不準確，使得性能不夠

5、利用2片GPU進行加速

三、AlexNet的效果

?

四、AlexNet中的參數

參數個數可參考：《機器學習——深度學習之卷積神經網絡（CNN）——LeNet卷積神經網絡結構》

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/256347.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/256347.shtml
英文地址，請注明出處：http://en.pswp.cn/news/256347.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

POJ - 3470 Walls

POJ - 3470 Walls

小鳥往四個方向飛都枚舉一下，數據范圍沒給，離散以后按在其中一個軸線排序，在線段樹上更新墻的id，然后就是點查詢在在哪個墻上了。這題有個trick，因為數據范圍沒給我老以為是inf設置小了，WA了很多發。&…

閱讀更多...

C# —— 深入理解委托類型

C# —— 深入理解委托類型

一. 委托定義 1. 委托與多播委托委托類型表示對具有特定參數列表和返回類型的方法的引用，定義了委托實例可以調用的某類方法。通過委托，我們可以動態的通過委托變量來調用委托方法。一般用delegate來命名委托類型,但Action和Func也可以達到同樣的效果…

閱讀更多...

【VS開發】【C++語言】reshuffle的容器實現算法random_shuffle()的使用

【VS開發】【C++語言】reshuffle的容器實現算法random_shuffle()的使用

假設你需要指定范圍內的隨機數，傳統的方法是使用ANSI C的函數random(),然后格式化結果以便結果是落在指定的范圍內。但是，使用這個方法至少有兩個缺點。首先，做格式化時，結果常常是扭曲的，所以得不到正確的隨機數&…

閱讀更多...

C#委托——基礎2

C#委托——基礎2

在上一篇隨筆中，簡要說明了怎樣定義委托，定義事件，訂閱事件，最后也實現了效果，就是當員工類的某個對象，執行某個事件時，委托事件被觸發，后面也得到了結果，但是想象一下實…

閱讀更多...

機器學習——深度學習之編程工具、流行網絡結構、卷積神經網絡結構的應用

機器學習——深度學習之編程工具、流行網絡結構、卷積神經網絡結構的應用

目錄一、編程工具 caffe實現LENET-5 二、流行的網絡結構 1、VGGNET 2、Googlenet ? 3、ResNet? ? 三、卷積神經網絡的應用 1、人臉識別 ? 2、人臉驗證 3、人臉特征點檢測 4、卷積神經網絡壓縮一、編程工具 caffe的優點：模型標準化，源代碼…

閱讀更多...

Halcon例程詳解（激光三角系統標定）—— calibrate_sheet_of_light_calplate.hdev

Halcon例程詳解（激光三角系統標定）—— calibrate_sheet_of_light_calplate.hdev

前言 1 激光三角測距激光三角測距法原理很簡單，是通過一束激光以一定的入射角度照射被測目標，激光在目標表面會產生漫反射，在另一角度利用透鏡對反射激光匯聚成像，光斑成像在CCD（Charge-coupled Device，感光耦合組件）位置傳感器上。當被測物體沿激光方向發生移動時，…

閱讀更多...

【轉】如何實現一個文件系統

【轉】如何實現一個文件系統

如何實現一個文件系統摘要本章目的是分析在Linux系統中如何實現新的文件系統。在介紹文件系統具體實現前先介紹文件系統的概念和作用，抽象出文件系統概念模型。熟悉文件系統的內涵后，我們再進一步討論Linux系統中文件系統的特殊風格和具體文件系統在Li…

閱讀更多...

【tenserflow】——數據類型以及常用屬性

【tenserflow】——數據類型以及常用屬性

目錄一、什么是Tensor？ 二、Tensorflow常見數據類型三、Tensorflow常見屬性device\cpu\gpu\ndim\shape\rank等 1、創建一個tensor 1）tf.constant() 2)tf.Variable() 2、判斷一個變量是否為tensor張量 3、生成不同設備（cpu,gpu&#x…

閱讀更多...

C# 事件詳解附實例分析

C# 事件詳解附實例分析

一、定義事件是兩個對象間發布消息和響應后處理消息的過程，通過委托類型來實現的。事件的機制被稱為發布-訂閱機制，其算法過程為：首先定義一個委托類型，然后在發布者類中聲明一個event事件，同時此類中還有一個用來觸…

閱讀更多...

網頁開發瀏覽器兼容性問題

網頁開發瀏覽器兼容性問題

1、在ie6下的雙margin問題在ie6下，設置了float的元素，以float:left為例，如圖所示。會出現第一個浮動元素，即相對于父級元素浮動的，會出現雙倍margin的問題。注意僅僅是相對于父級元素浮動的，即第一個會出…

閱讀更多...

【tensorflow】——創建tensor的方法

【tensorflow】——創建tensor的方法

目錄 1、tf.constant() 2、tf.Variable() 3、tf.zeros():用0去填充指定形狀的數組 4、tf.convert_to_tensor(a,dtypetf.int32) 5、tf.ones():用1去填充指定形狀的數組 6、tf.fill():用指定的元素去填充指定形狀的數組 7、隨機化初始化進行創建 1）normal正態分…

閱讀更多...

Halcon —— 圖像像素類型與轉換

Halcon —— 圖像像素類型與轉換

圖像類型就目前工業領域主流的圖像處理工具halcon來講，有以下幾種圖像類型：‘byte’, ‘complex’, ‘cyclic’, ‘direction’, ‘int1’, ‘int2’, ‘int4’, ‘int8’, ‘real’, ‘uint2’，具體含義如下圖所示。 ‘byte’ 每像素1字節…

閱讀更多...

軟件方法

軟件方法

核心工作流業務建模（組織建模）：描述組織內部各個系統如何協作，使得組織可以為其他的組織提供有價值的服務，新系統只不過是組織為了對外提供更好的服務，對自己的內部重新設計而購買的一個零件。需求&#xf…

閱讀更多...

修改vim中的tab為4個空格

修改vim中的tab為4個空格

記錄一下，避免用時還得搜........ 1、臨時修改在vi中，set tabstop4 或 set ts4　 2、永久修改 vi --version 查看要修改的文件如果是vim的話，修改~/.vimrc如果是vi，修改~/.exrc加上：set tabstop4set nu //顯示行號set…

閱讀更多...

Halcon例程詳解(基于卡尺工具的匹配測量方法) —— measure_stamping_part.hdev

Halcon例程詳解(基于卡尺工具的匹配測量方法) —— measure_stamping_part.hdev

前言 1卡尺工具介紹 Halcon中的Metrology方法即為卡尺工具，可用來擬合線，圓，這種方法對于目標比背景很明顯的圖像尺寸測量是很方便的，不需要用blob進行邊緣提取等，但缺點也很明顯，需要目標的相對位置基本…

閱讀更多...

【TensorFlow】——不同shape的tensor在神經網絡中的應用（scalar，vector，matrix）

【TensorFlow】——不同shape的tensor在神經網絡中的應用（scalar，vector，matrix）

目錄 ? 1、scalar——標量 1）在神經網絡中存在的場景 2）one_hot編碼 3）舉例應用 2、vector——向量 ? 3、matrixs——矩陣 4、dim3的tensor 5、dim4的tensor 6、dim5的tensor 本文主要的目的是讓初學者對tensor的各種形式的使用場…

閱讀更多...

404頁面 3秒后跳到首頁實現

404頁面 3秒后跳到首頁實現

---恢復內容開始--- 當我們訪問一個頁面不存在的時候，就會跳到404頁面一般網站都在在404頁面中做一個處理， 就是當用戶3秒種內還沒有任何操作的話，就會自動跳轉到其它頁面技術實現有兩種方法 1. 在404頁面中的header間加上 <meta http-e…

閱讀更多...

Java - I/O

Java - I/O

File類 java.io操作文件和目錄，與平臺無關。具體的常用實例方法： File file new File("."); // 以當前路徑創建名為 "." 的 File 對象 ? 文件目錄信息函數 ? ? - ? String getName/Path/Parent()： 文件名/路徑…

閱讀更多...

Halcon —— 邊緣檢測算子詳解

Halcon —— 邊緣檢測算子詳解

一、算子介紹 1.1 種類 halcon內常用的邊緣檢測算子包括如下幾種： 1.edges_image: 提取2D 圖像邊緣 2.edges_sub_pix：提取2D圖像亞像素邊緣 3.edges_object_model_3d ：提取3D圖像邊緣 4.edges_color和edges_color_sub_pix：提取彩…

閱讀更多...

【TensorFlow】——索引與切片

【TensorFlow】——索引與切片

目錄 1、利用index進行索引 2、利用“：”和“...”進行索引與切片 3、tf.gather（）——對一個維度進行亂序索引優勢： 缺點： 例子 4、tf.gather_nd()——同時對多個維度進行索引 5、tf.boolean_mask()——通過布…

閱讀更多...

最新文章