【深度學習】卷積神經網絡CNN

李宏毅深度學習筆記

圖像分類

圖像可以描述為三維張量(張量可以想成維度大于 2 的矩陣)。一張圖像是一個三維的張量,其中一維代表圖像的寬,另外一維代表圖像的高,還有一維代表圖像的通道(channel)的數目。

通道:彩色圖像的每個像素都可以描述為紅色(red)、綠色(green)、藍色(blue)的組合,這 3 種顏色就稱為圖像的 3 個色彩通道。

在這里插入圖片描述
如果把向量當做全連接網絡的輸入,輸入的特征向量的長度就是 100 × 100 × 3。這是一個非常長的向量。由于每個神經元跟輸入的向量中的每個數值都需要一個權重,所以當輸入的向量長度是 100 × 100 × 3,且第 1 層有 1000 個神經元時,
第 1 層的權重就需要 1000 × 100 × 100 × 3 = 3 × 107 個權重。
在這里插入圖片描述

更多的參數為模型帶來了更好的彈性和更強的能力,但也增加了過擬合的風險。模型的彈性越大,就越容易過擬合。為了避免過擬合,在做圖像識別的時候,考慮到圖像本身的特性,并不一定需要全連接,即不需要每個神經元跟輸入的每個維度都有一個權重。

模型的目標是分類,因此可將不同的分類結果表示成不同的獨熱向量 y’。模型的輸出通過 softmax 以后,輸出是 ?y。我們希望 y′ 和 ?y 的交叉熵越小越好。
在這里插入圖片描述

感受野

對一個圖像識別的類神經網絡里面的神經元而言,它要做的就是檢測圖像里面有沒有出現一些特別重要的模式,這些模式是代表了某種物體的。比如有三個神經元分別看到鳥嘴、眼睛、鳥爪 3 個模式,這就代表類神經網絡看到了一只鳥。

卷積神經網絡會設定一個區域,即感受野(receptive field),每個神經元都只關心自己的感受野里面發生的事情,感受野是由我們自己決定的。
在這里插入圖片描述

卷積核
在這里插入圖片描述
一般同一個感受野會有一組神經元去守備這個范圍,比如 64 個或者是 128 個神經元去守備一個感受野的范圍。圖像里面每個位置都有一群神經元在檢測那個地方,有沒有出現某些模式

把左上角的感受野往右移一個步幅,就制造出一個新的守備范圍,即新的感受野。移動的量稱為步幅,步幅是一個超參數。因為希望感受野跟感受野之間是有重疊的,所以步幅往往不會設太大,一般設為 1 或 2。

Q: 為什么希望感受野之間是有重疊的呢?
A: 因為假設感受野完全沒有重疊,如果有一個模式正好出現在兩個感受野的交界上面,就沒有任何神經元去檢測它,這個模式可能會丟失,所以希望感受野彼此之間有高度的重疊。如令步幅 = 2,感受野就會重疊。

在這里插入圖片描述

共享參數

同樣的模式可能會出現在圖像的不同區域。比如檢測鳥嘴的神經元做的事情是一樣的,只是它們守備的范圍不一樣。如果不同的守備范圍都要有一個檢測鳥嘴的神經元,參數量會太多了。
所以可以讓不同感受野的神經元共享參數,也就是做參數共享。所謂參數共享就是兩個神經元的權重完全是一樣的

在這里插入圖片描述

卷積層

感受野加上參數共享就是卷積層(convolutional layer),用到卷積層的網絡就叫卷積神經網絡。卷積神經網絡的偏差比較大。但模型偏差大不一定是壞事,因為當模型偏差大,模型的靈活性較低時,比較不容易過擬合。
卷積層是專門為圖像設計的,感受野、參數共享都是為圖像設計的
在這里插入圖片描述

多卷積層

每個感受野都只有一組參數而已,這些參數稱為濾波器。
一個卷積層里面就是有一排的濾波器,每個濾波器都是一個 3 × 3 × 通道,其作用是要去圖像里面檢測某個模式

卷積層是可以疊很多層的,第 2 層的卷積里面也有一堆的濾波器,每個濾波器的大小設成 3 × 3。其高度必須設為 64,因為濾波器的高度就是它要處理的圖像的通道。(這個 64 是前一個卷積層的濾波器數目,前一個卷積層的濾波器數目是 64,輸出以后就是 64 個通道。)

如果濾波器的大小一直設 3 × 3,會不會讓網絡沒有辦法看比較大范圍的模式呢?
A:不會。如圖 4.23 所示,如果在第 2 層卷積層濾波器的大小一樣設 3 × 3,當我們看第 1 個卷積層輸出的特征映射的 3 × 3 的范圍的時候,在原來的圖像上是考慮了一個5 × 5 的范圍。雖然濾波器只有 3 × 3,但它在圖像上考慮的范圍是比較大的是 5 × 5。因此網絡疊得越深,同樣是 3 × 3 的大小的濾波器,它看的范圍就會越來越大。所以網絡夠深,不用怕檢測不到比較大的模式。
在這里插入圖片描述

下采樣和匯聚

把一張比較大的圖像做下采樣,把圖像偶數的列都拿掉,奇數的行都拿掉,圖像變成為原來的 1/4,但是不會影響里面是什么東西。

匯聚被用到了圖像識別中。匯聚沒有參數,所以它不是一個層,它里面沒有權重,它沒有要學習的東西,匯聚比較像 Sigmoid、ReLU 等激活函數。

匯聚有很多不同的版本:最大匯聚在每一組里面選一個代表,選的代表就是最大的一個;平均匯聚是取每一組的平均值。

做完卷積以后,往往后面還會搭配匯聚。匯聚就是把圖像變小。做完卷積以后會得到一張圖像,這張圖像里面有很多的通道。做完匯聚以后,這張圖像的通道不變。

一般在實踐上,往往就是卷積跟匯聚交替使用,可能做幾次卷積,做一次匯聚。比如兩次卷積,一次匯聚。不過匯聚對于模型的性能可能會帶來一點傷害。近年來圖像的網絡的設計往往也開始把匯聚丟掉,它會做這種全卷積的神經網絡,整個網絡里面都是卷積,完全都不用匯聚。匯聚最主要的作用是減少運算量,通過下采樣把圖像變小,從而減少運算量。

CNN

經典圖像識別網絡:
在這里插入圖片描述

輸入層:輸入圖像等信息
卷積層:用來提取圖像的底層特征
池化層(匯聚):防止過擬合,將數據維度減小
全連接層:匯總卷積層和池化層得到的圖像的底層特征和信息
輸出層:根據全連接層的信息得到概率最大的結果

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/37119.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/37119.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/37119.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

怎樣查看vsphere client 的登錄日志

- 問題摘要: 怎樣查看vsphere client 的登錄日志 - 解決方案/工作方法 1.登錄vsphere client > vc > Monitor > Tasks and Events > Events, 查看日志 2. 查看VC 的websso.log日志 /var/log/vmware/sso/websso.log 3. 可以把websso.log文件拿到本地電…

前端Web開發HTML5+CSS3+移動web視頻教程 Day1 HTML 第一天

鏈接 HTML 介紹 HTML&#xff1a;HyperText Markup Language&#xff0c;超文本標記語言&#xff0c;是一種用于創建網頁的標準標記語言。 HTML 運行在瀏覽器上&#xff0c;由瀏覽器來解析。 對于中文網頁需要使用 <meta charset"utf-8"> 聲明編碼&#xf…

多圖示例:如何呈現論文結果中的各種圖表

本文根據《Journal of the American College of Cardiology》上曾發表的一篇文章《Making Sense of Statistics in Clinical Trial Reports》&#xff0c;來全面而具體地說明臨床試驗論文中&#xff0c;各種類型數據與結果使用圖表的正確展示方法。 本文將著重介紹基線數據、試…

3.Android逆向協議-APP反反編譯及回編譯

免責聲明&#xff1a;內容僅供學習參考&#xff0c;請合法利用知識&#xff0c;禁止進行違法犯罪活動&#xff01; 內容參考于&#xff1a;微塵網校 上一個內容&#xff1a;2.Android逆向協議-了解常用的逆向工具 在實際應用場景中會閱讀smail代碼&#xff0c;比如調試app&a…

【ai】tx2 nx :ubuntu查找NvInfer.h 路徑及哪個包、查找符號

在Ubuntu系統中,你可以使用多種方法來查找某個頭文件的路徑。這里有幾種常用的方法: 使用find命令: find命令是一個非常強大的工具,可以在文件系統中搜索匹配特定條件的文件。例如,如果你想查找名為stdio.h的頭文件,可以使用以下命令:bash 復制代碼 sudo find / -name …

響應頭缺省xss防御頭(X-XSS-Protection、X-Content-Type-Options)

HTTP X-Content-Type-Options 缺失 Web 服務器對于 HTTP 請求的響應頭缺少 X-Content-Type-Options,這意味著此網站更易遭受跨站腳本攻擊(XSS)。X-Content-Type-Options 響應頭相當于一個提示標志,被服務器用來提示客戶端一定要遵循在 Content-Type 首部中對 MIME 類型 的…

Python頭歌數據聚合

在Python中進行數據聚合通常涉及到使用Pandas庫&#xff0c;它是一個功能強大的數據分析工具。以下是一些基本的步驟和示例代碼&#xff0c;展示如何使用Pandas進行數據聚合&#xff1a; 導入Pandas庫: import pandas as pd讀取數據: 假設您有兩個CSV文件&#xff0c;我們可以使…

嵌入式Linux系統編程 — 4.5 strcmp、strchr 等函數實現字符串比較與查找

目錄 1 字符串比較 1.1 strcmp() 函數 1.2 strncmp() 函數 1.3 示例程序 2 字符串查找 2.1 strchr() 函數 2.2 strrchr() 函數 2.3 strstr() 函數 2.4 strpbrk() 函數 2.5 示例程序 1 字符串比較 strcmp() 和 strncmp() 函數是C語言標準庫中用于比較兩個字符串的函…

經典排序算法詳解

目錄 創作不易&#xff0c;如對您有幫助&#xff0c;還望一鍵三連&#xff0c;謝謝&#xff01; 前言 學習目標&#xff1a; 直接插入排序 基本思想&#xff1a; 代碼 希爾排序&#xff1a; gap取值 代碼 特性總結 選擇排序 基本思想 代碼 堆排序 思想 代碼 冒…

[CTF]-PWN:mips反匯編工具,ida插件retdec的安裝

IDA是沒有辦法直接按F5來反匯編mips的匯編的&#xff0c;而較為復雜的函數直接看匯編不太現實&#xff0c;所以只能借用插件來反匯編 先配置環境&#xff0c;下載python3.4以上的版本&#xff0c;并將其加入到環境變量中 下載retdec 地址&#xff1a;Release v1.0-ida80 ava…

蘋果開發者證書申請流程

蘋果開發者證書申請流程&#xff1a; 1.Certificates 后面加號 2.iOS Distribution (App Store and Ad Hoc) 點擊continue 3.選擇Upload a Certificate Signing Request To manually generate a Certificate, you need a Certificate Signing Request (CSR…

Unity關于Addressables.Release釋放資源內存問題

前言 最近在編寫基于Addressables的資源管理器&#xff0c;對于資源釋放模塊配合MemoryProfiler進行了測試&#xff0c;下面總結下測試Addressables.Release的結論。 總結 使用Addressables.Release釋放資源時&#xff0c;通過MemoryProfiler檢查內存信息發現加載的內容還在…

多租戶與低代碼開發的應用:解鎖企業數字化轉型的無限可能

在數字化轉型的浪潮中&#xff0c;多租戶與低代碼開發已經成為推動企業快速、靈活、安全地構建和部署應用的關鍵技術。本文將深入探討這兩種技術的結合如何為企業帶來前所未有的變革和機遇。 多租戶架構&#xff1a;資源共享與隔離的藝術 多租戶架構&#xff0c;是一種高級的軟…

一文讓你簡單明了的知道云管理平臺的作用

隨著云計算的飛速發展&#xff0c;越來越多的企業實現了上云。因此云管理平臺也在云計算環境中扮演著至關重要的角色&#xff0c;在企業上云后充分發揮作用。今天我們小編就來為大家簡單講解一下云管平臺的作用。 一文讓你簡單明了的知道云管理平臺的作用 作用1、提高工作效率…

思考-生涯思考-GPT-5對人們的影響

GPT-5 一年半后發布&#xff1f;對此你有何期待&#xff1f; IT之家6月22日消息&#xff0c;在美國達特茅斯工程學院周四公布的采訪中&#xff0c;OpenAI首席技術官米拉穆拉蒂被問及GPT-5是否會在明年發布&#xff0c;給出了肯定答案并表示將在一年半后發布。此外&#xff0c;…

20240629 每日AI必讀資訊

&#x1f680; Google 深夜突襲&#xff0c;Gemma 2 狂卷 Llama 3 - Gemma2性能超越Llama3&#xff0c;提供9B和27B版本&#xff0c;性能接近70B模型但大小僅為其40% - Gemma2支持高效推理&#xff0c;單個GPU即可實現全精度推理&#xff0c;廣泛的硬件支持 - Gemma2兼容多種…

CMake之嵌套的CMakeLists

文章目錄 前言項目結構節點關系如何嵌套多個cmake示例程序cmake 總結 前言 在現代軟件開發中&#xff0c;CMake 是一個非常重要的工具&#xff0c;它允許開發者編寫可移植的構建腳本來管理項目。對于大型項目&#xff0c;通常會有多個模塊或子項目&#xff0c;這時候就需要用到…

2024年618各城市跨境電商戰況如何?

2024年618各城市 跨境電商戰況如何? 2024 城市“618”跨境戰績&#xff08;部分&#xff09; 2024年“618”期間&#xff0c;全國跨境電商交易額實現2,397.12億元&#xff0c;同比增長8.68%。從跨境商品來看&#xff0c;進口端&#xff0c;嬰童食品、美容美妝、營養保健等商…

numpy.random.seed()使用

import numpy as npnp.random.seed(2) # 生成隨機種子2 一次使用機會 作用在下一個隨機數生成的時候 a np.random.random() # 使用隨機種子2 b np.random.random() # 因為隨機種子使用完了 &#xff01; 這里使用默認按系統根據時間作為seed參數的隨機種子 print(a) # 隨…

手機取證基礎知識(一)

文章關鍵詞&#xff1a;手機取證、電子數據取證 手機取證&#xff0c;也稱為移動設備取證或智能手機取證&#xff0c;是數字取證的一個分支&#xff0c;專注于從智能手機和其他移動設備中提取、分析和呈現證據的過程。這項技術通常用于法律調查&#xff0c;尤其是在犯罪調查中…