【深度學習】CNN中pooling層的作用

1、pooling是在卷積網絡(CNN)中一般在卷積層(conv)之后使用的特征提取層,使用pooling技術將卷積層后得到的小鄰域內的特征點整合得到新的特征。一方面防止無用參數增加時間復雜度,一方面增加了特征的整合度。

2、pooling是用更高層的抽象表示圖像特征,至于pooling為什么可以這樣做,是因為:我們之所以決定使用卷積后的特征是因為圖像具有一種“靜態性”的屬性,這也就意味著在一個圖像區域有用的特征極有可能在另一個區域同樣適用。因此,為了描述大的圖像,一個很自然的想法就是對不同位置的特征進行聚合統計。這個均值或者最大值就是一種聚合統計的方法。

3、做窗口滑動卷積的時候,卷積值就代表了整個窗口的特征。因為滑動的窗口間有大量重疊區域,出來的卷積值有冗余,進行最大pooling或者平均pooling就是減少冗余。減少冗余的同時,pooling也丟掉了局部位置信息,所以局部有微小形變,結果也是一樣的。就像圖片上的字母A,局部出現微小變化,也能夠被識別成A。而加上椒鹽噪音,就是字母A上有很多小洞,同樣的能夠被識別出來。而平移不變性,就是一個特征,無論出現在圖片的那個位置,都會識別出來。所以平移不變性不是pooling帶來的,而是層層的權重共享帶來的。

4、關于平移不變性的解釋:

4.1. invariance(不變性),這種不變性包括translation(平移),rotation(旋轉),scale(尺度)

4.2. 保留主要的特征同時減少參數(降維,效果類似PCA)和計算量,防止過擬合,提高模型泛化能力

(1) translation invariance:這里舉一個直觀的例子(數字識別),假設有一個16x16的圖片,里面有個數字1,我們需要識別出來,這個數字1可能寫的偏左一點(圖1),這個數字1可能偏右一點(圖2),圖1到圖2相當于向右平移了一個單位,但是圖1和圖2經過max pooling之后它們都變成了相同的8x8特征矩陣,主要的特征我們捕獲到了,同時又將問題的規模從16x16降到了8x8,而且具有平移不變性的特點。圖中的a(或b)表示,在原始圖片中的這些a(或b)位置,最終都會映射到相同的位置。

CNN中pooling層的作用

(2) rotation invariance:下圖表示漢字“一”的識別,第一張相對于x軸有傾斜角,第二張是平行于x軸,兩張圖片相當于做了旋轉,經過多次max pooling后具有相同的特征

CNN中pooling層的作用

(3) scale invariance:

下圖表示數字“0”的識別,第一張的“0”比較大,第二張的“0”進行了較小,相當于作了縮放,同樣地,經過多次max pooling后具有相同的特征

CNN中pooling層的作用

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166367.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166367.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166367.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MySql數據庫常用指令(一)

MySql數據庫常用指令(一) 一、MySQL 創建數據庫二、MySQL 刪除數據庫三、選擇數據庫四、選擇數據庫五、創建數據表六、刪除數據表七、插入數據八、查詢數據 注:文中TEST為測試所用數據庫,根據實際應用修改 一、MySQL 創建數據庫 …

JVM中如何實現垃圾收集

Java虛擬機(JVM)使用垃圾收集器(Garbage Collector)來管理內存,清理不再使用的對象以釋放內存空間。垃圾收集的主要目標是自動化內存管理,使開發人員無需顯式地釋放不再使用的內存,從而降低了內…

Mysql面經

Select語句的執行順序 1、from 子句組裝來自不同數據源的數據; 2、where 子句基于指定的條件對記錄行進行篩選; 3、group by 子句將數據劃分為多個分組; 4、使用聚集函數進行計算;AVG() SUM() MAX() MIN() COUNT() 5、使用 havin…

Vue模板引用

Vue的模板引用是為了處理直接訪問DOM底層而做的補充處理&#xff0c;畢竟Vue宣稱是基于組件的&#xff0c;這種補充處理是對Vue框架的補充。在前端基于BOMDOMjs的組成來看&#xff0c;Vue保留模板引用是留下了一種框架設計的余裕。 模板引用案例如下&#xff1a; <script s…

2016年8月18日 Go生態洞察:Go 1.7版本二進制文件縮小

&#x1f337;&#x1f341; 博主貓頭虎&#xff08;&#x1f405;&#x1f43e;&#xff09;帶您 Go to New World?&#x1f341; &#x1f984; 博客首頁——&#x1f405;&#x1f43e;貓頭虎的博客&#x1f390; &#x1f433; 《面試題大全專欄》 &#x1f995; 文章圖文…

【經驗分享】在vm中安裝openEuler及使用yum安裝openGauss

1.前言 隨著互聯網時代對數據庫的新要求,以PostgreSQL為基礎的開源數據庫openGauss應運而生。openGauss在保持PostgreSQL接口兼容的前提下,對其查詢優化器、高可用特性等進行了全面優化,實現了超高性能。 同時,openGauss作為社區項目,新增功能持續豐富。優點是查詢性能高、可…

機器學習——詞向量模型(CBOW代碼實現-未開始)

本來是不打算做這個CBOW代碼案例的&#xff0c;想快馬加鞭看看前饋神經網絡 畢竟書都買好了 可是…可是…我看書的時候&#xff0c;感覺有點兒困難&#xff0c;哭的很大聲… 感覺自己腦細胞可能無法這么快接受 要不&#xff0c;還是退而求個稍微難度沒那么大的事&#xff0c;想…

【多線程】-- 01 線程創建之繼承Thread多線程同步下載網絡圖片

多線程 1 簡介 1.1 多任務、多線程 普通方法調用&#xff1a;只有主線程一條執行路徑 多線程&#xff1a;多條執行路徑&#xff0c;主線程和子線程并行交替執行 如下圖所示&#xff1a; 1.2 程序.進程.線程 一個進程可以有多個線程&#xff0c;例如視頻中同時聽聲音、看圖…

idea 問題合集

調試按鈕失效&#xff1a; 依次點擊&#xff1a;Modules-web-src-Sources&#xff0c;重啟IDEA即可&#xff08;網上看到的方法&#xff0c;原因呢未明&#xff09;

U-boot(四):start_armboot

本文主要探討210的uboot啟動的第二階段&#xff0c;主要函數為start_armboot。 uboot 一階段初始化SoC內部部件(看門狗、時鐘等),初始化DDR,重定位 二階段初始化其余硬件(iNand、網卡芯片)以及命令、環境變量等 啟動打印硬件信息,進入bootdelay,讀秒完后執行bootc…

SpringCloud Alibaba集成 Gateway(自定義負載均衡器)、Nacos(配置中心、注冊中心)、loadbalancer

文章目錄 POM依賴環境準備配置配置文件配置類 案例展示 POM依賴 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.7.10</version><relativePath/></p…

【華為OD】C卷真題 100%通過:執行時長 C/C++實現

【華為OD】C卷真題 100%通過:執行時長 C/C實現 目錄 題目描述&#xff1a; 示例1 示例2 代碼實現&#xff1a; 題目描述&#xff1a; 為了充分發揮GPU算力&#xff0c;需要盡可能多的將任務交給GPU執行&#xff0c;現在有一個任務數組&#xff0c;數組元素表示在這1秒內…

百度ai試用

JMaven Central: com.baidu.aip:java-sdk (sonatype.com) Java sdk地址如上&#xff1a; 文心一言開發者 文心一言 (baidu.com) ERNIE Bot SDK提供便捷易用的接口&#xff0c;可以調用文心一言的能力&#xff0c;包含文本創作、通用對話、語義向量、AI作圖等。 pip install…

什么是輕量應用服務器?可以從亞馬遜云科技的優勢入手了解

什么是輕量應用服務器&#xff1f; 隨著如今各行各業對云計算的需求越來越多&#xff0c;云服務器也被越來越多的企業所廣泛采用。其中&#xff0c;輕量應用服務器是一種簡單、高效、可靠的云計算服務&#xff0c;能夠為開發人員、企業和個人提供輕量級的虛擬專用服務器&#x…

PTP精密時鐘同步(1588)如何完成精準時間同步?

PTP精密時鐘同步&#xff08;1588&#xff09;如何完成精準時間同步&#xff1f; PTP精密時鐘同步&#xff08;1588&#xff09;如何完成精準時間同步&#xff1f; 引言   以太網技術由于其開放性好、價格低廉和使用方便等特點&#xff0c;已經廣泛應用于電信級別的網絡中&am…

Centos部署GitLab-備份恢復

1. 下載rpm包 wget https://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/yum/el7/gitlab-ce-10.8.4-ce.0.el7.x86_64.rpm2. 安裝依賴 yum -y install policycoreutils openssh-server openssh-clients postfix policycoreutils-python3. rpm安裝 rpm -ivh gitlab-ce-10.8.4-ce.…

TCP 重傳、滑動窗口、流量控制、擁塞控制的剖析

TCP 是一個可靠傳輸的協議&#xff0c;那它是如何保證可靠的呢&#xff1f; 為了實現可靠性傳輸&#xff0c;需要考慮很多事情&#xff0c;例如數據的破壞、丟包、重復以及分片順序混亂等問題。如不能解決這些問題&#xff0c;也就無從談起可靠傳輸。 那么&#xff0c;TCP 是…

zend studio 的主題安裝、卸載和更新

zend studio的主題插件安裝 我的zend studio版本是13.6 在Welcome頁面右側看到有好多插件可以安裝&#xff0c;現在我們來安裝主題&#xff0c;主題插件就是Eclipse Color Theme。先選中Eclipse Color Theme選項打勾&#xff0c;然后點擊Apply changs 按鈕進行安裝。 安裝完成…

深入理解移動端H5視頻通話中的攝像頭切換實踐

在移動端H5應用中實現視頻通話功能,已經成為現代Web應用的標配之一。隨著Web技術的發展,我們不僅能夠在桌面瀏覽器上實現復雜的視頻通話功能,也能夠在移動端瀏覽器中提供幾乎原生應用級別的流暢體驗。本文將詳細介紹如何在使用聲網(Agora)Web SDK的移動端H5應用中實現攝像…

亞馬遜云科技向量數據庫助力生成式AI成功落地實踐探秘(一) ?

隨著大語言模型效果明顯提升&#xff0c;其相關的應用不斷涌現呈現出越來越火爆的趨勢。其中一種比較被廣泛關注的技術路線是大語言模型&#xff08;LLM&#xff09;知識召回&#xff08;Knowledge Retrieval&#xff09;的方式&#xff0c;在私域知識問答方面可以很好的彌補通…