論文筆記 Aggregated Residual Transformations for Deep Neural Networks

這篇文章構建了一個基本“Block”,并在此“Block”基礎上引入了一個新的維度“cardinality”(字母“C”在圖、表中表示這一維度)。深度網絡的另外兩個維度分別為depth(層數)、width(width指一個層的channel的數目)。

?

首先我們先了解一個這個“Block”是如何構建的,如下圖所示(ResNeXt是這篇論文提出模型的簡化表示)

左邊是標準殘差網絡“Block”,右圖是作者引入的“Block”。這新的Block有什么優勢呢?作者應該是受到了Inception models的啟發,論文中指出“Unlike VGG-nets, the family of Inception models have demonstrated that carefully designed topologies are able to achieve compelling accuracy with low theoretical complexity”。再進一步就是,“The split-transform-merge behavior of Inception modules is expected to approach the representational power of large and dense layers, but at a considerably lower computational complexity”。說得簡單點就是“在達到大型、緊湊深度網絡的準確率的同時,降低模型的計算復雜度”(這就是這篇paper追求的一個效果)。Figure 1右邊就是就是采用split-transform-merge策略構建的。

?

Inception models在實際應用時有一個很不方便的地方:每一個分支的卷積核大小、尺寸是“定制的”,不同的“Block”之間也是“定制的”。如果我們想要應用這一模型或者在這一框架下設計一個新的網絡,那么上述“定制化”的特點會引入很多“超參數”。如果你自己設計過網絡或者更改過現有網絡,你就會理解“超參數”過多對于我們的設計簡直就是一個“災難”。此時,如果沒有一個合適的設計策略的話,說直白點就是“靠天吃飯”了。

?

受VGG/ResNets成功的啟發,作者總結了以下兩個設計“Block”原則:

  1. “If producing spatial maps of the same size, the blocks share the same hyper-parameters(width and filter sizes)”
  2. "Each time when the spatial map is downsampled by a factor of 2, the width of the blocks is multiplied by a factor of 2"

除此之外,所有的“Block”具有相同的拓撲結構。作者給出了一些設計的模板,再結合上述兩條原則,我們基本可以構建所需要的任意網絡了(是不是覺得網絡結構的設計一下子變得簡單了很多),模板如下表所示

這還沒有結束,作者有給出了Figure 1左邊結構的兩種等價表述形式,如下圖所示

這就極大的方便了我們的實現。此時Alexnet引入的group convolution概念就有了用武之地(當時引入這一概念是受GPU條件的限制)。采用Figure 3(c)的形式,可以在Caffe中直接實現而無需更改任何源代碼。

?

下面我們通過實驗效果看看這一模型的威力

由Table 4可以得出,即使復雜度減少一半,該模型依然可以取得比ResNet-200還好的實驗效果,達到了作者追求的“在達到復雜、緊湊深度模型準確率的同時,減少計算復雜度的目的”。

?

總結:

  • 作者要求“Block”具有相同的拓撲結構,同時給出“Blcok”擴展的設計原則和模板(通過repeating building blocks可以得出網絡結構),極大的簡化了網絡結構設計的工作量。
  • 相同實現不同等價形式的給出,一能加深我們理解,二能為我們提供快速實現的可能。
  • 這真的是一篇佳作哦。

轉載于:https://www.cnblogs.com/everyday-haoguo/p/Note-ResNeXt.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/455485.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/455485.shtml
英文地址,請注明出處:http://en.pswp.cn/news/455485.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

matlab 歸一化_機器學習中如何用Fscore進行特征選擇(附Matlab代碼)

作者:kervin編輯:阿吉 目前,機器學習在腦科學領域的應用可謂廣泛而深入,不論你是做EEG/ERP研究,還是做MRI研究,都會看到機器學習的身影。機器學習最簡單或者最常用的一個應用方向是分類,…

Java筆記05-Collection、泛型、迭代器

Java筆記05-Collection、泛型、迭代器 【Collection、泛型】 主要內容 Collection集合迭代器增強for泛型 第一章 Collection集合 1.1 集合概述 在前面基礎班我們已經學習過并使用過集合ArrayList ,那么集合到底是什么呢? 集合:集合是java中提供的一種容器&a…

IOS安裝CocoaPods完整流程

作為一個底層系統大菜鳥,又搞過幾年ios來說,安裝一個CocoaPods是一件蛋痛的事~ 說懂又懂,說不懂又不懂. 由于安裝過程比較復雜,步驟較多,而網上教程又比較零散,并且有一些是扯蛋的,所以本篇文章主要從頭到位依據自身安裝經歷記錄每一條終端指令,至于里面的原理和一些概念性的東…

重裝TCP/IP

在Windows XP的網絡組件列表里,Internet 協議 (TCP/IP)的"卸載"按鈕是灰色不可選狀態。這是因為傳輸控制協議/Internet 協議 (TCP/IP) 堆棧是 Microsoft XP/ 2003 的核心組件(TCP/IP協議是Windows XP的默認協議),不能刪除。所以Windows XP不允許卸載TCP/I…

linux 修改時區_教你在Centos8中更改時區

對于許多與系統相關的任務和進程,使用正確的時區是必不可少的。例如,cron守護進程使用系統的時區執行cron作業,日志文件中的時間戳基于同一系統的時區。環 境CentOS 8檢查現在的時區timedatectl是一個命令行實用程序,允許您查看和…

UVA12511 - Virus(DP+最長公共上升子序列)

題目鏈接: https://vjudge.net/problem/UVA-12511 題目大意: 給定兩個序列,求出兩個序列的最長公共上升子序列(嚴格上升)。 解題過程: 比賽的時候沒有做出來,非常咸魚的一場比賽,當時…

Java筆記06-Map集合

Map集合 學習目標 能夠說出Map集合特點使用Map集合添加方法保存數據使用”鍵找值”的方式遍歷Map集合使用”鍵值對”的方式遍歷Map集合能夠使用HashMap存儲自定義鍵值對的數據能夠使用HashMap編寫斗地主洗牌發牌案例 Map集合概述 啥也不用說,Map集合就相當于python中的字典…

理解什么是前后端分離

HTML、CSS、JS。 AJAX或Fetch。 學習一個前端的框架, React或者Vue或者Angularjs2都可以。 學會一個前端的路由框架, 如React-Router或者Vue-Router。 在學會3的基礎上你肯定已經搭建好前端的開發環境了,所有和后端的交互走AJAX或者Fetch…

幀間、幀內像素塊預測

一、像素塊預測 H.264/ AVC標準中的基本預測技術是基于塊,而不是基于對象的。它的編碼器是利用混合的編碼方案來提高編碼效率,這些方案包括高級的預測技術和有效熵編碼技術。在運動預測中它使用不同的塊的大小進行預測,以樹結構的方式來組織…

高性能mysql 第10章 復制

復制功能不僅能夠構建高可用的應用,同時也是高可用性,可擴展性,災難恢復,備份以及數據倉庫等工作的基礎。 mysql支持兩種復制方式:基于語句的復制和基于行的復制。基于語句的復制(也成為邏輯復制&#xff0…

vb6在后臺將窗體保存到圖片_如何將寺庫網多個商品圖片一鍵分類保存到一個目錄...

寺庫網是全球最大的奢侈品網上在線購物平臺,那么我們怎樣可以從寺庫網上一鍵批量采集到多個寶貝商品圖片,并分類保存到電腦呢?今天小編給大家帶來一款專業電商圖片鏈接采集軟件【載圖助手】,它支持平臺高達141個,均可支…

Java筆記07-List、Set、數據結構、Collections

Java筆記07-List、Set、數據結構、Collections 主要內容 數據結構List集合Set集合Collections 第一章 數據結構 2.1 數據結構有什么用? 當你用著java里面的容器類很爽的時候,你有沒有想過,怎么ArrayList就像一個無限擴充的數組&#xff…

Apache安裝問題:configure: error: APR not found . Please read the documentation

參考:http://cuisuqiang.iteye.com/blog/2068794 http://www.cnblogs.com/Anker/p/3355573.html pcre: https://ftp.pcre.org/pub/pcre/ http://www.linuxidc.com/Linux/2012-06/62289.htm 1. 不贊成去卸載httpd的東西。 2. server上可以存在多個apache。一個是rpm&…

浮動與定位

2019獨角獸企業重金招聘Python工程師標準>>> 一.浮動:float:一個元素浮動時,其他內容會"環繞"該元素. 浮動元素的外邊距不會合并浮動的元素不能超出其包含快的內邊界浮動元素彼此會避免重疊浮動元素的頂端不能比之前所有浮動元素或塊級元素的頂端更高如果…

驅動級的自動按鍵_Aqara全自動智能推拉鎖D100,體驗全自動開門的便捷

大家好,我是夢想是個豬,今天為大家帶來的是一篇智能門鎖的使用體驗。前言家里的這張門陸陸續續的換了好幾把智能門鎖了,也體驗了好幾種不同的開鎖方式。最開始開發商給安裝的是一把指紋和把手分離的那種款式,開鎖的時候需要先輸入…

碼率問題

幀率影響的是每幀的額定比特數 我說的幀率是編碼幀率,不是采集幀率。對于一個采集后的序列,MAD 只跟參考幀有關。而編碼幀率與參考幀無關,因此編碼幀率不影響 MAD。 ———————————————————————————————————…

Java筆記08-Map詳解

第一章 Map集合 1.1 概述 現實生活中,我們常會看到這樣的一種集合:IP地址與主機名,身份證號與個人,系統用戶名與系統用戶對象等,這種一一對應的關系,就叫做映射。Java提供了專門的集合類用來存放這種對象…

Node.js的helloworld 程序

用文本編輯器,如npp,鍵入例如以下代碼,存儲成hello.js console.log(hello) console.log(hello %s->%d,jeapedu, 1941847311) cmd進入dos。切入hello.js所在文件夾。運行node.js程序 node hello.js執行結果例如以下所看到的: C:\nodeS>n…

深度學習綜述

摘要: 深度學習可以完成需要高度抽象特征的人工智能任務,如語音識別、圖像識別和檢索、自然語言理解等。深層模型是包含多個隱藏層的人工神經網絡,多層非線性結構使其具備強大的特征表達能力和對復雜任務建模能力。訓練深層模型是長期以來的難…

mac svn工具_Cornerstone 4 for mac(svn管理工具)

Cornerstone 4 for mac是全新版本的svn管理工具,使用cornerstone for mac 特別版建立的版本控制更利于使用,而且cornerstone 4 特別版全面支持Subversion的功能,這里準備了最新版本的cornerstone for mac 特別版,無需激活&#xf…