常用的幾種卷積神經網絡介紹

常用的幾種卷積神經網絡介紹
標簽(空格分隔): 深度學習

這是一篇基礎理論的博客,基本手法是抄、刪、改、查,畢竟介紹這幾個基礎網絡的博文也挺多的,就算是自己的一個筆記吧,以后忘了多看看。主要是想介紹下常用的幾種卷積神經網絡。卷積神經網絡最初為解決圖像識別問題而提出,目前廣泛應用于圖像,視頻,音頻和文本數據,可以當做深度學習的代名詞。目前圖像分類中的ResNet, 目標檢測領域占統治地位的Faster R-CNN,分割中最牛的Mask-RCNN, UNet和經典的FCN都是以下面幾種常見網絡為基礎。

LeNet
網絡背景

LeNet誕生于1994年,由深度學習三巨頭之一的Yan LeCun提出,他也被稱為卷積神經網絡之父。LeNet主要用來進行手寫字符的識別與分類,準確率達到了98%,并在美國的銀行中投入了使用,被用于讀取北美約10%的支票。LeNet奠定了現代卷積神經網絡的基礎。

網絡結構?

上圖為LeNet結構圖,是一個6層網絡結構:三個卷積層,兩個下采樣層和一個全連接層(圖中C代表卷積層,S代表下采樣層,F代表全連接層)。其中,C5層也可以看成是一個全連接層,因為C5層的卷積核大小和輸入圖像的大小一致,都是5*5(可參考LeNet詳細介紹)。

網絡特點

每個卷積層包括三部分:卷積、池化和非線性激活函數(sigmoid激活函數)
使用卷積提取空間特征
降采樣層采用平均池化


AlexNet
網絡背景

AlexNet由Hinton的學生Alex Krizhevsky于2012年提出,并在當年取得了Imagenet比賽冠軍。AlexNet可以算是LeNet的一種更深更寬的版本,證明了卷積神經網絡在復雜模型下的有效性,算是神經網絡在低谷期的第一次發聲,確立了深度學習,或者說卷積神經網絡在計算機視覺中的統治地位。

網絡結構?
?
AlexNet的結構及參數如上圖所示,是8層網絡結構(忽略激活,池化,LRN,和dropout層),有5個卷積層和3個全連接層,第一卷積層使用大的卷積核,大小為11*11,步長為4,第二卷積層使用5*5的卷積核大小,步長為1,剩余卷積層都是3*3的大小,步長為1。激活函數使用ReLu(雖然不是他發明,但是他將其發揚光大),池化層使用重疊的最大池化,大小為3*3,步長為2。在全連接層增加了dropout,第一次將其實用化。(參考:AlexNet詳細解釋)

網絡特點

使用兩塊GPU并行加速訓練,大大降低了訓練時間
成功使用ReLu作為激活函數,解決了網絡較深時的梯度彌散問題
使用數據增強、dropout和LRN層來防止網絡過擬合,增強模型的泛化能力


VggNet
網絡背景

VGGNet是牛津大學計算機視覺組和Google DeepMind公司一起研發的深度卷積神經網絡,并取得了2014年Imagenet比賽定位項目第一名和分類項目第二名。該網絡主要是泛化性能很好,容易遷移到其他的圖像識別項目上,可以下載VGGNet訓練好的參數進行很好的初始化權重操作,很多卷積神經網絡都是以該網絡為基礎,比如FCN,UNet,SegNet等。vgg版本很多,常用的是VGG16,VGG19網絡。

網絡結構?

上圖為VGG16的網絡結構,共16層(不包括池化和softmax層),所有的卷積核都使用3*3的大小,池化都使用大小為2*2,步長為2的最大池化,卷積層深度依次為64 -> 128 -> 256 -> 512 ->512。

網絡特點?
網絡結構和AlexNet有點兒像,不同的地方在于:

主要的區別,一個字:深,兩個字:更深。把網絡層數加到了16-19層(不包括池化和softmax層),而AlexNet是8層結構。
將卷積層提升到卷積塊的概念。卷積塊有2~3個卷積層構成,使網絡有更大感受野的同時能降低網絡參數,同時多次使用ReLu激活函數有更多的線性變換,學習能力更強(詳細介紹參考:TensorFlow實戰P110頁)。
在訓練時和預測時使用Multi-Scale做數據增強。訓練時將同一張圖片縮放到不同的尺寸,在隨機剪裁到224*224的大小,能夠增加數據量。預測時將同一張圖片縮放到不同尺寸做預測,最后取平均值。


ResNet
網絡背景

ResNet(殘差神經網絡)由微軟研究院的何凱明等4名華人于2015年提出,成功訓練了152層超級深的卷積神經網絡,效果非常突出,而且容易結合到其他網絡結構中。在五個主要任務軌跡中都獲得了第一名的成績:

ImageNet分類任務:錯誤率3.57%
ImageNet檢測任務:超過第二名16%
ImageNet定位任務:超過第二名27%
COCO檢測任務:超過第二名11%
COCO分割任務:超過第二名12%
作為大神級人物,何凱明憑借Mask R-CNN論文獲得ICCV2017最佳論文,也是他第三次斬獲頂會最佳論文,另外,他參與的另一篇論文:Focal Loss for Dense Object Detection,也被大會評為最佳學生論文。

網絡結構?


?
上圖為殘差神經網絡的基本模塊(專業術語叫殘差學習單元),輸入為x,輸出為F(x)+x,F(x)代表網絡中數據的一系列乘、加操作,假設神經網絡最優的擬合結果輸出為H(x)=F(x)+x,那么神經網絡最優的F(x)即為H(x)與x的殘差,通過擬合殘差來提升網絡效果。為什么轉變為擬合殘差就比傳統卷積網絡要好呢?因為訓練的時候至少可以保證殘差為0,保證增加殘差學習單元不會降低網絡性能,假設一個淺層網絡達到了飽和的準確率,后面再加上這個殘差學習單元,起碼誤差不會增加。(參考:ResNet詳細解釋)?
通過不斷堆疊這個基本模塊,就可以得到最終的ResNet模型,理論上可以無限堆疊而不改變網絡的性能。下圖為一個34層的ResNet網絡。?


網絡特點

使得訓練超級深的神經網絡成為可能,避免了不斷加深神經網絡,準確率達到飽和的現象(后來將層數增加到1000層)
輸入可以直接連接到輸出,使得整個網絡只需要學習殘差,簡化學習目標和難度。
ResNet是一個推廣性非常好的網絡結構,容易和其他網絡結合
論文地址:?
1. LeNet論文?
2. AlexNet論文?
3. VGGNet論文?
4. ResNet論文
---------------------?
作者:feixian15?
來源:CSDN?
原文:https://blog.csdn.net/qq_34759239/article/details/79034849?
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/458105.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/458105.shtml
英文地址,請注明出處:http://en.pswp.cn/news/458105.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

計算客 (人人都有極客精神)爆力

人人公司是一家極為鼓舞極客精神的公司,當有重要的項目須要上線但又時間太緊。甚至須要當天上線的時候。往往會掛起海盜旗開啟電子日期顯示。讓大家能夠在對時間有更明白的感知的情況下,同心協力搞定重要的項目。海盜旗下方的電子屏顯示的日期形式為 YYY…

深度學習案例

1. neural-style:利用卷積神經網絡將一幅圖像的內容與另一幅圖像的風格相結合 https://github.com/jcjohnson/neural-style 2.Nerual Doodles:把 2 位的 Doodle 轉成精良的藝術品 https://github.com/alexjc/neural-doodle 3. srez:通過深度…

深度學習圖像標注工具匯總

對于監督學習算法而言,數據決定了任務的上限,而算法只是在不斷逼近這個上限。世界上最遙遠的距離就是我們用同一個模型,但是卻有不同的任務。但是數據標注是個耗時耗力的工作,下面介紹幾個圖像標注工具: Labelme Labe…

UIBarbuttonItem

APPDelegate: - (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions { self.window [[UIWindow alloc]initWithFrame:[UIScreen mainScreen].bounds]; //創建主界面,導航欄的第一個頁面 FirstViewContr…

深度殘差網絡ResNet解析

ResNet在2015年被提出,在ImageNet比賽classification任務上獲得第一名,因為它“簡單與實用”并存,之后很多方法都建立在ResNet50或者ResNet101的基礎上完成的,檢測,分割,識別等領域都紛紛使用ResNet&#x…

Oracle-一個中文漢字占幾個字節?

Oracle 一個中文漢字占用幾個字節 Oracle 一個中文漢字 占用幾個字節,要根據Oracle中字符集編碼決定!!! 1. 如果定義為VARCHAR2(32 CHAR),那么該列最多就可以存儲32個漢字,如果定義字段為VARCHAR2(32) 或VARCHAR2(32 B…

基于深度學習的目標檢測技術演進:R-CNN、Fast R-CNN、Faster R-CNN

object detection我的理解,就是在給定的圖片中精確找到物體所在位置,并標注出物體的類別。object detection要解決的問題就是物體在哪里,是什么這整個流程的問題。然而,這個問題可不是那么容易解決的,物體的尺寸變化范…

iPhone屏幕尺寸/launch尺寸/icon尺寸

屏幕尺寸 6p/6sp 414 X 7366/6s 375 X 6675/5s 320 X 568 4/4s 320 X 480launch尺寸 6p/6sp 1242 X 2208 3x6/6s 750 X 1334 2x5/5s 640 X 1136 2x4/4s 640 X 960 2x仔細觀察會發現l…

CNN的發展歷史(LeNet,Alexnet,VGGNet,GoogleNet,ReSNet)

歡迎轉載,轉載請注明:本文出自Bin的專欄blog.csdn.net/xbinworld。 關于卷積神經網絡CNN,網絡和文獻中有非常多的資料,我在工作/研究中也用了好一段時間各種常見的model了,就想著簡單整理一下,以備查閱之需…

讀取csv格式的數據

1.直接上代碼&#xff0c;關鍵是會用 2.代碼如下&#xff1a; <?php #添加推薦到英文站 $file fopen(code.csv,r); while ($data fgetcsv($file)) { //每次讀取CSV里面的一行內容 //print_r($data); //此為一個數組&#xff0c;要獲得每一個數據&#xff0c;訪問數組下…

如何在VMWare的Ubuntu虛擬機中設置共享文件夾

親測有效&#xff1a;Ubuntu18.04 LTS、虛擬機VMware Workstation 14 Pro 14.1.3 build-9474260、Window7 自己的第一篇博文&#xff0c;由于時&#xff08;shuǐ&#xff09;間&#xff08;png&#xff09;原&#xff08;yǒu&#xff09;因&#xff08;xin&#xff09;&…

容器+AOP實現動態部署(四)

上篇咱們介紹了容器和AOP的結合&#xff0c;結合后怎樣將對象增強服務并沒有過多的說明&#xff0c;這里將詳細說明怎樣將對象 進行增強 &#xff0c;達到一個一對多和多對多的增強方式 先從簡單的方式說起 /** *JDK代理類&#xff0c;實現動態調用對象方法 */ public class JD…

caffe專題五——回歸中——檢測框架

https://blog.csdn.net/runner668/article/details/80436850

深入理解卷積層,全連接層的作用意義

有部分內容是轉載的知乎的&#xff0c;如有侵權&#xff0c;請告知&#xff0c;刪除便是&#xff0c;但由于是總結的&#xff0c;所以不一一列出原作者是who。 再次感謝&#xff0c;也希望給其他小白受益。 首先說明&#xff1a;可以不用全連接層的。 理解1&#xff1a; 卷…

用ionic快速開發hybird App(已附源碼,在下面+總結見解)

用ionic快速開發hybird App&#xff08;已附源碼,在下面總結見解&#xff09; 1.ionic簡介 ionic 是用于敏捷開發APP的解決方案。核心思路是&#xff1a;利用成熟的前端開發技術&#xff0c;來寫UI和業務邏輯。也就是說&#xff0c;就是一個H5網站&#xff0c;這個區別于react-…

為什么要使用工廠模式

工廠的作用相當于幫助我們完成實例化的操作。 優勢1&#xff1a;一般在代碼中&#xff0c;實例化一個類A是直接new A&#xff08;&#xff09;&#xff0c;假如類A是一個完全獨立的類&#xff0c;沒有相似類&#xff0c;則沒有必要使用工廠模式&#xff0c;直接new A&#xff…

css各兼容應該注意的問題

1.div布局在ie瀏覽器和chrome瀏覽器&#xff0c;firefox瀏覽器不同&#xff0c;不如在div里面嵌套3個div&#xff0c;分別左中右&#xff0c;左邊div的pading和margin在ie8以上都是幾乎相同&#xff0c;ie8以下做內邊距x2&#xff0c;在中間的div在chrome和fierfox中默認在左邊…

轉 C++宏定義詳解

來自&#xff1a;傳送門 C宏定義詳解 一、#define的基本用法 #define是C語言中提供的宏定義命令&#xff0c;其主要目的是為程序員在編程時提供一定的方便&#xff0c;并能在一定程度上提高程序的運行效率&#xff0c;但學生在學習時往往不能 理解該命令的本質&#xff0c;總是…

acm之vim的基本配置

http://www.kuangbin.net/archives/vim-acmicpc 轉載于:https://www.cnblogs.com/akrusher/articles/5402426.html

40 個重要的 HTML5 面試問題及答案

2019獨角獸企業重金招聘Python工程師標準>>> 介紹 我是一個ASP.NET MVC開發人員。最近當我找工作的時候&#xff0c;我發現很多問題都是圍繞HTML 5和它的新功能展開的。所以&#xff0c;下面我將列出40個有助于你提高相關HTML 5知識的重要問題。 這些問題并不能保證…