AlexNet 閱讀筆記

“ImageNet Classification with Deep Convolutional Neural Networks” (Krizhevsky 等, 2012, p. 1)

使用深度卷積神經網絡進行 ImageNet 分類

3公式,26個引用,4張圖片,2個簡單表格

Abstract

我們訓練了一個大型深度卷積神經網絡,將 ImageNet LSVRC-2010 競賽中的 120 萬張高分辨率圖像分類為 1000 個不同的類別。

在測試數據上,我們實現了 37.5% 和 17.0% 的 top-1 和 top-5 錯誤率,這比之前的最先進水平要好得多。

該神經網絡擁有 6000 萬個參數和 650,000 個神經元,由五個卷積層(其中一些后面是最大池層)和三個全連接層(最終為 1000 路 softmax)組成。

為了加快訓練速度,我們使用非飽和神經元和非常高效的 GPU 實現卷積運算。為了減少全連接層中的過度擬合,我們采用了最近開發的稱為“dropout”的正則化方法,事實證明該方法非常有效。

我們還在 ILSVRC-2012 競賽中輸入了該模型的一個變體,并取得了 15.3% 的獲勝前 5 名測試錯誤率,而第二名的測試錯誤率為 26.2%。

1. Introduction

1.當前物體識別充分使用機器學習的方法,為了提高性能需要更大、質量更高的數據集從而學習更強大的模型。(列舉最近的數據集)。

2.模型需要先驗知識——引出CNN卷積神經網絡。

3.然而訓練是昂貴的,好在現在有GPU和足夠的有標簽高質量數據。

4.本文的具體貢獻

5.最后,神經網絡大小受限于GPU內存和時間,當前是在兩個GTX580 GPU上訓練了5-6天的實驗結果,只要GPU更快數據集更大,實驗結果就會改善!

2. The Dataset

介紹 ImageNet,介紹大規模視覺挑戰賽ILSVRC

作者在ILSVRC-2010上執行了大部分實驗,在ImageNet上通常使用top-1和top-5兩個錯誤率。

ImageNet的數據圖像分辨率不一樣,作者將它剪裁成256*256的固定大小,除此之外沒有使用任何其他處理方式。

3. The Architecture

我們的網絡架構如圖 2 所示。它包含八個學習層,五個卷積層和三個全連接層。下面,我們描述了我們網絡架構的一些新穎或不尋常的特征。第 3.1-3.4 節根據我們對其重要性的估計進行排序,最重要的排在最前面。

3.1 ReLU Nonlinearity

3.2 Training on Multiple GPUs

3.3 3.4

3.5 Overall Architecture

4. Reducing Overfitting

我們的神經網絡架構有 6000 萬個參數。盡管 ILSVRC 的 1000 個類別使每個訓練示例對從圖像到標簽的映射施加 10 位約束,但事實證明,這不足以在不出現嚴重過擬合的情況下學習如此多的參數。下面,我們描述了對抗過度擬合的兩種主要方法。

4.1 數據增強

“4.2 Dropout” 輟學

5. Details of learning

一些細節:兩個GTX 580訓練5-6天,120萬張圖片90個周期訓練,批量大小128,隨機梯度下降,動量0.9,權重衰減0.0005,標準差0.01,用0初始化。學習率初始化為0.01。

我們發現少量權重衰減對于模型學習很重要!

(這話跟我說的一樣!)

6. Results

表1總結了我們在ILSVRC-2010上的結果。

我們還在ILSVRC-2012競賽中使用了我們的模型,具體結果在表2給出。

最后,我們還報告了ImageNet2009年秋季版本的錯誤率。

6.1定性評價

7. Discussion

大型深度神經網絡用于監督學習能夠取得破紀錄的結果。如果刪除單個卷積層top-1性能會損失大約2%。深度很重要!

我們未使用無監督與訓練,我們希望未來在視頻上使用深度卷積網絡,因為時間也能提供很多信息。(吹牛,預測未來)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/208956.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/208956.shtml
英文地址,請注明出處:http://en.pswp.cn/news/208956.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Leetcode刷題詳解——環繞字符串中唯一的子字符串

1. 題目鏈接:467. 環繞字符串中唯一的子字符串 2. 題目描述: 定義字符串 base 為一個 "abcdefghijklmnopqrstuvwxyz" 無限環繞的字符串,所以 base 看起來是這樣的: "...zabcdefghijklmnopqrstuvwxyzabcdefghijklm…

卷積之后通道數為什么變了

通道數增多與卷積之后得到的圖像特征數量有關 卷積層的作用本來就是把輸入中的特征分離出來變成新的 feature map,每一個輸出通道就是一個卷積操作提取出來的一種特征。在此過程中ReLU激活起到過濾的作用,把負相關的特征點去掉,把正相關的留…

C++:vector增刪查改模擬實現

C:vector增刪查改模擬實現 前言一、迭代器1.1 非const迭代器:begin()、end()1.2 const迭代器:begin()、end() 二、構造函數、拷貝構造函數、賦值重載、析構函數模擬實現2.1 構造函數2.1.1 無參構造2.1.2 迭代器區間構造2.1.3 n個值構造 2.2 拷貝構造2.3 …

vue路由導航守衛(全局守衛、路由獨享守衛、組件內守衛)

目錄 一、什么是Vue路由導航守衛? 二、全局守衛 1、beforeEach 下面是一個beforeEach的示例代碼: 2、beforeResolve 下面是一個beforeResolve的示例代碼: 3、afterEach 下面是一個afterEach的示例代碼: 三、路由獨享守衛…

Shell - 學習筆記 - 1.14 - 如何編寫自己的Shell配置文件(配置腳本)?

第1章 Shell基礎(開胃菜) 14 - 如何編寫自己的Shell配置文件(配置腳本)? 學習了《Shell配置文件的加載》一節,讀者應該知道 Shell 在登錄和非登錄時都會加載哪些配置文件了。對于普通用戶來說,也許 ~/.bashrc 才是最重要的文件,因為不管是否登錄都會加載該文件。 我們…

【數據處理】NumPy數組的合并操作,如何將numpy數組進行合并?

,NumPy中的合并操作是指將兩個或多個數組合并成一個數組的操作。這種操作可以通過不同的函數來實現。 一、橫向合并(水平合并) 橫向合并是指將兩個具有相同行數的數組按列方向合并成一個數組的操作。在NumPy中,可以使用hstack()…

044:vue中引用json數據的方法

第044個 查看專欄目錄: VUE ------ element UI 專欄目標 在vue和element UI聯合技術棧的操控下,本專欄提供行之有效的源代碼示例和信息點介紹,做到靈活運用。 (1)提供vue2的一些基本操作:安裝、引用,模板使…

多相Buck的工作原理

什么是多相Buck電源? 多相電源控制器是一種通過同時控制多個電源相位的設備,以提供穩定的電力供應。相位是指電源中的電流和電壓波形。多相控制器的設計旨在最大程度地減小電力轉換系統的紋波,并提高整體能效。它通常包含一系列的功率級聯&a…

我的創作紀念日1024天紀念

機緣 經歷的1024天,突然有一種驚奇,日子一天天過,有種恍惚的感覺 收獲 從最開始的隨筆,慢慢向著筆記總結轉變,不經意間積累了好多 憧憬 雖不知最終會怎樣發展,但堅持與向前是一定的,未來一…

結構化布線系統

滿足下列需求: 1.標準化:國際、國家標準。 2.實用性:針對實際應用的需要和特點來建設系統。 3.先進性:采用國際最新技術。5-10年內技術不落后。 4.開放性:整個系統的開放性。 5.結構化、層次化:易于管理和維…

Matplotlib數據可視化

繪圖基礎語法 1 創建畫布并且創建子圖 首先創建一個空白的畫布,并且可以將畫布分為幾個部分,這樣就可以在同一附圖上繪制多個圖像。 plt.figure 創建一個空白畫布,可以指定畫布大小、像素 figure.add_subplot 創建并且選中子…

docker鏡像、容器管理與遷移

鏡像管理 搜索鏡像: 這種方法只能用于官方鏡像庫 搜索基于 centos 操作系統的鏡像 # docker search centos 按星級搜索鏡像: 查找 star 數至少為 100 的鏡像,默認不加 s 選項找出所有相關 ubuntu 鏡像: …

【web安全】文件讀取與下載漏洞

前言 菜某整理僅供學習,有誤請賜教。 概念 個人理解:就是我們下載一個文件會傳入一個參數,但是我們可以修改參數,讓他下載其他的文件。因為是下載文件,所以我們可以看到文件里面的源碼,內容。 文件讀取…

Python嗅探和解析網絡數據包

網絡工具解釋 Scapy是Python2和Python3都支持的庫。 它用于與網絡上的數據包進行交互。 它具有多種功能,通過這些功能我們可以輕松偽造和操縱數據包。 通過 scapy 模塊,我們可以創建不同的網絡工具,如 ARP Spoofer、網絡掃描儀、數據包轉儲器…

swiftUi——顏色

在SwiftUI中,您可以使用Color結構來表示顏色。Color可以直接使用預定義的顏色,例如.red、.blue、.green等,也可以使用自定義的RGB值、十六進制顏色代碼或者系統提供的顏色。 1. 預定義顏色 Text("預定義顏色").foregroundColor(.…

Swing程序設計(9)復選框,下拉框

文章目錄 前言一、復選框二、下拉框總結 前言 該篇文章簡單介紹了Java中Swing組件里的復選框組件、列表框組件、下拉框組件,這些在系統中都是常用的組件。 一、復選框 復選框(JCheckBox)在Swing組件中的使用也非常廣泛,一個方形方…

Albumentations(Augmentation Transformations)

Albumentations(Augmentation Transformations) Albumentations(Augmentation Transformations)是一個用于圖像數據增強(數據增廣)的Python包。它提供了豐富的圖像增強技術,用于訓練機器學習模…

hadoop安裝與配置-shell腳本一鍵安裝配置(集群版)

文章目錄 前言一、安裝準備1. 搭建集群 二、使用shell腳本一鍵安裝1. 復制腳本2. 增加執行權限3. 分發腳本4. 執行腳本5. 加載用戶環境變量 三、啟動與停止1. 啟動/停止hadoop集群(1) 復制hadoop集群啟動腳本(2) 增加執行權限(3) 啟動hadoop集群(4) 停止hadoop集群(5) 重啟hado…

智慧社區前景無限,科技引領未來發展

社區是城鎮化發展的標志,作為人類現代社會的生活的基本圈子,是人類生活離不開的地方,社區人口密度大、車輛多,管理無序,社區的膨脹式發展多多少少帶來一定的管理上的缺失。社區作為智慧城市建設的重要一環,…

編譯基于LIO-SAM的liorf“Large velocity, reset IMU-preintegration!“

使用LIO-SAM修改的代碼liorf(因自己使用的IMU傳感器是 6-axis ouster): LIO-SAM代碼連接: https://github.com/TixiaoShan/LIO-SAM liorf代碼連接: https://github.com/YJZLuckyBoy/liorf 編譯運行出現錯誤&#…