深度學習-回顧經典AlexNet網絡:山高我為峰

深度學習-回顧經典AlexNet網絡之山高我為峰

深度學習中,經典網絡引領一波又一波的技術革命,從LetNet到當前最火的GPT所用的Transformer,它們把AI技術不斷推向高潮。2012年AlexNet大放異彩,它把深度學習技術引領第一個高峰,打開人們的視野。

用pytorch構建CNN經典網絡模型AlexNet,還可以用數據進行訓練模型,得到一個優化的模型。

數據分析

數據分析-Pandas如何轉換產生新列

數據分析-Pandas如何統計數據概況

數據分析-Pandas如何輕松處理時間序列數據

數據分析-Pandas如何選擇數據子集

數據分析-Pandas如何重塑數據表-CSDN博客

經典算法

經典算法-遺傳算法的python實現

經典算法-模擬退火算法的python實現

經典算法-粒子群算法的python實現-CSDN博客

AlexNet概述

第一個典型的CNN是LeNet5網絡,而第一個引領技術潮流的CNN卻是AlexNet。2012年在全球知名的圖像識別競賽 ILSVRC 中,AlexNet 橫空出世,直接將錯誤率降低了近 10 個百分點。這是斷崖式的領先。當時AlexNet的影響,和現在chatGPT帶來的效應相當。

網絡結構

輸入圖像分辨率:227x227x3 通道

結構:

9層:1個輸入層,5個卷積層,2個全連接層,1個輸出層,因GPU內存不夠,分為上下兩組;

(1)C1:11x11 —>輸出2組48個55×55大小的特征圖–> ReLU --> LRN --> MaxPooling;

(2)C2:5x5 —>輸出2組128個27×27大小的特征圖–> ReLU --> LRN --> MaxPooling;

(3)C3:3x3 —>輸出384個13×13大小的特征圖–> ReLU;

(4)C4:3x3 —>輸出2組192個13×13大小的特征圖–> ReLU;

(5)C5:3x3 —>輸出2組128個13×13大小的特征圖–> ReLU --> MaxPooling;

(6)FC6 ----> 6x6,輸入2組6x6x128特征圖,輸出4096個1x1全連接層–> ReLU --> Dropout;

(7)FC7 ----> 輸入4096個神經元,輸出4096個神經元–> ReLU --> Dropout

(8)輸出層—> 輸入4096個神經元–>softmax -->輸出 1000分類

整個AlexNet網絡包含的神經元個數為:

290400 + 186624 + 64896 + 64896 + 43264 + 4096 + 4096 + 1000 = 659272

大約65萬個神經元

整個AlexNet網絡包含的參數數量為:

34944 + 307456 + 885120 + 663936 + 442624 + 37752832 + 16781312 + 4096000 = 60964224

大約6千萬個參數

在這里插入圖片描述

優勢與不足

優勢:采用激活函數ReLU,局部響應歸一化,使用Dropout機制,Max Pooling重疊池化,雙GPU訓練,圖像尺寸擴大227x227x3。

Pytorch實現

以下便是使用Pytorch實現的經典網絡結構AlexNet

# AlexNet 227x227x3
class AlexNet(nn.Module):def __init__(self, channels, num_classes):super(AlexNet, self).__init__()self.features = nn.Sequential(# 輸入通道數為3,彩色圖片# 輸出96、卷積核為11x11,步長為4,是AlexNet模型結構決定nn.Conv2d(channels, 96, kernel_size=11,stride=4, padding=2),nn.ReLU(),nn.MaxPool2d(kernel_size=3,stride=2),nn.Conv2d(96, 256,kernel_size=5, padding=2),nn.ReLU(),nn.MaxPool2d(kernel_size=3,stride=2),nn.Conv2d(256, 384, kernel_size=3, padding=1),nn.ReLU(),nn.Conv2d(384, 384, kernel_size=3,padding=1),nn.ReLU(),nn.Conv2d(384, 256, kernel_size=3,padding=1),nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2))# 全連接層self.classifier = nn.Sequential(# 全連接的第一層,輸入卷積輸出的拉平值,即6*6*256# 輸出為4096nn.Linear(in_features=6*6*256,out_features=4096),nn.ReLU(),# AlexNet采取了DropOut進行正則,防止過擬合nn.Dropout(p=0.5),nn.Linear(4096,4096),nn.ReLU(),nn.Dropout(p=0.5),# 最后一層,輸出1000個類別,也是我們所說的softmax層nn.Linear(4096,num_classes))# 前向算法def forward(self,x):x = self.features(x)x = torch.flatten(x,1)result = self.classifier(x)return result

大家可以和LetNet5對照差異,也可以一窺DeepLearning技術的突破點。

在AlexNet開創一片天地后,CNN網絡引領的深度學習蓬勃發展,造就人工智能技術革命的起點。

覺得有用 收藏 收藏 收藏

點個贊 點個贊 點個贊

End

GPT專欄文章:

GPT實戰系列-ChatGLM3本地部署CUDA11+1080Ti+顯卡24G實戰方案

GPT實戰系列-LangChain + ChatGLM3構建天氣查詢助手

大模型查詢工具助手之股票免費查詢接口

GPT實戰系列-簡單聊聊LangChain

GPT實戰系列-大模型為我所用之借用ChatGLM3構建查詢助手

GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(二)

GPT實戰系列-P-Tuning本地化訓練ChatGLM2等LLM模型,到底做了什么?(一)

GPT實戰系列-ChatGLM2模型的微調訓練參數解讀

GPT實戰系列-如何用自己數據微調ChatGLM2模型訓練

GPT實戰系列-ChatGLM2部署Ubuntu+Cuda11+顯存24G實戰方案

GPT實戰系列-Baichuan2本地化部署實戰方案

GPT實戰系列-Baichuan2等大模型的計算精度與量化

GPT實戰系列-GPT訓練的Pretraining,SFT,Reward Modeling,RLHF

GPT實戰系列-探究GPT等大模型的文本生成-CSDN博客

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/712758.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/712758.shtml
英文地址,請注明出處:http://en.pswp.cn/news/712758.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

總結一下linux性能檢測和調優手段

1.perf 是 Linux 系統中性能分析工具,用于收集性能相關的信息。它可以用于查看 CPU 使用情況、內存性能、磁盤 I/O 等,以幫助開發者找到性能瓶頸。 以下是一些 perf 常見用法和示例: 1. CPU Profiling a. 查看 CPU 使用率 perf stat -e cpu…

10分鐘SkyWalking與SpringBoot融合并整合到Linux中

1.依賴配置 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId><version>2.2.0.RELEASE</version></dependency><dependency><groupId>org.springframe…

復試PAT乙級day33

PAT乙級1106~1110 1106_2019數列有一個測試點過不了 1109_擅長C 這題不會&#xff0c;通過的是別人的代碼 1110_區塊反轉 這題跟1105_鏈表合并 的處理很像。值得注意的是分段區間翻轉用 大轉小轉 的方式。這題也有一個測試點通不過。

從模型到復合AI系統的轉變

2023年,大型語言模型(LLM)吸引了所有人的注意力,它可以通過提示來執行通用任務,例如翻譯或編碼。這自然導致人們將模型作為AI應用開發的主要成分而密切關注,所有人都在想新的LLM將帶來什么能力。然而,隨著越來越多的開發者開始使用LLM構建,我們認為這種關注正在迅速改變:最先進…

阿里云OSS掛到到ECS作為一個linux目錄(OSSFS掛載)

配置OSS賬號信息并掛載OSS Bucket。以下是該文檔的示例&#xff1a; OSSFS 配置與掛載指南 步驟 1&#xff1a;安裝必要的依賴包 首先&#xff0c;確保您的系統已經安裝了wget和fuse。這些工具是下載OSSFS安裝包和掛載文件系統所必需的。 bash復制代碼 # 檢查并安裝 wget if…

數據服務安全的重要性

數據服務安全在當今信息化社會顯得尤為重要。隨著大數據、云計算、人工智能等技術的飛速發展&#xff0c;數據已經成為企業和組織的核心資產&#xff0c;數據服務安全也面臨著前所未有的挑戰。本文將從數據服務安全的重要性、常見威脅、防護策略以及未來發展趨勢等方面進行探討…

selenuim【1】($x(‘xpath語法’)、WebDriverWait())

文章目錄 初學selenuim記錄1、執行driver webdriver.Chrome()后很久才打開瀏覽器2、瀏覽器多元素定位 $x(‘xpath語法’)3、打開瀏覽器driver.get("網址")執行了很久才開始定位元素&#xff1a;等待&#xff08;1&#xff09;driver.set_page_load_timeout(t)&#…

事務及SpringBoot中的事務開啟

目錄 1.什么是事務&#xff1f; 2.事務的四大特性&#xff1f; 3.SpringBoot中怎樣開啟事務 1.開啟事務支持 2.在需要開啟事務的方法或類上使用Transactional 3.通過配置類來開啟全局事務 1.什么是事務&#xff1f; 事務是指在數據庫管理系統中執行的一系列操作的邏輯單元。事…

基于SpringBoot+vue+elementui在線教育系統詳細設計實現

前言 ??博主介紹:?專注于Java、小程序技術領域和畢業項目實戰??? ???? 精彩專欄 推薦訂閱???? 2024年Java精品實戰案例《100套》 ??文末獲取源碼聯系?? ??文末獲取源碼+數據庫?? 感興趣的可以先收藏起來,還有大家在畢設選題,項目以及論文編寫等相…

外包干了7個月,技術退步明顯.......

先說一下自己的情況&#xff0c;大專生&#xff0c;18年通過校招進入北京某軟件公司&#xff0c;干了接近4年的功能測試&#xff0c;今年年初&#xff0c;感覺自己不能夠在這樣下去了&#xff0c;長時間呆在一個舒適的環境會讓一個人墮落! 而我已經在一個企業干了四年的功能測…

智慧旅游+數字化景區整體解決方案:文件全文83頁,附下載

關鍵詞&#xff1a;智慧景區建設&#xff0c;智慧旅游一體化平臺&#xff0c;數字化景區建設&#xff0c;智慧旅游建設&#xff0c;智慧景區解決方案&#xff0c;智慧文旅解決方案&#xff0c;智慧旅游解決方案 一、景區智慧旅游建設需求與背景分析 1、技術發展背景 隨著信息…

Unity | Shader基礎知識(第十集:shader常用外部資產單詞速成)

目錄 一、外部資產簡介 二、常用的外部資產單詞 三、常用的外部資產單詞和引入內部 四、圖片資產外部調整的具體講解 1.Tiling&#xff0c;中文&#xff1a;鋪地磚 2.Offset&#xff0c;中文&#xff1a;偏移 五、作者的話 一、外部資產簡介 在第六集中&#xff0c;我們…

RabbitMQ的常見工作模式

Work queues 工作隊列模式 模式說明 通過Helloworld工程我們已經能夠構建一個簡單的消息隊列的基本項目&#xff0c;項目中存在幾個角色:生產 者、消費者、隊列&#xff0c;而對于我們真實的開發中 &#xff0c;對于消息的消費者通過是有多個的。 比如在實現用戶注冊功能時&…

【OpenCV】繪制桌面鎖屏時鐘

OpenCV 是一個開源的計算機視覺&#xff08;Computer Vision&#xff09;與機器學習軟件庫&#xff0c;提供了多種圖像處理算法與接口&#xff0c;用于解決計算機視覺相關問題。OpenCV 支持多平臺與多語言&#xff0c;本文主要記錄如何使用 OpenCV-Python 繪制桌面鎖屏時鐘。 目…

一、環境配置

一、下載Ubuntu18.04版本鏡像 我的電腦配置比較低(08年奧運限定版哦)&#xff0c;使用的是虛擬機VMware進行安裝Ubuntu18.04版&#xff0c;跟書上使用的一樣 Ubuntu 18.04鏡像 別下載錯了哈 二、VMware下安裝Ubuntu18.04操作系統 之前寫過相關的博文&#xff0c;詳細配置可…

軟件測試——性能測試

目錄 一、性能測試簡介 二、性能測試指標 三、性能測試的流程 四、Jmeter簡介 五、Jmeter常見測試框架 六、Jmeter錄制腳本 七、腳本增強 八、Jmeter腳本參數化 九、斷言 十、關聯 十一、JDBC請求 十二、分布式測試 十三、性能測試報告 一、性能測試簡介…

API接口技術開發拼多多接口鏈接采集實時銷量、SKU信息、券后價格、優惠券信息API接入步驟及演示示例

要實現拼多多接口鏈接采集實時銷量、SKU信息、券后價格、優惠券信息API接入步驟及演示示例&#xff0c;首先需要了解拼多多開放平臺的相關API接口。以下是一個簡單的Java示例&#xff0c;使用requests庫調用拼多多開放平臺的API接口&#xff1a; 注冊并登錄開放平臺&#xff0c…

【LeetCode】一周中的第幾天+ 一年中的第幾天

2023-12-30 文章目錄 一周中的第幾天方法一&#xff1a;模擬思路步驟 方法二&#xff1a;調用庫函數方法三&#xff1a;調用庫函數 [1154. 一年中的第幾天](https://leetcode.cn/problems/day-of-the-year/)方法一&#xff1a;直接計算思路&#xff1a; 方法二&#xff1a;調用…

react Hook useEffect的基本使用及注解

一、概述 useEffect是React提供的一個Hook&#xff0c;用于在函數組件中執行副作用操作。副作用操作通常包括數據獲取、訂閱事件、手動操作DOM等。useEffect可以讓我們在函數組件中模擬類組件的生命周期方法&#xff08;如componentDidMount、componentDidUpdate、componentWi…

vue3+ts實現圖片預覽功能

首先&#xff0c;需要創建一個Vue組件&#xff0c;用于顯示圖片和預覽圖。 <template><div><img :src"imageSrc" mouseover"showPreview" mouseout"hidePreview" /><div v-if"previewVisible" class"previ…