卷積神經網絡CNN到底在卷些什么?

來源:

卷積神經網絡(CNN)到底卷了啥?8分鐘帶你快速了解!_嗶哩嗶哩_bilibili卷積神經網絡(CNN)到底卷了啥?8分鐘帶你快速了解!共計2條視頻,包括:卷積神經網絡(CNN)到底卷了啥?、什么是循環神經網絡?RNN的變體LSTM和GRU的運作原理又是怎樣的?(人工智能丨深度學習丨機器學習丨自然語言處理)等,UP主更多精彩視頻,請關注UP賬號。https://www.bilibili.com/video/BV1MsrmY4Edi/?spm_id_from=333.337.search-card.all.click&vd_source=87f8c6f71fc5a150d17b858a02bf33d9


整體流程:

圖片輸入(RGB) ↓
卷積層(提取局部特征)↓
池化層(壓縮特征圖)↓
重復卷積+池化(提取更高階特征)↓
Flatten(扁平化)↓
全連接層(分類邏輯推理)↓
輸出層(得到分類結果)

一、前置了解

卷積核/濾波器/滑動窗口

卷積核本質上是一個加權矩陣,一般我們用3X3尺寸的卷積核,每個值是“權重”

卷積核的操作——卷積:

1.卷積核從圖像的左上角開始,逐步滑動(按步長stride)遍歷整個圖像。

2.每次滑動,卷積核和圖像的某個區域(稱為感受野)進行逐元素相乘并求和,結果成為輸出圖像的新像素值。

3.將每次計算的結果拼接起來,得到新的矩陣,稱為特征圖或輸出圖。

在圖像處理中,卷積就是用一個小矩陣(卷積核)在圖像上滑動,對局部區域進行加權求和,提取特征。

卷積本身是一種線性操作

隨著特征信息的提取程度,會損失空間信息(6X6的原始圖片經過卷積之后會稱提取為4X4的特征圖片)

Padding(填充)

我們會損失邊緣信息,我們就引入了padding方法:

如果padding=1,我們就在原始圖像上填充一圈0

這樣能保持輸出圖尺寸與輸入圖相同(如果 stride=1)

二、步驟

第一步:先對原始圖像padding,再卷積——提取特征圖片

  • 對輸入圖像先進行 padding(通常填充 0);
  • 然后用卷積核滑動提取特征圖。

第二步:最大池化(Max Pooling)——提取精華特征

目的:將圖片數據進一步壓縮,僅反應特征圖中最突出的特點

步驟:將6*6的特征圖用2*2的網格分割,放入池化后的3*3網絡中,保留最精華的特征

第三步:扁平化處理

將上面兩個卷積核得到池化后的特征圖像素疊加,形成一維的數據條

本質是將二維張量展平,使其能夠輸入到全連接層中。

第四步:輸入全連接層中

概念:每個神經元與前一層的所有神經元連接;

本質:線性變換 + 激活函數:

output=Activation(Wx+b)

  • W 是特征權重矩陣;
  • x 是輸入的特征向量;
  • b 是偏差項。

偏差項 b 的引入可以增加模型的靈活性,使得神經元在所有輸入為零的情況下仍能有非零的輸出,從而幫助模型更好地擬合數據。它相當于在激活函數前添加一個“偏移量”,確保模型能夠更精準地捕捉數據的非線性規律。

通過全連接層進行邏輯推理與特征整合。

在全連接層的輸出函數常見的是ReLU

  • 概率大于0,就取本身
  • 概率小于0,就是0

這樣可以使每層網絡更有針對性的學習某個特征,使學習效率提高

第五步:輸出

最后一層是輸出層,輸出分類結果

輸出層的激活函數:

  • Sigmoid:二分類,把一個值壓縮到0-1,0就是不是,1就是是
  • softmax:多分類,所有類別的概率加起來是1

三、激活函數為什么叫激活?

“激活函數”中的“激活”這個詞,其實是借用了神經生物學中的概念

在生物神經網絡中,神經元接收到足夠強的刺激后才會被“激活”,進而傳遞信號。這種“激活”就像是觸發機制,不是任意輸入都會有輸出,只有當輸入超過某個閾值,神經元才會興奮、發出脈沖。

類比到人工神經網絡中:

  • 神經元計算的結果需要通過某種“觸發機制”才能決定是否輸出,以及輸出多少;
  • 這個“觸發機制”就是激活函數(Activation Function),它決定神經元是否被“激活”并輸出信號。

所以叫“激活函數”,就是表示:

它控制著神經元是否被激活、輸出信號,就像大腦中的神經元一樣。

比如:

  • ReLU(x) = max(0, x) 表示:只有輸入大于 0 時才被激活,才會有輸出;
  • Sigmoid(x) 表示:輸入越大,激活越強,輸出越接近 1。

簡而言之:
“激活函數”= 模擬神經元被激活的過程,決定是否傳遞信號。

四、卷積層VS全連接層

1.作用不同

卷積層

全連接層

負責提取圖像的局部特征(如邊緣、角點、紋理等)

負責進行分類/推理,整合前面提取的特征,得出最終判斷

注重空間結構和位置關系

注重抽象特征和邏輯關系,最終輸出預測結果


2.連接方式不同

卷積層

全連接層

每個神經元只連接輸入圖像的局部區域(感受野)

每個神經元與上一層的所有神經元相連

局部連接 + 參數共享(卷積核共享)

全連接,不共享參數


3.參數量不同

卷積層

全連接層

參數量較少(卷積核小,參數共享)

參數量很大(連接數 = 輸入數 × 輸出數)

適合處理高維圖像數據

多用于最后幾層,輸入是扁平化后的特征向量


4.輸入格式不同

卷積層

全連接層

輸入是二維(或三維)圖像張量

輸入是一維向量(需經過 Flatten)

保留空間結構(寬×高×通道)

不保留空間結構,只關心整體特征表達


5.舉個例子

  • 卷積層就像用放大鏡觀察圖像的某一小塊,并提取它的紋理;
  • 全連接層就像把所有小塊信息組合起來,做一個最終判斷,比如“這是一只貓”。

6.總結一句話:

卷積層關注的是“哪里有什么特征”,而全連接層關注的是“這些特征說明這是什么”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/75835.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/75835.shtml
英文地址,請注明出處:http://en.pswp.cn/web/75835.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Axios 的 POST 請求:QS 處理數據的奧秘與使用場景解析

在現代前端開發中,Axios 已經成為了進行 HTTP 請求的首選庫之一,它的簡潔易用和強大功能深受開發者喜愛。當使用 Axios 進行 POST 請求時,我們常常會遇到一個問題:是否需要使用 QS 庫來處理請求數據?什么時候又可以不用…

java面試題帶答案2025最新整理

文章目錄 一、java面試題集合框架1. 請簡要介紹 Java 集合框架的體系結構2. ArrayList 和 LinkedList 的區別是什么3. HashMap 的工作原理是什么,它在 JDK 7 和 JDK 8 中有哪些不同4. 如何解決 HashMap 的線程安全問題5. TreeSet 是如何保證元素有序的 二、java面試…

4.B-樹

一、常見的查找方式 順序查找 O(N) 二分查找 O(logN)(要求有序和隨機訪問) 二叉搜索樹 O(N) 平衡二叉搜索樹(AVL樹和紅黑樹) O(logN) 哈希 O(1) 考慮效率和要求而言,正常選用 平衡二叉搜索樹 和 哈希 作為查找方式。 但這兩種結構適合用于…

CTF--shell

一、原題 (1)提示: $poc"a#s#s#e#r#t";$poc_1explode("#",$poc);$poc_2$poc_1[0].$poc_1[1].$poc_1[2].$poc_1[3].$poc_1[4].$poc_1[5]; $poc_2($_GET[s]) (2)原網頁:一片空白什么都…

基于51單片機的正負5V數字電壓表( proteus仿真+程序+設計報告+講解視頻)

基于51單片機的正負5V數字電壓表( proteus仿真程序設計報告講解視頻) 仿真圖proteus7.8及以上 程序編譯器:keil 4/keil 5 編程語言:C語言 設計編號:S0101 1. 主要功能: 設計一個基于51單片機數字電壓表 1、能夠…

hive數倉要點總結

1.OLTP和OLAP區別 OLTP(On-Line Transaction Processing)即聯機事務處理,也稱為面向交易的處理過程,其基本特征是前臺接收的用戶數據可以立即傳送到計算中心進行處理,并在很短的時間內給出處理結果,是對用…

【實戰手冊】8000w數據遷移實踐:MySQL到MongoDB的完整解決方案

?? 本文將帶你深入解析大規模數據遷移的實踐方案,從架構設計到代碼實現,手把手教你解決數據遷移過程中的各種挑戰。 ??博主其他匠心之作,強推專欄: 小游戲開發【博主強推 匠心之作 拿來即用無門檻】文章目錄 一、場景引入1. 問題背景2. 場景分析為什么需要消息隊列?為…

運行小程序需要選擇什么配置的服務器

主要是看有多少人瀏覽,如果是每天有幾十個人瀏覽,通常2核或者4核就可以滿足需求,內存的話建議4g或者8g,足夠的內存可以使服務器同時處理多個請求,避免因內存不足導致的卡頓或程序崩潰。 硬盤存儲方面,50GB…

基于SpringBoo的地方美食分享網站

作者:計算機學姐 開發技術:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源碼”。 專欄推薦:前后端分離項目源碼、SpringBoot項目源碼、Vue項目源碼、SSM項目源碼、微信小程序源碼 精品專欄:…

Solidity私有函數和私有變量區別,私有變量可以被訪問嗎

web3面試題 私有函數和私有變量區別,私有變量可以被訪問嗎 ChatGPT said: 在 Web3 開發,尤其是使用 Solidity 編寫智能合約時,關于私有函數和私有變量的區別是常見的面試題。下面是詳細解析: ? 私有函數(Private Fu…

mongodb 安裝配置

1.下載 官網下載地址:MongoDB Community Download | MongoDB 2.使用解壓包 解壓包安裝:https://pan.baidu.com/s/1Er56twK9UfxoExuCPlJjhg 提取碼: 26aj 3.配置環境: (1)mongodb安裝包位置: &#xf…

多模態大語言模型arxiv論文略讀(十九)

MLLMs-Augmented Visual-Language Representation Learning ?? 論文標題:MLLMs-Augmented Visual-Language Representation Learning ?? 論文作者:Yanqing Liu, Kai Wang, Wenqi Shao, Ping Luo, Yu Qiao, Mike Zheng Shou, Kaipeng Zhang, Yang Yo…

[LeetCode 45] 跳躍游戲2 (Ⅱ)

題面: LeetCode 45 跳躍游戲2 數據范圍: 1 ≤ n u m s . l e n g t h ≤ 1 0 4 1 \le nums.length \le 10^4 1≤nums.length≤104 0 ≤ n u m s [ i ] ≤ 1000 0 \le nums[i] \le 1000 0≤nums[i]≤1000 題目保證可以到達 n u m s [ n ? 1 ] nums[…

前端面試寶典---閉包

閉包介紹 使用閉包: 在函數內聲明一個變量,避免外部訪問在該函數內再聲明一個函數訪問上述變量(閉包)返回函數內部的函數使用完畢建議閉包函數null;譯放內存 function createCounter() {let count 0;return function () {coun…

GPT4O畫圖玩法案例,不降智,非dalle

網址如下: 玩法1:吉卜力(最火爆) 提示詞:請將附件圖片轉化為「吉卜力」風格,尺寸不變 玩法2:真人繪制 提示詞:創作一張圖片,比例4:3,一個20歲的中國女孩…

4.12~4.14【Q】cv homework6

我正在寫GAMES101作業6,在這段代碼中,我十分想知道inline Intersection Triangle::getIntersection(Ray ray) 是由哪個函數,哪段代碼調用的?什么是Inline?詳細解釋,越細節越好 我正在寫GAMES101作業6&…

MATLAB雙目標定

前言: 現在有許多雙目攝像頭在出廠時以及標定好,用戶拿到手后可以直接使用,但也有些雙目攝像頭在出廠時并沒有標定。因而這個時候就需要自己進行標定。本文主要介紹基于matlab工具箱的自動標定方式來對雙目相機進行標定。 1、MATLAB工具箱標…

visual studio 常用的快捷鍵(已經熟悉的就不記錄了)

以下是 Visual Studio 中最常用的快捷鍵分類整理,涵蓋代碼編輯、調試、導航等核心場景: 一、生成與編譯 ?生成解決方案 Ctrl Shift B 一鍵編譯整個解決方案,檢查編譯錯誤(最核心的生成操作)?編譯當前文件 Ctrl F…

Sass @import rules are deprecated and will be removed in Dart Sass 3.0.0.

今天寫項目的時候碰到一個報錯,在網上查找到了解決方法,這里備份一下。防止下次再次遇到 原文章鏈接:Sass import rules are deprecated and will be removed in Dart Sass 3.0.0. 報錯內容如下: Deprecation Warning: Sass i…

【QT】QWidget 概述與核心屬性(API)

🌈 個人主頁:Zfox_ 🔥 系列專欄:Qt 目錄 一:🔥 控件概述 🦋 控件體系的發展階段 二:🔥 QWidget 核心屬性 🦋 核心屬性概覽🦋 用件可用&#xff08…