各維度卷積神經網絡內容收錄

各維度卷積神經網絡內容收錄

卷積神經網絡(CNN),通常是指用于圖像分類的2D CNN。但是,現實世界中還使用了其他兩種類型的卷積神經網絡,即1D CNN和3D CNN。

  • 在1D CNN中,內核沿1個方向移動。1D CNN的輸入和輸出數據是2維的。主要用于NLP領域,時間序列數據。

image-20240531133156799

  • 在2D CNN中,內核沿2個方向移動。2D CNN的輸入和輸出數據是3維的。主要用于CV領域,圖像數據(在視頻的處理中,是對每一幀圖像分別利用CNN來進行識別,沒有考慮時間維度的信息)。

  • 在3D CNN中,內核在3個方向上移動。3D CNN的輸入和輸出數據是4維的。通常用于3D 圖像數據(MRI,CT掃描)。

    氣象數據,譬如溫度(time,level,lat,lon),既具有時間維又有空間維,那用1D還是2D呢,有的神經網絡使用1D CNN,有的2D CNN

    因為是時間序列,RNN序列結構的網絡更適合,用1D CNN還是2D CNN, 關鍵在于:通過數據預處理,將數據處理成適合于1D CNN還是2D

    CNN。此外,氣象數據,其有多個時間序列的子特征,因此建議用2D CNN 。

    卷積中:

    維度是指特征矩陣的channel數,例如7x7x256,其深度是256

    通過一個1x1,卷積核個數為64的Conv層,其高和寬保持不變,channel變為64

    所以,降維和升維指的是特征矩陣channel數的降低和增加

    池化中:

    降維是指特征圖尺寸的減小,如4x4減小為2x2

    image-20240625155622089

    維度包含多種含義,例如在卷積層中,每一層都可以識別一些信息,越往后的信息就叫高維信息

一維CNN | Conv1D

Conv1D廣泛應用于感官數據,加速度計 數據就是其中之一。即在Conv1D中,內核沿一維滑動。考慮哪種類型的數據僅需要內核在一個維度上滑動并具有空間特性?時間序列數據,讓我們看以下數據。

image-20240530222115760

來自 加速度計 的序列數據

該數據是從人戴在手臂上的 加速度計 中收集的,數據表示XYZ三個軸的加速度。一維CNN可以根據 加速度計 數據執行活動識別任務,例如人的身姿,行走,跳躍等。

此數據有2個維度:第一維是時間步長,第二維是XYZ軸上的加速度值。

下圖說明了內核如何在 加速度計 數據上移動,每行代表某個軸的時間序列加速度,內核只能沿時間軸一維移動。

image-20240530222752400

內核在 加速度計 上滑動

# Keras中的Conv1D層
import kerasfrom keras.layers import Conv1Dmodel = keras.models.Sequential()model.add(Conv1D(1, kernel_size=5, input_shape = (120, 3)))model.summary()

參數input_shape(120,3)表示120個時間步,每個時間步中有3個數據點。這3個數據點是XYZ軸的加速度,參數kernel_size為5,表示內核的寬

度,內核的高度將與每個時間步中的數據點數相同。同樣,一維CNN也可用于音頻和文本數據因為我們還可以將聲音和文本表示為時間序列數據。

請參考下面的圖片,文本數據作為時間序列

image-20240530223146803

二維CNN | Conv2D

在Lenet-5架構中首次引入的標準卷積神經網絡,其Conv2D通常用于圖像數據,之所以稱其為2維CNN,是因為內核在數據上沿2維滑動

image-20240530221022742

內核在圖像上滑動

使用CNN的整體優勢在于,它可以使用其內核從數據中提取空間特征,而其他網絡則無法做到。

例如:CNN可以檢測圖像中的邊緣,顏色分布等,這使得CNN網絡在圖像分類和包含空間屬性的其他類似數據中非常強大

# 以下是在keras中添加Conv2D圖層的代碼。import kerasfrom keras.layers import Conv2Dmodel = keras.models.Sequential()model.add(Conv2D(1, kernel_size=(3,3), input_shape = (128, 128, 3)))model.summary()

參數input_shape(128、128、3)表示圖像的(高度,寬度,深度)。參數kernel_size(3,3)表示內核的(高度,寬度),并且內核深度將與圖像的深度相同。

三維CNN | Conv3D

在Conv3D中,內核按3個維度滑動,讓我們再考慮一下哪種數據類型需要內核在3維上移動?Conv3D主要用于3D圖像數據,例如磁共振成像(MRI)數據,MRI數據被廣泛用于檢查大腦,脊髓,內部器官等。甲計算機斷層掃描(CT)掃描也是三維數據,這是通過組合從身體周圍的不同角度拍攝的一系列X射線圖像創建的一個例子,我們可以使用Conv3D對該醫學數據進行分類或從中提取特征。

image-20240530223438137

內核在3D數據上滑動

# 以下是在keras中添加Conv3D層的代碼。
import kerasfrom keras.layers import Conv3Dmodel = keras.models.Sequential()model.add(Conv3D(1, kernel_size=(3,3,3), input_shape = (128, 128, 128, 3)))model.summary()

這里參數Input_shape(128,128,128,3)有4個維度,3D圖像是4維數據,其中第四維代表顏色通道的數量,就像平面2D圖像具有3維一樣,其中3維代表色彩通道。參數kernel_size(3,3,3)表示內核的(高度,寬度,深度),并且內核的第4維與顏色通道相同。

了解更多知識請戳下:

@Author:懶羊羊

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/38331.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/38331.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/38331.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

高通Android 12 /13根據包名授權懸浮窗權限

代碼路徑frameworks/base/service/core/com/android/server/policy/PhoneWindowManager.java 1、 PhoneWindowManager.java中關于根據包名實現懸浮窗權限授權的功能實現 在實現根據包名授予懸浮窗權限的核心的功能開發中,在通過上述的功能原理實現的過程中分析得知…

EigenLayer 生態解析-再質押與 AVS 崛起

基于以太坊網絡的再質押協議 EigenLayer 提出了利用為以太坊網絡驗證而質押的 ETH 來與其他協議共享安全性和資本效率,同時為協議參與者提供額外利息。在 AVS、再質押、積分系統等概念的推動下,逐漸形成一個龐大的生態系統,從 2024 年初到現在 EigenLayer 的 TVL 增加了 12 …

5.Spring IOC 循環依賴問題源碼深度剖析

Spring IOC 容器解決循環依賴問題主要涉及到幾個關鍵的緩存和對象創建過程中的處理邏輯。以下是對循環依賴問題進行深度剖析的概述: 循環依賴的背景 循環依賴發生在兩個或多個Bean相互依賴對方,形成一個閉環。這可能是直接的,比如Bean A依賴B…

全球最大智能立體書庫|北京:3萬貨位,715萬冊,自動出庫、分揀、搬運

導語 大家好,我是社長,老K。專注分享智能制造和智能倉儲物流等內容。 新書《智能物流系統構成與技術實踐》 北京城市圖書館的立體書庫采用了先進的WMS(倉庫管理系統)和WCS(倉庫控制系統),與圖書…

Linux磁盤監控思路分析

磁盤監控原理 設備又名I/O設備,泛指計算機系統中除主機以外的所有外部設備。 1.1 計算機分類 1.1.1 按照信息傳輸速度分: 1.低速設備:每秒傳輸信息僅幾個字節或者百個字節,如:鍵盤、鼠標等 2.中速設備&#xff1a…

leetCode.98. 驗證二叉搜索樹

leetCode.98. 驗證二叉搜索樹 題目描述 代碼 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0), left(nullptr), right(nullptr) {}* TreeNode(int x) : val(x), left(n…

100張linux C/C++工程師面試高質量圖

文章目錄 雜項BIOSlinux開機啟動流程內核啟動流程網絡編程網絡編程流程tcp狀態機三次握手四次斷開reactor模型proactor模型select原理poll原理epoll原理文件系統虛擬文件系統文件系統調用阻塞IO非阻塞IO異步IO同步阻塞同步非阻塞IO多路復用進程管理進程狀態程序加載內存管理MMU…

力扣(2024.06.30)

1. 81——搜索旋轉排序數組2 已知存在一個按非降序排列的整數數組 nums &#xff0c;數組中的值不必互不相同。 在傳遞給函數之前&#xff0c;nums 在預先未知的某個下標 k&#xff08;0 < k < nums.length&#xff09;上進行了旋轉&#xff0c;使數組變為 [nums[k], n…

vue響應式原理細節分享

在講解之前&#xff0c;我們先了解一下數據響應式是什么&#xff1f;所謂數據響應式就是建立響應式數據與依賴&#xff08;調用了響應式數據的操作&#xff09;之間的關系&#xff0c;當響應式數據發生變化時&#xff0c;可以通知那些使用了這些響應式數據的依賴操作進行相關更…

前端:多服務端接口資源整合與zip打包下載

項目需求 前端項目開發中,有一個頁面需要去整合多個服務接口返回的數據資源,并且需要將這多個服務接口接口返回的數據進行資源壓縮,最終打包成zip壓縮包,并在客戶端完成下載。 基本需求梳理如下, 實現思路 這個需求點其實本質上還是傳統的“文件下載”功能需求,常見的例如…

Python使用defaultdict簡化值為list的字典

原始代碼&#xff1a; from typing import Dictrelated_objects_for_fetch: Dict[str, list] {}for key, value in [(k1, v1), (k1, v2), (k2, v2), (k3, v3), (k2, v2)]:if key not in related_objects_for_fetch:related_objects_for_fetch[key] []if value not in (value…

貪心問題(POJ1700/1017/1065)(C++)

一、貪心問題 貪心算法 貪心算法&#xff08;greedy algorithm&#xff09;&#xff0c;是用計算機來模擬一個「貪心」的人做出決策的過程。這個人十分貪婪&#xff0c;每一步行動總是按某種指標選取最優的操作。而且他目光短淺&#xff0c;總是只看眼前&#xff0c;并不考慮…

第三天:LINK3D核心原理講解【第1部分】

第三天:LINK3D核心原理講解 LINK3D學習筆記 目標 了解LINK3D velodyne64線激光雷達LINK3D質心點提取效果: 分布在車道與墻體的交界處。 課程內容 LINK3D論文精講LINK3D聚合關鍵點提取代碼講解LINK3D描述子匹配代碼講解除了ALOAM的線特征、面特征,還有其他點云特征嗎,是…

如何使用 Postgres 折疊您的堆棧 實現一切#postgresql認證

技術蔓延如何蔓延 假設您正在開發一款新產品或新功能。一開始&#xff0c;您的團隊會列出需要解決的技術問題。有些解決方案您將自行開發&#xff08;您的秘訣&#xff09;&#xff0c;而其他解決方案您將使用現有技術&#xff08;可能至少包括一個數據庫&#xff09;來解決。…

人工智能期末復習筆記(更新中)

分類問題 分類&#xff1a;根據已知樣本的某些特征&#xff0c;判斷一個新的樣本屬于哪種已知的樣本類 垃圾分類、圖像分類 怎么解決分類問題 分類和回歸的區別 1. 邏輯回歸分類 用于解決分類問題的一種模型。根據數據特征或屬性&#xff0c;計算其歸屬于某一類別 的概率P,…

ComfyUI局部重繪的四種方式 (附件工作流在最后)

前言 局部重繪需要在圖片中選擇重繪區域&#xff0c;點擊圖片右擊選擇Open in MaskEditor&#xff08;在蒙版編輯器中打開&#xff09;&#xff0c;用鼠標描繪出需要重繪的區域 方式一&#xff1a;重繪編碼器 這種方式重繪比較生硬&#xff0c;需要額外搭配使用才行 方式二&…

el-upload 上傳圖片及回顯照片和預覽圖片,文件流和http線上鏈接格式操作

<div v-for"(info, index) in zsjzqwhxqList.helicopterTourInfoList" :key"info.id" >編輯上傳圖片// oss返回線上地址http鏈接格式&#xff1a;<el-form-itemlabel"巡視結果照片":label-width"formLabelWidth"><el…

Cyber Weekly #13

賽博新聞 1、谷歌發布最強開源小模型Gemma-2 本周五&#xff08;6月28日&#xff09;凌晨&#xff0c;谷歌發布最強開源小模型Gemma-2&#xff0c;分別為9B&#xff08;90億&#xff09;和27B&#xff08;270億&#xff09;參數規模&#xff0c;其中9B 模型在多項基準測試中均…

潁川韓氏,來自戰國七雄韓國的豪族

潁川是戰國七雄韓國故土&#xff0c;韓國被秦國滅國后&#xff0c;王公貴族們除了堅決反秦的被殺了外&#xff0c;大部分都留存了下來。這些人在楚、漢反秦戰爭中&#xff0c;成為反秦統一戰線的重要力量&#xff0c;其中兩人先后被封為重新恢復的韓國的國王。 一個是橫陽君韓…

Windows系統下,將nginx注冊為本地服【親測可用】

在Windows系統下&#xff0c;將nginx注冊為本地服務并設置為開機自動運行&#xff0c;可以通過以下步驟進行&#xff1a; 下載Windows Service Wrapper&#xff1a; 訪問 WinSW 項目頁面&#xff0c;下載適用于Windows的版本。 準備nginx&#xff1a; 確保你已經下載并解壓了n…