機器學習8-卷積和卷積核1

機器學習8-卷積和卷積核1

  • 卷積與圖像去噪
    • 卷積的定義與性質
      • 定義
      • 性質
      • 卷積的原理
      • 卷積步驟
      • 卷積的示例與應用
      • 卷積的優缺點
        • 優點
        • 缺點
      • 總結
  • 高斯卷積核
      • 卷積核尺寸的設置
        • 依據任務類型
        • 考慮數據特性
        • 實驗與調優
      • 高斯函數標準差的設置
        • 依據平滑需求
        • 結合卷積核尺寸
        • 實際應用場景
      • 總結
  • 圖像噪聲與中值濾波器
    • 高斯噪聲
      • 定義
      • 概率分布
      • 產生原因
      • 對圖像和信號的影響
      • 去除方法
    • 中值濾波

在這里插入圖片描述

卷積與圖像去噪

在這里插入圖片描述

卷積的定義與性質

定義

卷積是數學中的一種運算,廣泛應用于信號處理、圖像處理和機器學習等領域。在機器學習中,卷積通常指卷積神經網絡(CNN)中的卷積操作。

卷積操作可以表示為:
[ ( f ? g ) ( t ) = ∫ ? ∞ ∞ f ( τ ) g ( t ? τ ) d τ (f * g)(t) = \int_{-\infty}^{\infty} f(\tau) g(t - \tau) \, d\tau (f?g)(t)=??f(τ)g(t?τ)dτ]
在離散情況下,卷積操作可以表示為:
[ ( f ? g ) [ n ] = ∑ m = ? ∞ ∞ f [ m ] g [ n ? m ] (f * g)[n] = \sum_{m=-\infty}^{\infty} f[m] g[n - m] (f?g)[n]=m=??f[m]g[n?m]]

在CNN中,卷積操作通常是在二維圖像上進行的,卷積核(或濾波器)在輸入圖像上滑動,計算局部區域的加權和。

性質

  1. 線性性:卷積是線性操作,滿足疊加原理。
  2. 平移不變性:卷積操作對輸入信號的平移是不變的。
  3. 交換性:卷積操作滿足交換律,即 ( f ? g = g ? f f * g = g * f f?g=g?f)。
  4. 結合性:卷積操作滿足結合律,即 ( ( f ? g ) ? h = f ? ( g ? h ) (f * g) * h = f * (g * h) (f?g)?h=f?(g?h))。

卷積的原理

在CNN中,卷積操作通過卷積核(filter)在輸入數據(如圖像)上滑動,計算局部區域的加權和。卷積核的參數通過訓練過程學習得到。

卷積步驟

  1. 輸入數據:通常是二維圖像或多通道圖像。

  2. 卷積核:一個小的矩陣,包含可學習的參數。
    邊界填充
    在這里插入圖片描述
    不考慮邊界圖像會變小,如果不想變小只能填充像素。
    在這里插入圖片描述

拉伸 -鏡像
在這里插入圖片描述
0填充
在這里插入圖片描述

  1. 滑動窗口:卷積核在輸入數據上滑動,計算每個位置的加權和。

  2. 輸出特征圖:卷積操作的結果是一個新的特征圖,反映了輸入數據中某些特征的響應。

卷積的示例與應用

在這里插入圖片描述

在這里插入圖片描述
平滑
在這里插入圖片描述

銳化
在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

卷積在機器學習和深度學習中有廣泛的應用,特別是在圖像處理和計算機視覺領域。

  1. 圖像分類:CNN通過卷積層提取圖像的特征,用于分類任務。
  2. 目標檢測:卷積操作用于檢測圖像中的目標物體。
  3. 圖像分割:卷積操作用于將圖像分割成不同的區域。
  4. 自然語言處理:卷積操作也可以應用于文本數據,提取局部特征。

卷積的優缺點

優點
  1. 局部感知:卷積操作只關注局部區域,減少了參數數量,降低了計算復雜度。
  2. 參數共享:卷積核在輸入數據上共享參數,進一步減少了參數數量。
  3. 平移不變性:卷積操作對輸入數據的平移是不變的,適合處理圖像等數據。
  4. 層次化特征提取:通過多層卷積操作,可以提取從低級到高級的特征。
缺點
  1. 計算復雜度:雖然卷積操作減少了參數數量,但在大規模數據上仍然需要大量計算資源。
  2. 局部性限制:卷積操作只關注局部區域,可能忽略全局信息。
  3. 超參數選擇:卷積核的大小、步長、填充等超參數需要仔細選擇,影響模型性能。

總結

卷積是機器學習和深度學習中一種重要的操作,特別適用于處理圖像等具有局部結構的數據。通過卷積操作,可以有效地提取數據的特征,降低模型的復雜度,提高模型的性能。然而,卷積操作也存在一些局限性,需要在實際應用中仔細權衡。

高斯卷積核

在這里插入圖片描述
存在振鈴問題

在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述

如何設置卷積核的尺寸和高斯函數的標準差?
方差的變化
在這里插入圖片描述
方差越大,平滑效果明顯

尺寸的變化

在這里插入圖片描述

模板尺寸越大, 平滑效果越強

總結

  • 大方差或者大尺寸卷積核平滑能力強;
  • 小方差或者小尺寸卷積核平滑能力弱;
  • 經驗法則:將卷積核的半窗寬度設置為3σ,最終卷積模板尺寸為2×3σ+1。
    例子:標準差設置成1,卷積模板寬度=231+1=7

在圖像處理和深度學習領域,卷積核尺寸和高斯函數標準差的設置是比較關鍵的操作,以下分別介紹它們的設置方法:

卷積核尺寸的設置

依據任務類型
  • 邊緣檢測:通常會使用較小的卷積核,如 3x3 或 5x5。以 Sobel 算子為例,它使用 3x3 的卷積核來檢測圖像中的邊緣信息。小尺寸的卷積核能夠聚焦于局部像素的變化,從而更敏銳地捕捉邊緣特征。
  • 特征提取:對于淺層網絡,可能會使用較小的卷積核(如 3x3)來提取圖像的基本特征,如紋理、顏色等;而在深層網絡中,有時會使用較大的卷積核(如 7x7)來獲取更全局的特征信息。例如,在 AlexNet 中,第一層卷積層使用了 11x11 的大卷積核來捕捉圖像的宏觀特征。
  • 圖像分割:卷積核的尺寸選擇會根據具體的分割任務和數據集特點而定。一般來說,較小的卷積核可以用于細化分割邊界,而較大的卷積核可以用于融合不同區域的信息。
考慮數據特性
  • 圖像分辨率:對于高分辨率的圖像,可以適當使用較大的卷積核來減少計算量,同時避免丟失過多的細節信息;而對于低分辨率的圖像,使用較小的卷積核可以更好地保留圖像的細節。
  • 數據集大小:如果數據集較小,使用較小的卷積核可以減少模型的參數數量,降低過擬合的風險;如果數據集較大,可以嘗試使用較大的卷積核來增加模型的表達能力。
實驗與調優

通過多次實驗,嘗試不同的卷積核尺寸,并使用驗證集評估模型的性能,選擇性能最優的卷積核尺寸。可以采用網格搜索、隨機搜索等方法來系統地探索不同的卷積核尺寸組合。

高斯函數標準差的設置

依據平滑需求
  • 輕微平滑:當只需要對圖像進行輕微的平滑處理,去除一些高頻噪聲時,可以選擇較小的標準差,如 0.5 - 1.0。較小的標準差會使高斯函數的分布更集中,卷積操作主要影響相鄰的少數像素,對圖像的整體結構影響較小。
  • 顯著平滑:如果需要對圖像進行更強烈的平滑處理,去除較大的噪聲或模糊圖像細節,可以選擇較大的標準差,如 3.0 - 5.0 甚至更大。較大的標準差會使高斯函數的分布更廣泛,卷積操作會影響更多的像素,從而達到更顯著的平滑效果。
結合卷積核尺寸

高斯卷積核的尺寸和標準差通常是相互關聯的。一般來說,卷積核的尺寸應該足夠大,以覆蓋高斯函數的主要部分。通常可以根據標準差來確定合適的卷積核尺寸,例如,當標準差為 σ 時,卷積核的尺寸可以選擇為 (6σ + 1) x (6σ + 1) ,以確保高斯函數的大部分能量都被包含在卷積核內。

實際應用場景
  • 圖像預處理:在圖像預處理階段,如去噪、圖像增強等,標準差的選擇要根據圖像的噪聲水平和具體的處理目標來確定。例如,對于包含椒鹽噪聲的圖像,可以先使用較大的標準差進行平滑處理,然后再進行其他處理。
  • 特征提取:在提取圖像特征時,標準差的選擇會影響特征的提取效果。較小的標準差可以提取更精細的特征,而較大的標準差可以提取更宏觀的特征。例如,在人臉檢測中,可以使用不同標準差的高斯濾波器來提取不同尺度的人臉特征。

同樣,也可以通過實驗的方法,嘗試不同的標準差取值,并根據實際應用的評估指標(如準確率、召回率等)來選擇最優的標準差。

總結

去除圖像中的“高頻”成分(低通濾波器)
兩個高斯卷積核卷積后得到的還是高斯卷積核

  • 使用多次小方差卷積核連續卷積,可以得到與大方差卷積核相同的結果
  • 使用標準差為σ的高斯核進行兩次卷積與使用標準差σ√2 的高斯核進行一次卷積相同

可分離

  • 可分解為兩個一維高斯的乘積
    在這里插入圖片描述

1.用尺寸為/m×m的卷積核卷積一個尺寸為n×n的圖像,其計算復雜度是多少?
在這里插入圖片描述
小模板多次卷積比一個大模板一次卷積計算量低很多

圖像噪聲與中值濾波器

在這里插入圖片描述

高斯噪聲

在這里插入圖片描述
高斯噪聲是一種在信號處理、圖像處理、通信等多個領域經常出現的噪聲類型

定義

高斯噪聲是指其概率密度函數服從高斯分布(也稱為正態分布)的噪聲。在實際應用中,許多自然噪聲和測量噪聲都近似服從高斯分布,因此高斯噪聲是一種非常常見且重要的噪聲模型。

概率分布

高斯分布的概率密度函數由均值(μ)和標準差(σ)兩個參數完全確定,其數學表達式為:
[ f ( x ) = 1 σ 2 π e ? ( x ? μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=σ2π ?1?e?2σ2(x?μ)2?]
其中, x x x 是隨機變量的值, μ \mu μ 是分布的均值,它決定了分布的中心位置; σ \sigma σ 是標準差,它決定了分布的寬度,即噪聲的分散程度。當 μ = 0 \mu = 0 μ=0 時,稱為零均值高斯噪聲。

產生原因

  • 電子設備內部的熱噪聲:電子元件中的電子由于熱運動產生的隨機噪聲,這種噪聲在各種電子設備中普遍存在,如放大器、傳感器等。
  • 通信信道中的噪聲:在信號傳輸過程中,信道中的各種干擾因素會引入高斯噪聲,例如無線通信中的大氣噪聲、多徑衰落等。
  • 測量誤差:在數據采集和測量過程中,由于測量設備的精度限制和環境干擾,可能會產生高斯噪聲。

對圖像和信號的影響

  • 對圖像的影響:高斯噪聲會使圖像變得模糊、粗糙,降低圖像的清晰度和質量。在圖像中,噪聲表現為隨機分布的灰度值變化,使得圖像的細節信息被掩蓋,影響圖像的視覺效果和后續的處理(如邊緣檢測、特征提取等)。
  • 對信號的影響:在信號處理中,高斯噪聲會干擾信號的真實值,使信號的幅度和相位發生隨機變化,導致信號失真。這會影響信號的檢測、識別和分析,降低系統的性能和可靠性。

去除方法

在這里插入圖片描述

噪聲的方差越大,卷積和的方差也要越大。但是此時也會帶來副作用,會影響圖像本身的顯示。

  • 線性濾波:如均值濾波和高斯濾波。均值濾波是將每個像素的鄰域內像素值取平均值作為該像素的新值,它可以在一定程度上平滑噪聲,但會使圖像邊緣模糊。高斯濾波則是根據高斯函數對鄰域像素進行加權平均,它在平滑噪聲的同時能較好地保留圖像的邊緣信息。
  • 非線性濾波:如中值濾波。中值濾波是將鄰域內像素值的中值作為該像素的新值,它對脈沖噪聲和椒鹽噪聲有較好的抑制效果,同時也能在一定程度上去除高斯噪聲,并且對圖像邊緣的保護能力較強。
  • 基于變換域的方法:如小波變換。小波變換可以將圖像或信號分解到不同的尺度和頻率子帶中,通過對不同子帶的系數進行處理,去除噪聲分量,然后再進行重構得到去噪后的圖像或信號。
  • 深度學習方法:近年來,深度學習在圖像去噪領域取得了顯著的成果。通過訓練深度神經網絡(如卷積神經網絡),可以學習到高斯噪聲的特征和圖像的先驗信息,從而實現高效的圖像去噪。

中值濾波

對于椒鹽噪聲和脈沖噪聲使用高斯卷積核去噪是很難去掉的。
在這里插入圖片描述
中值濾波的原理示意圖。
在這里插入圖片描述

控制濾波的效果在這里插入圖片描述
認識了三種類型的噪聲,椒鹽噪聲、脈沖噪聲及高斯噪聲對于前兩者建議使用中值濾波器對于高斯噪聲可以使用高斯卷積核來進行去噪。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895002.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895002.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895002.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SVN 提交與原有文件類型不一樣的文件時的操作

SVN 提交與原有文件類型不一樣的文件時的操作 背景 SVN 服務器上原本的文件是軟鏈接類型的,但是我將它改成普通文件再上傳。出現了以下提示: 解決過程 本來想著通過 svn rm 和 svn add 來解決,但是行不通。 最終解決方案 svn rm --keep-…

阿里云專有云網絡架構學習

阿里云專有云網絡架構 葉脊(spine-leaf)網絡和傳統三層網絡拓撲對比 阿里云網絡架構V3拓撲角色介紹推薦設備設備組網舉例帶外管理網絡帶外網和帶內網對比設備介紹 安全網絡設備介紹 參考 后續更新流量分析葉脊(spine-leaf)網絡和傳…

Deepseek本地部署指南:在linux服務器部署,在mac遠程web-ui訪問

1. 在Linux服務器上部署DeepSeek模型 要在 Linux 上通過 Ollama 安裝和使用模型,您可以按照以下步驟進行操作: 步驟 1:安裝 Ollama 安裝 Ollama: 使用以下命令安裝 Ollama: curl -sSfL https://ollama.com/download.…

3D數字化營銷:重塑家居電商新生態

隨著電商的蓬勃發展,網上訂購家具已成為眾多消費者的首選。然而,線上選購家具的諸多挑戰,如風格不匹配、尺寸不合適、定制效果不如預期以及退換貨不便等,一直困擾著消費者。為解決這些問題,家居行業急需一種全新的展示…

重塑“景區+商業”模式,打造特色文旅新體驗

重塑“景區商業”模式,打造特色文旅新體驗 近年來,旅游業蓬勃發展,旅游熱潮不斷升溫,游客消費觀念也隨之升級。為順應這一趨勢,各大景區紛紛探索打造特色文旅項目,以期吸引更多游客。然而,“景…

在亞馬遜云科技上云原生部署DeepSeek-R1模型(下)

在本系列的上篇中,我們介紹了如何通過Amazon Bedrock部署并測試使用了DeepSeek模型。在接下來的下篇中小李哥將繼續介紹,如何利用亞馬遜的AI模型訓練平臺SageMaker AI中的,Amazon Sagemaker JumpStart通過腳本輕松一鍵式部署DeepSeek預訓練模…

Kubernetes是什么?為什么它是云原生的基石

從“手工時代”到“自動化工廠” 想象一下,你正在經營一家工廠。在傳統模式下,每個工人(服務器)需要手動組裝產品(應用),效率低下且容易出錯。而Kubernetes(k8s)就像一個…

Transformer 詳解:了解 GPT、BERT 和 T5 背后的模型

目錄 什么是 Transformer? Transformer如何工作? Transformer 為何有用? 常見問題解答:機器學習中的 Transformer 在技??術領域,突破通常來自于修復損壞的東西。制造第一架飛機的人研究過鳥類。萊特兄弟觀察了禿鷲如何在氣流中保持平衡,意識到穩定性比動力更重要。…

圖片webp格式動圖圖片

這是一個webp動圖1 這是一個webp動圖2 webp 圖像由gif 轉換 3

Spring(26) spring-security-oauth2 官方表結構解析

目錄 一、什么是 spring-security-oauth2?二、spring-security-oauth2 的表結構2.1 oauth_client_details 客戶端詳細信息表2.2 oauth_access_token 認證授權Token記錄表2.3 oauth_refresh_token 刷新授權Token記錄表2.4 oauth_code 授權Code記錄表 一、什么是 spri…

【R語言】plyr包和dplyr包

一、plyr包 plyr擴展包主要是實現數據處理中的“分割-應用-組合”(split-apply-combine)策略。此策略是指將一個問題分割成更容易操作的部分,再對每一部分進行獨立的操作,最后將各部分的操作結果組合起來。 plyr擴展包中的主要函…

【DeepSeek】DeepSeek小模型蒸餾與本地部署深度解析DeepSeek小模型蒸餾與本地部署深度解析

一、引言與背景 在人工智能領域,大型語言模型(LLM)如DeepSeek以其卓越的自然語言理解和生成能力,推動了眾多應用場景的發展。然而,大型模型的高昂計算和存儲成本,以及潛在的數據隱私風險,限制了…

程序員也可以這樣賺錢

最近有朋友和我交流了關于程序員副業的想法,我想借這個機會對目前軟件開發常用的兼職平臺做一個梳理。 以下是程序員接副業的靠譜平臺推薦,結合政策合規性、平臺口碑及實際操作性整理,覆蓋國內外主流選擇: 一、國內綜合型平臺 程序…

【AI】在Ubuntu中使用docker對DeepSeek的部署與使用

這篇文章前言是我基于部署好的deepseek-r1:8b模型跑出來的 關于部署DeepSeek的前言與介紹 在當今快速發展的技術環境中,有效地利用機器學習工具來解決問題變得越來越重要。今天,我將引入一個名為DeepSeek 的工具,它作為一種強大的搜索引擎&a…

代碼隨想錄算法【Day39】

Day39 198.打家劫舍 class Solution { public:int rob(vector<int>& nums) {if (nums.size() 0) return 0;if (nums.size() 1) return nums[0];vector<int> dp(nums.size());dp[0] nums[0];dp[1] max(nums[0], nums[1]);for (int i 2; i < nums.size…

TCP三次握手全方面詳解

文章目錄 (1) 三次握手各狀態CLOSE狀態SYN_SENT狀態SYN_RECV狀態ESTABLISHED狀態 (2) 為什么握手時的seqnum是隨機值&#xff0c;以及acknum的功能(3) 三次握手中的半連接隊列&#xff08;SYN隊列&#xff09;和全連接隊列&#xff08;ACCEPT隊列&#xff09;半連接隊列全連接隊…

數據結構與算法-遞歸

單路遞歸 二分查找 /*** 主函數&#xff1a;執行二分查找。* * param a 要搜索的數組&#xff08;必須是已排序的&#xff09;* param target 目標值* return 返回目標值在數組中的索引&#xff1b;如果未找到&#xff0c;則返回 -1*/ public static int binarySearch(int[] …

軟中斷和tasklet的區別是什么?

軟中斷和 tasklet 都是 Linux 內核中用于實現異步事件處理的機制&#xff0c;它們的主要區別如下&#xff1a; 實現機制 軟中斷&#xff1a;是一種基于軟件觸發的中斷機制&#xff0c;在內核中是一組靜態定義的、預先分配好的軟中斷向量。每個軟中斷都有一個唯一的編號和對應…

Termux安裝ssh實現電腦ssh

Termux下載 點擊下載 在 Termux 中安裝并使用 SSH&#xff0c;按照以下步驟操作&#xff1a; 1. 更新軟件包列表 pkg update && pkg upgrade2. 安裝 OpenSSH pkg install openssh3. 設置 SSH 密碼&#xff08;必須&#xff0c;否則無法使用 SSH 服務器&#xff09…

深入理解 C++17 std::is_swappable

文章目錄 深入理解 C17 std::is_swappable引言std::is_swappable 概述std::is_swappable 的工作原理std::is_swappable 的變體注意事項結論 深入理解 C17 std::is_swappable 引言 在 C 編程中&#xff0c;交換兩個對象的值是一個常見的操作。為了確保代碼的通用性和安全性&am…