圖像金字塔總結

本文轉載自: http://blog.csdn.net/dcrmg/article/details/52561656? ??

一、 圖像金字塔


圖像金字塔是一種以多分辨率來解釋圖像的結構,通過對原始圖像進行多尺度像素采樣的方式,生成N個不同分辨率的圖像。把具有最高級別分辨率的圖像放在底部,以金字塔形狀排列,往上是一系列像素(尺寸)逐漸降低的圖像,一直到金字塔的頂部只包含一個像素點的圖像,這就構成了傳統意義上的圖像金字塔。





獲得圖像金字塔一般包括二個步驟:

1. 利用低通濾波器平滑圖像?

2. 對平滑圖像進行抽樣(采樣)

有兩種采樣方式——上采樣(分辨率逐級升高)和下采樣(分辨率逐級降低)


上采樣:




下采樣:




二、高斯金字塔


高斯金字塔式在Sift算子中提出來的概念,首先高斯金字塔并不是一個金字塔,而是有很多組(Octave)金字塔構成,并且每組金字塔都包含若干層(Interval)。

高斯金字塔構建過程:

1. 先將原圖像擴大一倍之后作為高斯金字塔的第1組第1層,將第1組第1層圖像經高斯卷積(其實就是高斯平滑或稱高斯濾波)之后作為第1組金字塔的第2層,高斯卷積函數為:



對于參數σ,在Sift算子中取的是固定值1.6。

2. 將σ乘以一個比例系數k,等到一個新的平滑因子σ=k*σ,用它來平滑第1組第2層圖像,結果圖像作為第3層。

3. 如此這般重復,最后得到L層圖像,在同一組中,每一層圖像的尺寸都是一樣的,只是平滑系數不一樣。它們對應的平滑系數分別為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。

4. ?將第1組倒數第三層圖像作比例因子為2的降采樣,得到的圖像作為第2組的第1層,然后對第2組的第1層圖像做平滑因子為σ的高斯平滑,得到第2組的第2層,就像步驟2中一樣,如此得到第2組的L層圖像,同組內它們的尺寸是一樣的,對應的平滑系數分別為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2組是第1組圖像的一半。

這樣反復執行,就可以得到一共O組,每組L層,共計O*L個圖像,這些圖像一起就構成了高斯金字塔,結構如下:




在同一組內,不同層圖像的尺寸是一樣的,后一層圖像的高斯平滑因子σ是前一層圖像平滑因子的k倍;

在不同組內,后一組第一個圖像是前一組倒數第三個圖像的二分之一采樣,圖像大小是前一組的一半;


高斯金字塔圖像效果如下,分別是第1組的4層和第2組的4層:


? ? ? ??



三、 尺度空間



圖像的尺度空間解決的問題是如何對圖像在所有尺度下描述的問題。

在高斯金字塔中一共生成O組L層不同尺度的圖像,這兩個量合起來(O,L)就構成了高斯金字塔的尺度空間,也就是說以高斯金字塔的組O作為二維坐標系的一個坐標,不同層L作為另一個坐標,則給定的一組坐標(O,L)就可以唯一確定高斯金字塔中的一幅圖像。

尺度空間的形象表述:



上圖中尺度空間中k前的系數n表示的是第一組圖像尺寸是當前組圖像尺寸的n倍。



四、 DOG金字塔


差分金字塔,DOG(Difference of Gaussian)金字塔是在高斯金字塔的基礎上構建起來的,其實生成高斯金字塔的目的就是為了構建DOG金字塔。

DOG金字塔的第1組第1層是由高斯金字塔的第1組第2層減第1組第1層得到的。以此類推,逐組逐層生成每一個差分圖像,所有差分圖像構成差分金字塔。概括為DOG金字塔的第o組第l層圖像是有高斯金字塔的第o組第l+1層減第o組第l層得到的。

DOG金字塔的構建可以用下圖描述:




每一組在層數上,DOG金字塔比高斯金字塔少一層。后續Sift特征點的提取都是在DOG金字塔上進行的。

DOG金字塔的顯示效果如下:




這些長得黑乎乎的圖像就是差分金字塔的實際顯示效果,只在第1組第1層差分圖像上模糊可以看到一個輪廓。但其實這里邊包含了大量特征點信息,只是我們人眼已經分辨不出來了。

下邊對這些DOG圖像進行歸一化,可有很明顯的看到差分圖像所蘊含的特征,并且有一些特征是在不同模糊程度、不同尺度下都存在的,這些特征正是Sift所要提取的“穩定”特征:




附帶說一下后面的歸一化,在圖像處理中是很常見的操作,主要原因是亮度不均勻,顯然偏暗。因此我們希望灰度值分布較為均勻些,因此我們可以將當前的像素灰度值縮放到[0,255]即可。具體可參考《MATLAB實現圖像灰度歸一化》


參考資料:
1.?深度學習目標檢測中的圖像金字塔 pyramid

2.?圖像金字塔



本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/258605.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/258605.shtml
英文地址,請注明出處:http://en.pswp.cn/news/258605.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

表單的get和post使用情景

GET和POST兩種方法都是將數據送到服務器,但你該用哪一種呢?HTTP標準包含這兩種方法是為了達到不同的目的。POST用于創建資源,資源的內容會被編入HTTP請示的內容中。例如,處理訂貨表單、在數據庫中加入新數據行等。 當請求無副作用…

什么叫做羅列式_項目起盤的時候,如何確定自己該做什么社群?

這是祁杰『社群日記』第48篇持續日更,做最懂社群的營銷咨詢人很多人手上有資源,準備起盤項目的時候,總會思考一個問題:我能做什么樣的社群?今天我們從用戶需求出發,拆解一下哪些社群是能夠確切地滿足用戶的…

C++ exit 與 return 淺析

【摘要】 本文從代碼形式。經常使用方式,相關概念,調用關系和比較分析,這5個維度淺析 exit 與 return 在C的同樣點與差別。【常見形式】 exit(0): 正常執行程序并退出程序。 exit(1): 非正常執行導致退出程序&…

Feature Pyramid Networks for Object Detection 總結

最近在閱讀FPN for object detection,看了網上的很多資料,有些認識是有問題的,當然有些很有價值。下面我自己總結了一下,以供參考。 1. FPN解決了什么問題? 答: 在以往的faster rcnn進行目標檢測時,無論…

最近工作

最近的工作忙且亂,以至于,我第天早晨早早起來到晚上11點多才能回到家。今天早晨寫代碼的時候腰突然猛疼,疼的我直叫喚。躺在床上半天起不來。 最近每天的工作要計劃一下了,不能客戶說干嘛就干嘛,這樣累壞了自己&#x…

LeetCode OJ - Candy

題目: There are N children standing in a line. Each child is assigned a rating value. You are giving candies to these children subjected to the following requirements: Each child must have at least one candy.Children with a higher rating get mor…

那些 IT 界的神翻譯,原來我學不好編程的原因就在這

近日博主 ruanyf 在網上發布了一條關于套接字“socket”的解釋,引發了網友對于那些 IT 界的神翻譯的討論: 突然想到,socket就是插座。服務器的socket,就是服務器提供插座,等著客戶端的插頭插進來。一旦插入完成&#x…

navicat 結構同步會加鎖嗎_被柜員怠慢的張小波,真的會永久地轉走幾個億的結構性存款嗎?...

4月7日下午,北京鳳凰聯動文化傳媒有限公司總裁張小波發布微博稱,前幾天去安貞附近一銀行,想把借記卡的轉帳額度從每天五百萬上調一下,沒有想到,在其問到“最高可調到多少”時,柜員回答一個億并“鄙夷地看了…

Mask RCNN筆記

mask rcnn簡介 mask rcnn是何凱明基于以往的faster rcnn架構提出的新的卷積網絡,一舉完成了object instance segmentation. 該方法在有效地目標的同時完成了高質量的語義分割。 文章的主要思路就是把原有的Faster-RCNN進行擴展,添加一個分支使用現有的檢…

IOS開發之----常用函數和常數--秀清

介紹一下Objective-c常用的函數,常數變量 算術函數 【算術函數】函數名說明int rand()隨機數生成。(例)srand(time(nil)); //隨機數初期化int val rand()P; //0~49之間的隨機數int abs(int a)整數的絕對值(例&#…

網頁設計中常用的19個Web安全字體

來自http://www.jb51.net 在Web編碼中,CSS默認應用的Web字體是有限的,雖然在新版本的CSS3,我們可以通過新增的font-face屬性來引入特殊的瀏覽器加載字體。但多數情況下,考慮各個因素的影響我們還是在盡量充分利用這些默認調用的字…

python slice是共享內存嗎_python共享內存實現進程通信

1.概述共享內存可以說是最有用的進程間通信方式.兩個不同的進程共享內存的意思是:同一塊物理內存被映射到兩個進程的各自的進程地址空間.一個進程可以及時看到另一個進程對共享內存的更新,反之亦然.采用共享內存通信的一個顯而易見的好處效率高,因為進程可以直接讀寫內存,而不需…

FCN-數據篇

從本篇開始,我們來記錄一下全卷積網絡用來做語義分割的全過程。 代碼:https://github.com/shelhamer/fcn.berkeleyvision.org 下面我們將描述三方面的內容: 1. 官方提供的公開數據集 2. 自己的數據集如何準備,主要是如何標注…

深圳本地網店代運營公司

◆★◆深圳本地網店代運營,淘寶代運營多少錢,微博運營公司,代運營平臺,天貓京東代運營,網站代運營圖 片, 北京京東代運營,網店代運營協議,京東店鋪代運營,網站代運營服務…

搜索專題題解

題目鏈接: codeforces 277A - Learning Languages 題目描述: 一個團體有n個人,每個人都掌握了一些語言,每個人學一門語言有1個花費,兩個人之間可以通過其他人的翻譯,問最少花費多少使得這個團體的任意兩個人…

Facebook 開源的快速文本分類器 FastTex

FastText是Facebook開發的一款快速文本分類器,提供簡單而高效的文本分類和表征學習的方法,性能比肩深度學習而且速度更快。 fastText 原理fastText 方法包含三部分:模型架構、層次 Softmax 和 N-gram 特征。下面我們一一介紹。 1.1 模型架構 …

FCN-加載訓練與測試數據

當我們生成了數據后,我們來看看FCN是如何加載數據的。 FCN 代碼預覽 其中: - data : 訓練測試數據 - ilsvrc-nets:存放預訓練的模型 - 剩下的框:不同數據集的訓練測試prototxt - voc_layers,siftflow_layers等&am…

怎么撤銷定時說說_已注冊商標遇到撤三申請怎么辦

很多企業的商標都遇到過商標撤三的情況,撤三簡單的說就是,注冊商標沒有正當理由連續三年不使用的,任何單位或者個人可以向商標局申請撤銷該注冊商標。所以說,無論您的企業多大,商標持有的再多,也要做好商標…

windows下架設SVN服務器并設置開機啟動

1、安裝SVN服務器,到http://subversion.apache.org/packages.html上下載windows版的SVN,并安裝,在命令行下運行svn命令,如下所以,則svn服務器安裝成功。 C:\Documents and Settings\Administrator>svn 使用“svn …

Spartan-6 FPGA SelectIO Resources User Guide 筆記2 SelectIO Attributes/Constraints

1.Location Constraint 用于分配I/O端口 NET <I/O_NAME> LOC "<EXTERNAL_PORT_IDENTIFIER>"; Example: NET MY_IO LOCR7; 2.IOSTANDARD Attribute 用于選擇IO標準如LVCMOS25&#xff0c;LVDS_25等 NET <I/O_NAME> IOSTANDARD”<IOSTANDARD V…