Sift中尺度空間、高斯金字塔、差分金字塔(DOG金字塔)、圖像金字塔



一、 圖像金字塔


圖像金字塔是一種以多分辨率來解釋圖像的結構,通過對原始圖像進行多尺度像素采樣的方式,生成N個不同分辨率的圖像。把具有最高級別分辨率的圖像放在底部,以金字塔形狀排列,往上是一系列像素(尺寸)逐漸降低的圖像,一直到金字塔的頂部只包含一個像素點的圖像,這就構成了傳統意義上的圖像金字塔。





獲得圖像金字塔一般包括二個步驟:

1. 利用低通濾波器平滑圖像 

2. 對平滑圖像進行抽樣(采樣)

有兩種采樣方式——上采樣(分辨率逐級升高)和下采樣(分辨率逐級降低)


上采樣:




下采樣:




二、高斯金字塔


高斯金字塔式在Sift算子中提出來的概念,首先高斯金字塔並不是一個金字塔,而是有很多組(Octave)金字塔構成,並且每組金字塔都包含若干層(Interval)。

高斯金字塔構建過程:

1. 先將原圖像擴大一倍之后作為高斯金字塔的第1組第1層,將第1組第1層圖像經高斯卷積(其實就是高斯平滑或稱高斯濾波)之后作為第1組金字塔的第2層,高斯卷積函數為:



對於參數σ,在Sift算子中取的是固定值1.6。

2. 將σ乘以一個比例系數k,等到一個新的平滑因子σ=k*σ,用它來平滑第1組第2層圖像,結果圖像作為第3層。

3. 如此這般重復,最后得到L層圖像,在同一組中,每一層圖像的尺寸都是一樣的,只是平滑系數不一樣。它們對應的平滑系數分別為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。

4.  將第1組倒數第三層圖像作比例因子為2的降采樣,得到的圖像作為第2組的第1層,然后對第2組的第1層圖像做平滑因子為σ的高斯平滑,得到第2組的第2層,就像步驟2中一樣,如此得到第2組的L層圖像,同組內它們的尺寸是一樣的,對應的平滑系數分別為:0,σ,kσ,k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2組是第1組圖像的一半。

這樣反復執行,就可以得到一共O組,每組L層,共計O*L個圖像,這些圖像一起就構成了高斯金字塔,結構如下:




在同一組內,不同層圖像的尺寸是一樣的,后一層圖像的高斯平滑因子σ是前一層圖像平滑因子的k倍;

在不同組內,后一組第一個圖像是前一組倒數第三個圖像的二分之一采樣,圖像大小是前一組的一半;


高斯金字塔圖像效果如下,分別是第1組的4層和第2組的4層:


        



三、 尺度空間



圖像的尺度空間解決的問題是如何對圖像在所有尺度下描述的問題。

在高斯金字塔中一共生成O組L層不同尺度的圖像,這兩個量合起來(O,L)就構成了高斯金字塔的尺度空間,也就是說以高斯金字塔的組O作為二維坐標系的一個坐標,不同層L作為另一個坐標,則給定的一組坐標(O,L)就可以唯一確定高斯金字塔中的一幅圖像。

尺度空間的形象表述:



上圖中尺度空間中k前的系數n表示的是第一組圖像尺寸是當前組圖像尺寸的n倍。



四、 DOG金字塔


差分金字塔,DOG(Difference of Gaussian)金字塔是在高斯金字塔的基礎上構建起來的,其實生成高斯金字塔的目的就是為了構建DOG金字塔。

DOG金字塔的第1組第1層是由高斯金字塔的第1組第2層減第1組第1層得到的。以此類推,逐組逐層生成每一個差分圖像,所有差分圖像構成差分金字塔。概括為DOG金字塔的第o組第l層圖像是有高斯金字塔的第o組第l+1層減第o組第l層得到的。

DOG金字塔的構建可以用下圖描述:




每一組在層數上,DOG金字塔比高斯金字塔少一層。后續Sift特征點的提取都是在DOG金字塔上進行的。

DOG金字塔的顯示效果如下:




這些長得黑乎乎的圖像就是差分金字塔的實際顯示效果,只在第1組第1層差分圖像上模糊可以看到一個輪廓。但其實這里邊包含了大量特征點信息,只是我們人眼已經分辨不出來了。

下邊對這些DOG圖像進行歸一化,可有很明顯的看到差分圖像所蘊含的特征,並且有一些特征是在不同模糊程度、不同尺度下都存在的,這些特征正是Sift所要提取的“穩定”特征:







注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com