查找——圖文翔解RadixTree(基數樹)



基數樹


對於長整型數據的映射,如何解決Hash沖突和Hash表大小的設計是一個很頭疼的問題。
radix樹就是針對這種稀疏的長整型數據查找,能快速且節省空間地完成映射。借助於Radix樹,我們可以實現對於長整型數據類型的路由利用radix樹可以根據一個長整型(比如一個長ID)快速查找到其對應的對象指針。這比用hash映射來的簡單,也更節省空間,使用hash映射hash函數難以設計,不恰當的hash函數可能增大沖突,或浪費空間。

radix tree是一種多叉搜索樹,樹的葉子結點是實際的數據條目。每個結點有一個固定的、2^n指針指向子結點(每個指針稱為槽slot,n為划分的基的大小)


插入、刪除 

radix Tree(基數樹) 其實就差不多是傳統的二叉樹,只是在尋找方式上,利用比如一個unsigned int的類型的每一個比特位作為樹節點的判斷。
可以這樣說,比如一個數1000101010101010010101010010101010,那么按照Radix 樹的插入就是在根節點,如果遇到0,就指向左節點,如果遇到1就指向右節點,在插入過程中構造樹節點,在刪除過程中刪除樹節點。如果覺得太多的調用Malloc的話,可以采用池化技術,預先分配多個節點。
(使用一個比特位判斷,會使樹的高度過高,非葉節點過多。故在實際應用中,我們一般是使用多個比特位作為樹節點的判斷,但多比特位會使節點的子節點槽變多,增大節點的體積,一般選用2個或4個比特位作為樹節點即可)

如圖:


插入:

我們在插入一個新節點時,我們根據數據的比特位,在樹中向下查找,若沒有相應結點,則生成相應結點,直到數據的比特位訪問完,則建立葉節點映射相應的對象。

刪除:

我們可以“惰性刪除”,即沿着路徑查找到葉節點后,直接刪除葉節點,中間的非葉節點不刪除。


應用

Radix樹在Linux中的應用:

Linux基數樹(radix tree)是將long整數鍵值與指針相關聯的機制,它存儲有效率,並且可快速查詢,用於整數值與指針的映射(如:IDR機制)、內存管理等。
IDR(ID Radix)機制是將對象的身份鑒別號整數值ID與對象指針建立關聯表,完成從ID與指針之間的相互轉換。IDR機制使用radix樹狀結構作為由id進行索引獲取指針的稀疏數組,通過使用位圖可以快速分配新的ID,IDR機制避免了使用固定尺寸的數組存放指針。IDR機制的API函數在lib/idr.c中實現。

Linux radix樹最廣泛的用途是用於內存管理,結構address_space通過radix樹跟蹤綁定到地址映射上的核心頁,該radix樹允許內存管理代碼快速查找標識為dirty或writeback的頁。其使用的是數據類型unsigned long的固定長度輸入的版本。每級代表了輸入空間固定位數。Linux radix樹的API函數在lib/radix-tree.c中實現。(把頁指針和描述頁狀態的結構映射起來,使能快速查詢一個頁的信息。)

Linux內核利用radix樹在文件內偏移快速定位文件緩存頁。 
Linux(2.6.7) 內核中的分叉為 64(2^6),樹高為 6(64位系統)或者 11(32位系統),用來快速定位 32 位或者 64 位偏移,radix tree 中的每一個葉子節點指向文件內相應偏移所對應的Cache項。

【radix樹為稀疏樹提供了有效的存儲,代替固定尺寸數組提供了鍵值到指針的快速查找。】 

后記

Radix樹與Trie樹的思想有點類似,甚至可以把Trie樹看為一個基為26的Radix樹。(也可以把Radix樹看做是Tire樹的變異)
Trie樹一般用於字符串到對象的映射,Radix樹一般用於長整數到對象的映射。
trie樹主要問題是樹的層高,如果要索引的字的拼音很長很變態,我們也要建一個很高很變態的樹么?
radix樹能固定層高(對於較長的字符串,可以用數學公式計算出其特征值,再用radix樹存儲這些特征值)


相關代碼可以參考

http://www.cnblogs.com/Bozh/archive/2012/04/15/radix.html



----------------------------------感謝您的訪問,希望對您有所幫助。 歡迎大家關注、收藏以及評論。----------------------------------




注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2020 ITdaan.com