本文內容 B-樹(B-tree) 散列(Hash) k-d 樹(k-d tree) 點四叉樹(Point Quadtree)
本文介紹關于 Oracle 索引的結構。大概了解 Oracle 索引底層的數據結構,從而更好地理解 Oracle 索引對增、刪、改、查的性能。
B-樹(B-tree)非索引的結構能滿足所有需要,但自平衡的 B-樹索引結構更能優化在大數據集上檢索的性能。每個 B-樹節點擁有多個鍵和指針。特定 B-樹支持的一個節點中鍵的最大數量是那顆樹的順序。每個節點都具有一個潛在的 order+1 指針,指向比它更低一級的節點。
例如,如圖 1 所示,order=2 的 B-樹具有三個指針,分別指向:比它第一個鍵小的子節點(最左邊的指針);比它第一個鍵大,比第二個鍵小的子節點(中間的指針);比它第二個鍵大的子節點(最右邊的指針)。因此,B-樹算法,最大限度地減少定位記錄所需的讀寫,通過傳遞比二叉樹算法更少的節點,二叉樹對每個確定的節點,用一個鍵和最多兩個子節點(二叉樹的結構是一個鍵值,左右兩個指針,B-樹是二叉樹的擴展)。下圖描述的是克努特變換(Knuth variation),它的索引由兩部分組成:一個順序集(Sequence set),提供快速順序的訪問數據;一個索引集(Index set),提供直接訪問順序集。
雖然,B-樹的節點,一般不包含相同數量的數據值,并且他們通常包含一定量的未使用空間,B-樹算法確保樹保持平衡,和葉節點在同一級上。
圖 2 散列
k-d 樹(k-d tree)具有兩維的數據,例如經度和緯度,可用通過使用 k-d樹變換,稱為 2-d 樹,被有效地存儲和檢索。
在這個結構,每個節點的數據類型,是字段信息,兩個坐標,和指向兩個子節點的左指針和右指針。
圖 4 Point Quadtree 索引結構
點四叉樹跟 2-d 樹一樣也很容易實現。一個包含 k 個節點的四叉樹具有 k 高度,插入和查詢復雜。每個比較都要求在至少兩個坐標上進行。然而,實際中,從 root 到 leaf 的長度在點四叉樹中往往較短。
復制上面第二個鏈接里邊提供的 Python 代碼,做適當修改。因為,網頁提供的代碼只能運行在較低版本 Python。Python 3 之后的版本跟之前的差異較大。因此,下載本文最后源代碼,并在 Python 3.3 的 IDLE 運行。會得到如下輸出:Python 3.3.0 (v3.3.0:bd8afb90ebf2, Sep 29 2012, 10:57:17) [MSC v.1600 64 bit (AMD64)] on win32Type "copyright", "credits" or "license()" for more information.>>> ================================ RESTART ================================>>> <?xml version="1.0" encoding="iso-8859-1"?><!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN" "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd"><svg xmlns="http://www.w3.org/2000/svg" version="1.1" viewBox="0 0 400 400"> <g fill="none" stroke="blue"> <line x1="1" y1="1" x2="1" y2="399" /> <line x1="1" y1="399" x2="399" y2="399" /> <line x1="399" y1="399" x2="399" y2="1" /> <line x1="399" y1="1" x2="1" y2="1" /> <line x1="200" y1="1" x2="200" y2="399" /> <line x1="1" y1="200" x2="399" y2="200" /> <line x1="100" y1="1" x2="100" y2="200" /> <line x1="1" y1="100" x2="200" y2="100" /> <line x1="50" y1="1" x2="50" y2="100" />……
復制輸出的結果,命名為 .svg,.html 也行,用瀏覽器打開,會呈現下圖:
圖 5 一個 8*8 大小的點四叉樹區域
看這個圖,從左上角開始,順時針。你可以當做“根據需要,是否要點,不斷按 4 個分裂其中一個方塊”。
下載 Point Qudatree Python 演示
新聞熱點
疑難解答