2013-01-11 57 views
2

我正在研究基於this paper的R *樹的實現。我有幾個關於選擇分割軸算法的問題。選擇R *樹拆分平面

R * -tree使用followmg方法來找到好的分割。沿着每個軸,條目首先按較低值排序,然後按其矩形的上限值排序。

矩形的下限值/上限值是什麼意思?

對於每個分佈,確定善良值。取決於這些善良值,確定條目的最終分佈。實驗測試了三種不同的善良价值和不同組合使用方法。

(I)面積值區域[BB(第一組)] +區域[BB(第二組)]

(II)餘量值餘量[BB(第一組)] +餘量[BB(第二組)]

(III)重疊值區域[BB(第一組)+ BB(第二組)]

這裏BB表示一組矩形

的的邊界框什麼這是否意味着margin-value?我將如何去計算這個值?

回答

5

據我所知,「矩形的下/上值」是沿所討論的軸的矩形的最小值和最大值。

根據鏈接文章的p323,「此處的邊距是矩形邊緣長度的總和」。

+0

如此有效的邊界是組邊界框的周長? – helloworld922

+3

這就是它對我的看法。它指出,對於一個固定的區域,邊距在一個正方形中最短,這與「周長」一致。 –

2

矩形通常由每個維度中的min + max對錶示。所以「上」和「下」值是最小值和最大值。

邊距是周長。原因在於,在很多情況下,方塊是最佳類型的矩形。例如,當你做歐幾里德(或曼哈頓,幾乎任何Lp範數)最近鄰居搜索。原因是他們在某種程度上「不偏不倚」。其他拆分策略,例如Ang et Tan的「線性」拆分忽略了這一點,並傾向於生成很長的東西片。維基百科有一個這樣的例子:

https://en.wikipedia.org/wiki/File:Zipcodes-Germany-AngTanSplit.svg

這些都是那種分裂的R * - 樹試圖避免的。因爲大多數查詢都會與很多這些切片相交,所以你獲得的很少。

請注意,R * - 樹使用了一些啓發式和領帶破壞者。此外,它做了兩步決定:首先,它只選擇用於分割的軸。當軸已經確定時,它實際上使用不同的邏輯來選擇沿着該軸的分割。