2012-12-16 45 views
0

給定一維隨機數集合,我們只需遍歷該集合,然後將數據推送到樹中。在一個方面,這非常簡單。我們可以簡單地比較數據的價值,並決定數據在樹上傳播的位置。爲更高維數據設計分層樹

但是,對於更高維度,距離開始變得模糊,並且更難確定哪些數據應該沿着樹向下。實際上,如果我們要設計一個包含一組高維向量(例如128維SIFT特徵)的分層樹,那麼我們如何確定每個n維向量應該到哪個子樹中上?我們所做的一些事情是什麼?

+0

什麼是分層樹,而不是樹? – 2012-12-17 19:15:22

+0

實際上一樣。我只是想強調分層部分。 – Karl

+0

我重新標記了這一點,因爲這個問題不是特定於SIFT的,並且數據不是分層的,只有樹是。 – 2012-12-22 18:55:50

回答

1

隨機樹木

random tree是用於分類或聚類的常用技術。

這裏是你如何決定如何樹的每個節點分割:

  • 選擇一個隨機K(小東西,像5)從128種SIFT尺寸。
  • 確定哪些k維提供了數據的最佳分割。

所以,每個節點需要存儲:

  1. 尺寸使用
  2. 決定閾值適用於尺寸

葉將存儲:

  • 類別預測或關於已結束的數據點的一些統計在那個葉節點上。