我實際上正在研究高維數據(〜50.000-100.000特徵),並且必須對其執行最近鄰居搜索。我知道,隨着維度的增長,KD-Tree的性能很差,而且我也讀到過,一般來說,所有空間分割數據結構都傾向於使用高維數據執行窮舉搜索。高維最近鄰搜索的最佳數據結構
此外,還有要考慮的兩個重要的事實(按相關性排序):
- 精密:最近的鄰居必須要找到(不近似值)。
- 速度:搜索必須儘可能快。 (創建數據結構的時間並不重要)。
所以,我需要的一些建議:
- 的數據結構來執行K-NN。
- 如果使用aNN(近似最近鄰居)方法會更好,請儘可能準確地設置它?
對這兩個答案沒有什麼可說的? – gsamaras