1
假設我有多維數據集,其中有許多向量作爲數據。我正在寫一個算法,它需要做所有那些向量的k近鄰搜索 - 經典KNN。然而,在我的算法中,我向整個數據集中添加了新的向量,並且需要將這些新的向量包含到我的KNN搜索中。我想要有效地做到這一點。我研究了scikit-learn的KD樹和球樹,但他們不允許插入(根據概念的性質)。我不確定SR樹或R樹是否會提供插入,但在任何情況下,我都無法找到3D以外的數據的Python實現。允許插入的高效KNN實現
關於搜索我很滿意查詢「給我最接近的向量」(所以1-NN)或「給我所有更接近半徑的向量」。
這在[交叉驗證](https://stats.stackexchange.com/)可能比這裏更好。 – Antimony
@Antimony:有太多stackexchange網站的機器學習... – Make42
不完全。這是唯一的一個。 – Antimony