我有一個大的功能集,看起來像這樣:尋找K最近點
id1 28273 20866 29961 27190 31790 19714 8643 14482 5384 .... upto 1000
id2 12343 45634 29961 27130 33790 14714 7633 15483 4484 ....
id3 ..... ..... ..... ..... ..... ..... .... ..... .... .... . . .
...
id200000 .... .... ... .. . . . .
我要計算每個ID歐氏距離和排序他們找到了5最近點。 因爲我的數據集非常大。什麼是最好的方式來做到這一點。
歡迎來到Stack Overflow!我們鼓勵你[研究你的問題](http://stackoverflow.com/questions/how-to-ask)。如果你已經[嘗試了某些東西](http://whathaveyoutried.com/),請將其添加到問題中 - 如果沒有,請先研究並嘗試您的問題,然後再回來。 – 2012-09-11 12:15:59
是否有不同的位置(即,您計算的是1000維空間)。如果是這樣,當你說「歐幾里德距離」到哪個點時?如果它是一個團體,請你可以定義「k-nearest」......這並不明顯。 –
例如,如果我將一個輸入作爲id2給腳本。我期望結果:關於id2的5個最近點。我想計算從id2到數據集中所有點的歐幾里德距離,對它們進行排序並返回5個最近點。 – Rafaelopasa