我有大約1M的二進制numpy數組,我需要讓漢明之間的距離找到de k-nearest-neighbors,我得到的最快速的方法是使用cdist,返回一個具有距離的浮點矩陣。優化海明距離Python
因爲我沒有足夠的內存來獲得1Mx1M浮點數矩陣所以我做在這樣的時候一個元素:
from scipy.spatial Import distance
Hamming_Distance = distance.cdist(array1,all_array,'hamming')
的probles是,它採取類似2-3S爲每個Hamming_Distance,到1m文件,它花了一個永恆(我需要用它來不同的k)。
有沒有最快的方法來做到這一點?
我在想多處理或在C上做它,但我有一些麻煩理解它如何工作python的多處理,我不知道如何混合C代碼與Python代碼。
你試圖暴力破解一個你沒有任何資源附近的問題來暴力破解。找到最近鄰居的方法要比計算所有成對距離並取低點距離要好得多。 – user2357112