2011-03-18 114 views
1

計算超大型稀疏向量的距離/鄰近矩陣的最佳方法是什麼? 例如,您將得到以下設計矩陣,其中每行是68771維稀疏向量。Python中的鄰近矩陣

designMatrix < 5830x68771型' 有1229041種存儲的元素的稀疏矩陣在壓縮稀疏行格式>

回答

1

你試過的例程scipy.spatial.distance

http://docs.scipy.org/doc/scipy/reference/spatial.distance.html

如果這迫使你去一個密集的表現,那麼你可能會更好滾動您自己,取決於非零元素的密度。您可以在保留新索引與原索引之間的映射的同時擠出零點,計算其餘非零元素上的成對距離,然後使用索引將事物映射回來。