1
計算超大型稀疏向量的距離/鄰近矩陣的最佳方法是什麼? 例如,您將得到以下設計矩陣,其中每行是68771維稀疏向量。Python中的鄰近矩陣
designMatrix < 5830x68771型' 有1229041種存儲的元素的稀疏矩陣在壓縮稀疏行格式>
計算超大型稀疏向量的距離/鄰近矩陣的最佳方法是什麼? 例如,您將得到以下設計矩陣,其中每行是68771維稀疏向量。Python中的鄰近矩陣
designMatrix < 5830x68771型' 有1229041種存儲的元素的稀疏矩陣在壓縮稀疏行格式>
你試過的例程scipy.spatial.distance
?
http://docs.scipy.org/doc/scipy/reference/spatial.distance.html
如果這迫使你去一個密集的表現,那麼你可能會更好滾動您自己,取決於非零元素的密度。您可以在保留新索引與原索引之間的映射的同時擠出零點,計算其餘非零元素上的成對距離,然後使用索引將事物映射回來。