2
我已經實現了k-means算法來對數據進行聚類。我正在使用的數據可能大於我可用的RAM數量。有沒有一種常見的方式(用C++)來處理這些問題?如何在大於RAM的數據上執行k-means?
我已經實現了k-means算法來對數據進行聚類。我正在使用的數據可能大於我可用的RAM數量。有沒有一種常見的方式(用C++)來處理這些問題?如何在大於RAM的數據上執行k-means?
有增量的k-means算法在那裏:http://www.eecs.tufts.edu/~dsculley/papers/fastkmeans.pdf
感謝您的建議。這樣就可以在更大的數據集上執行k-means。 – 2014-08-27 13:52:24
的RAM量或地址空間量? – 2014-08-27 08:45:34