1
我正在使用可用的文檔集羣代碼here。我知道k-means正在求解一個非凸問題,因此每次運行它時優化的結果都會有所不同,但有沒有辦法使聚類可以重現(也許通過修復一些隨機種子)?sklearn中的可重現kmeans
我正在使用可用的文檔集羣代碼here。我知道k-means正在求解一個非凸問題,因此每次運行它時優化的結果都會有所不同,但有沒有辦法使聚類可以重現(也許通過修復一些隨機種子)?sklearn中的可重現kmeans
您可以修復random_state參數K-means。在下面的代碼中,我使用了42:
km = KMeans(n_clusters=true_k, init='k-means++', max_iter=100, n_init=1,
verbose=opts.verbose,
random_state = 42)
您可以檢查文檔here。