import csv
import numpy as np
from sklearn.cluster import SpectralClustering
reader=csv.reader(open("/Users/Desktop/user2.csv","rU"),dialect=csv.excel_tab)
x=list(reader)
result=np.array(x).astype('float')
lena = result.reshape(182,182)
type(lena)
# Apply spectral clustering (this step goes much faster if you have pyamg
# installed)
label = SpectralClustering(n_clusters= 5,affinity='precomputed').fit_predict(lena)
我有一個包含182個用戶的親和度矩陣。我想根據相似性矩陣對用戶進行聚類。但結果似乎將幾乎所有用戶聚集到一個羣集。有沒有人知道這件事?基於親和度矩陣的譜聚類
對於相似性矩陣。 182 * 182條目。 6510個條目> 0.001,最大值> 0.97。對話矩陣爲0.這種相似性矩陣是否存在問題,或者在這種情況下光譜聚類不適合?任何其他聚類方法作爲推薦?
你有沒有研究過你的數據?也許幾乎所有的用戶*都是高度相似的? –