我在Python(scikit-learn)中使用K-Means對文本數據進行聚類。 如何獲取該行所屬的集羣?K-means文本數據聚類:獲取文本所屬的集羣
例: 數據=「紅,黃,藍的顏色」,「冰淇淋是我最喜愛的食物」,「你現在可以得到草莓味太冰淇淋」,「天空是藍色的」]
在用n_clusters = 2執行K-Means之後,我預計會形成兩個集羣st
「紅色,黃色和藍色是顏色」,「天藍色」在一個羣集中,「冰淇淋是我最喜歡的食物」,「你現在可以得到草莓味道的冰淇淋」。
我該如何得知這一點,即哪一行在哪個簇?
代碼K-手段:
vectorizer = TfidfVectorizer(stop_words='english')
X = vectorizer.fit_transform(data)
model = KMeans(n_clusters=true_k, init='k-means++', max_iter=500, n_init=20)
model.fit(X)