2016-07-14 35 views
4

有關於在python k均值聚類問題。如何添加一列k均值預測集羣的數據幀在Python

所以,我做的分析,這種方式:

from sklearn.cluster import KMeans 

km = KMeans(n_clusters=12, random_state=1) 
new = data._get_numeric_data().dropna(axis=1) 
kmeans.fit(new) 
predict=km.predict(new) 

我怎麼能與聚類結果列添加到我的第一個數據幀的「數據」作爲一個附加列?謝謝!

+1

所以你基本上是問如何將列添加到數據幀?如在:http://stackoverflow.com/questions/12555323/adding-new-column-to-existing-dataframe-in-python-pandas或這裏http://stackoverflow.com/questions/18942506/add-new -column功能於大熊貓,數據幀蟒蛇 –

回答

5

假設列長度是一樣的,你數據幀df每一列,所有你需要做的是這樣的:

df['NEW_COLUMN'] = Series(predict, index=df.index)