2014-02-14 54 views
1

我正在使用PSPP(不是SPSS,因爲我無法在我的Ubuntu機器上運行該程序)並將我的一組〜100k個記錄與k-means羣集集成在一起。現在我真正需要的是比每個集羣有多少記錄更詳細的輸出。我需要保存即保存羣集變量/變量PSPP

行1 =>簇1

行2 =>簇4

行3 =>簇1

等...

本質羣集可變我需要額外的字段來保存每條記錄的結果集羣關聯度。我目前的語法是:

QUICK CLUSTER cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12 
/CRITERIA=CLUSTERS(12) MXITER(100000000). 

SPSS和PSPP所以如果在SPSS的選項可能在這裏工作過分享了很多相同的語法。

回答

1

統計數據應在Ubuntu上運行,但統計QUICK CLUSTER命令有一個子

/攢簇

應該做你想做的。您可以選擇在CLUSTER之後的括號中指定變量名稱。

0

PSPP不處理/ SAVE CLUSTER子命令。 試試吧!

QUICK CLUSTER var_list 
     [/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]] 
     [/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}] 
     [/PRINT={INITIAL} {CLUSTER}] 

查看GNU page of PSPP