2016-11-15 55 views
0

我對一組44名受訪者進行了一系列長期調查(沒有那麼多,但我做不到)。我應該使用多少個變量來聚集一個巨大的數據集?

我需要使用兩步分析在SPSS中對樣本進行聚類,但實際上有很多變量。由於進行了6份不同的調查問卷,大約有200個量化問題(變量),更不用說定性問題了。

我的第一個問題是:我應該使用所有的量化變量來執行聚類分析嗎?我閱讀的所有手冊都會爲羣集解決方案選擇一些選定的變量,而不是全部。

第二個問題是,我試圖用分層聚類所有的定量數據,但SPSS通知:

警告

沒有足夠有效的情況下進行聚類分析。

......這意味着我擁有的數據集不能用於執行聚類分析......在這種情況下,我應該怎麼做來執行聚類分析?

回答

0

問題1,

雖然你有200個變量有可能是某些變量之間的強相關性。所以最好使用彼此關聯性較小的變量來執行聚類分析。

或者,您可以使用像主成分分析這樣的無監督方法來減少數據集的維數並轉換爲低相關空間。

問題2,

下面的鏈接提供有關SPSS錯誤很好的解釋, http://www-01.ibm.com/support/docview.wss?uid=swg21481097

1

這聽起來相當成問題。你有大量的變量。你還沒有說多少案件,但它聽起來像它可能只有44×6,這不是一個很好的結合。聚類練習的目的是什麼?

您可以考慮提取定量變量的幾個主成分聚類使用,並添加少量的其他變量。來自層次聚類過程的消息是一個警告。

相關問題