我一直在嘗試使用R作爲MVSP的替代方案來進行聚類分析和PCA。然而,R使用我發現的所有功能(包括dist,bcdist,hclust和菊花功能)給MVSP提供了截然不同的輸出。我還使用MVSP的距離表輸出作爲R中的距離矩陣,從而產生更多不同的輸出。它需要使用歐氏距離,sorenson-dice係數和平均/ UPGMA聚類的聚類/樹形圖。第二人稱/輸入以及我自己在多臺計算機和兩個版本中都會重複出現這些問題。 SAS與MVSP具有相同的結果。Dist和hclust函數輸出意外/不正確的輸出
是否有另一個我可以使用的軟件包(替代dist或hclust)或在R中查看/測試算法的方法?有什麼可能導致這種情況,並可能將R的版本回溯到更早的一項工作?
編輯;發現這個問題,我嘗試過的所有函數中使用的算法都沒有使用Sorenson係數,所以我使用了代理軟件包,使用dist函數(以及內置方法=「Dice」)。
編寫一個簡單的'dist'函數來獲取數據集的行或列的距離矩陣並不是很困難。然後,您可以將其與SAS/MVSP/R輸出進行比較,以嘗試確定距離的位置。 –
你可以添加你自己的答案。它最好包括代碼和示例數據對象 –