2017-03-09 42 views
-1

我正在嘗試使用scipy.cluster.hierarchy進行一些分析。我得到了一個很好的樹狀圖,但是當我想要爲我的數據獲得實際羣集標籤時,我必須設置t參數的功能fclusterfclusterdata。 docomentation只說這是一個float,但這個數字實際上意味着什麼?我想知道能夠正確設置它。編輯 - 例如,我應該設置什麼樣的t,當我想要k羣集並且在我的數據集中有m樣本?scipy的fcluster/fclusterdata中的t(閾值)參數是什麼?

回答

2

閾值參數的含義取決於您設置的criterion,如scipy's api中所述。如在API記載有以下5個選項:

  1. inconsistent
  2. distance
  3. maxclust
  4. monocrit
  5. maxclust_monocrit

maxclustmaxclust_monocrit準則既是要形成的最大羣集數。所以關於你的編輯,你應該把它設置爲k。

相關問題