0

我正在測試Scikit Learn中實現的Birch clustering算法。我對手冊中的陳述有點困惑;關於參數n_clusters,它指出瞭解Scikit中Birch集羣的設置瞭解

n_clusters : int, instance of sklearn.cluster model, default None 

在另一方面,該算法的初始描述如下:

類sklearn.cluster.Birch(閾值= 0.5,branching_factor = 50, n_clusters = 3,compute_labels =真,副本= TRUE)

我會認爲這意味着該n_clusters是默認設置爲,而不是。這也是我運行它時似乎在做的事情。

我是否以某種方式誤讀了這篇文章?這背後的邏輯是什麼?

(我想這沒有幫助,我不是100%肯定這是什麼設置實際上做;我理解它是一種額外的細集羣適用於樺木方法的結果。)

任何非常感謝幫助!

+0

Oh noes!文檔錯誤!我們註定要失敗,我們必須問在interwebz上的隨機網站現在該做什麼!我的電腦現在會爆炸。 –

回答

0

是的,你是對的。默認值應該是3而不是無。

n_clusters = integer時,模型擬合變爲Agglomerative Clustering,其n_clusters被設置爲該值integer的值。

n_clusters = None時,未執行進一步的羣集步驟,並且子羣集返回爲以前的樣子。

See #6635 github issue

+1

謝謝!很高興這不僅僅是我愚蠢...... – patrick