1

我隨機想出了一個數據組具有3個例子{1,2,3.5}我正確理解羣集嗎?

我試圖用以下兩個聚類技術:與q=2Ө =1.1
2.Sequential聚類

1.Hierarchical聚類。

無論使用哪個聚類技術,我總是想出了以下兩個集羣

{1,2}{3.5}

這是正確的嗎?
看到使用兩種完全不同的聚類技術,結果是相同的,這是相當令人驚訝的。

回答

3

我認爲從3個值中查找兩個羣集的任務是擴展一個羣集的定義。使用更多的數據點,以及比羣集更多的數據點。

+1

你正在擴展一個輕描淡寫的定義。 +1ワロタ – 2010-11-19 21:17:38

+1

@Anton :-)也許,但我是英國人,所以輕描淡寫是遺傳特徵! – winwaed 2010-11-19 21:19:15

3

我不認爲您的案例研究是不夠詳盡,以得出有意義的結論..

取一個數據集是足夠大,以顯示differencies,也因爲連續的簇實際上創建羣集而分層構建了一個樹。這不是一回事。然後,它取決於您如何選擇閾值來分割分層樹和用於順序聚類的偏差。

+0

謝謝,傑克,但基於我的微不足道的例子,如果使用這兩種技術我做對了嗎? – Kevin 2010-11-04 23:40:24

+2

你的意思是「正確的」?如果你的意思是,如果這兩個算法應該給這個平凡的輸入相同的結果,那麼可能是的..但這就像想知道爲什麼排序列表{3,1,2}大致需要與插入排序或快速排序相同的時間.. – Jack 2010-11-05 00:38:48

1

爲了更好地感受聚類,請下載WEKA並使用它聚類虹膜數據集。 WEKA具有多種可視化功能,可以讓您感受到羣集是什麼。虹膜數據集很簡單,只有少量特徵,因此您可以理解結果。