2015-07-20 71 views
-2

我有一個1000個數據幀。有兩個變量,並附有以下描述性總結;R:未能通過使用dbscan(fpc)製作集羣

 var1    var2  
Min. : 0.0 Min. : 0.0 
1st Qu.: 837.8 1st Qu.: 651.5 
Median :1465.0 Media : 819.5 
Mean :1421.6 Mean : 832.6 
3rd Qu.:1888.2 3rd Qu.: 990.0 
Max. :3799.0 Max. :2271 

和情節的分散,https://www.dropbox.com/s/wnffqoavoyaw8ms/Rplot04.png?dl=0

我一直在嘗試使用DBSCAN(FPC)產生潛在的集羣,但一直沒能產生任何集羣在所有即使我有不同的嘗試eps(0.5到5)和minPts(5到20)的值。

我非常感謝,如果有人可以建議eps和minPts的出發點,根據這個data.frame產生至少2個簇。

+0

「dbscan(fpc)」是什麼意思?你是否在稱爲'fpc'的數據幀上調用了一個名爲'dbscan'的函數?不,你的意思是'fpc'包中的'dbscan'函數。現在告訴我們你的代碼和你的輸出以及你認爲它是錯誤的。 – Spacedman

+0

@spacedman有一個R包'fpc',其中包含一個可怕的緩慢和有限的DBSCAN實現。 –

回答

0

給定值範圍,eps = 5可能太低。

您是否嘗試過在DBSCAN論文中提出選擇eps的啓發式方法?

但從你的情節判斷,只有一個基於密度的集羣。 GMM可能會更好地處理該數據集。也許OPTICS和mean-shift也會起作用。但是DBSCAN將很難區分這兩個集羣(並且您不能過度配置參數)