2014-07-15 57 views
0

我已閱讀scikit學習文檔,並使用Google搜索無濟於事。我有2000個數據集,如圖所示聚集在一起。如圖所示,一些羣集是錯誤的,這裏是紅色的羣集。我需要一個指標來驗證所有2000個集羣集。在scikit學習中幾乎所有的度量標準都需要地面真實類標籤,我認爲這些標籤對於這個問題並不具備。我有30天的小時交通流量,我用k-means對它們進行聚類。線是聚類中心。我該怎麼辦?我甚至在正確的軌道上?!橫軸是小時,0到23,縱軸是交通流量,所以數據點表示30天內那個小時內的交通流量,k = 3。K均值指標

image

+1

聚類的驗證是不是適定性問題,如果你沒有地面實況做。 – eickenberg

+0

那麼處理這種情況的正確方法是什麼? – plumSemPy

+0

「錯」是什麼意思?另外,我不太瞭解情節。這些點意味着什麼?什麼是單一數據點? –

回答