2013-03-19 103 views
0

正如我們從樣本數據聚類到N個聚類(每個聚類具有一個質心向量)之後從K-Means中獲知的,並非所有數據都聚集在它們所屬的聚類中!我的意思是一些數據向量可能聚集在錯誤的簇中。這意味着即使在K-Means中,聚類也不會有100%的精度。我想知道在SOM算法中是否也會出現這樣的「錯誤」。 那麼......在SOM算法收斂後,是否有任何數據樣本不屬於它們實際放置的節點?自組織映射「錯誤」

我希望我的問題很清楚。我期待你的答案。

回答

0

SOM根據所呈現的輸入對數據進行聚類。羣集的形成取決於輸入到網絡的方式。

SOM通過最小化地圖點陣中的獲勝節點與實際輸入向量之間的距離,然後在直接鄰域中對權重進行自適應來對輸入進行聚類。因此,屬於單個類的輸入被映射到形成一個集羣的同一位置。

所以當算法收斂它是不太可能會發生這種情況,除非在下列情況下被提交給訓練網絡

  1. 沒有足夠的數據點
  2. 值用來學習速率是不正確
  3. SOM正確聚類,我們沒有看到聚類中的常見(隱藏)特徵,並傾向於認爲聚類中存在錯誤(發生在我身上多次)。

我不是SOM的專家,而是從經驗回答。希望這可以幫助。