SOM的適當的鄰域大小

我正在做一個程序，它可以使用Kohonen自組織映射對數值數據進行聚類，我試圖使它儘可能通用。那麼，我怎麼知道與數據集中項目數（輸出節點數）成正比的鄰域的適當初始大小？SOM的適當的鄰域大小

建議也將不勝感激。 :)

2013-03-11 libzz

如果您想要「儘可能通用」，則可能只有一種可能性：隨機。但我會建議讓它「儘可能少通用」，然後你可以玩參數...

2013-03-11 15:09:04 xhudik

數據集中的元素數量與算法的鄰域大小之間是否存在任何關聯？我一直認爲，如果數據集中有更多元素，則鄰域大小也應該更大。但我不知道它的最佳比例。然後，我只是假設，這就是爲什麼我在這裏問了一個問題。 – libzz 2013-03-11 19:09:15

如果你有精心挑選的數據集訓練有素的系統，那麼AFAIK不應該有這樣的連接。但是，喲，你有嗎？ ;） – xhudik 2013-03-12 08:10:16

當數據集也更大時，我只是將鄰域大小做得更大。它仍然運作良好。我只是想方設法讓它變得更好。 :) 感謝您的投入，但。非常感謝。 ^^， – libzz 2013-03-12 14:01:55

你可以根據需要細化相鄰函數。

如果您圍繞每個最佳匹配單位（BMU）定義一個圓，您可以選擇該半徑以便與低維空間中的網格大小成比例（可能爲2d）。然後，您可以使半徑保持不變或按照某個標準收縮，直到最後一次迭代。

另一種選擇是使鄰域固定，如BMU的一定數量的周圍節點。

2014-03-06 22:26:48 user1603472

回答