我正在做一個程序,它可以使用Kohonen自組織映射對數值數據進行聚類,我試圖使它儘可能通用。那麼,我怎麼知道與數據集中項目數(輸出節點數)成正比的鄰域的適當初始大小?SOM的適當的鄰域大小
建議也將不勝感激。 :)
我正在做一個程序,它可以使用Kohonen自組織映射對數值數據進行聚類,我試圖使它儘可能通用。那麼,我怎麼知道與數據集中項目數(輸出節點數)成正比的鄰域的適當初始大小?SOM的適當的鄰域大小
建議也將不勝感激。 :)
如果您想要「儘可能通用」,則可能只有一種可能性:隨機。但我會建議讓它「儘可能少通用」,然後你可以玩參數...
你可以根據需要細化相鄰函數。
如果您圍繞每個最佳匹配單位(BMU)定義一個圓,您可以選擇該半徑以便與低維空間中的網格大小成比例(可能爲2d)。然後,您可以使半徑保持不變或按照某個標準收縮,直到最後一次迭代。
另一種選擇是使鄰域固定,如BMU的一定數量的周圍節點。
數據集中的元素數量與算法的鄰域大小之間是否存在任何關聯?我一直認爲,如果數據集中有更多元素,則鄰域大小也應該更大。但我不知道它的最佳比例。然後,我只是假設,這就是爲什麼我在這裏問了一個問題。 – libzz 2013-03-11 19:09:15
如果你有精心挑選的數據集訓練有素的系統,那麼AFAIK不應該有這樣的連接。但是,喲,你有嗎? ;) – xhudik 2013-03-12 08:10:16
當數據集也更大時,我只是將鄰域大小做得更大。它仍然運作良好。我只是想方設法讓它變得更好。 :) 感謝您的投入,但。非常感謝。 ^^, – libzz 2013-03-12 14:01:55