2015-10-13 69 views
1

我正在處理需要使用某些雙峯直方圖的問題。就像下面的例子一樣。我使用這些直方圖訓練神經網絡來確定直方圖上的雙峯標準。餘代表那些直方圖作爲數字矢量,像下面的例子:如何將噪聲應用於直方圖以生成新的直方圖

8029, 41, 82, 177, 135, 255, 315, 591, 949, 456, 499, 688, 446, 733, 712, 1595, 2633, 3945, 6134, 9755, 9236, 11911, 11888, 9450, 13119, 8819, 5991, 4399, 6745, 2017, 3747, 1777, 2946, 1623, 2151, 454, 3015, 3176, 2211, 1080, 391, 580, 750 

好,我有像300個雙峯直方圖(雙峯直方圖的一個例子是下面的圖像),

Bimodal Histogram Sample

但是爲了訓練網絡,擁有像2000個直方圖會很好。我知道我可以通過在直方圖上應用一些「噪音」來生成新的直方圖。 '噪聲'直方圖仍然是雙峯的,非常類似於它生成的原始直方圖,但它會代表'新數據',所以神經網絡可以有更多的例子來學習。

有人對如何將「噪音」添加到我的直方圖有一個想法?

回答

1

假設您在±k範圍內添加均勻噪聲。第i個垃圾箱中有高像素。每個將在一些i + j中變換,其中-k≤j≤k,概率爲1 /(2k + 1)。

因此平均來說,一個單獨的bin會平均分佈在2k + 1個相鄰的bin上。這種效果只是直方圖與方波信號的卷積效果。

類似的推理表明,對於其他噪聲分佈,您只需將直方圖與分佈的PDF進行卷積。


該處理對應於噪聲添加的預期效果,作爲倉以平衡的方式干擾。如果你想要一個更隨機的模擬,你可以用隨機圖形的直方圖替換每個bin上的PDF,其中隨機數據的樣本數量與bin中的像素(或更小的數字,相應地校正頻率)一樣多。

+0

感謝您的回答!我明白你的意思,但我無法想象它。你可以用任何數字數組做一個例子嗎?它可以是上面的例子。 –

+0

獲取數據的連續平均值。 –