2012-03-23 23 views
0

我希望利用粒子羣優化(PSO)優化複雜的參數化模型與噪聲數據的擬合。數據是時間序列化學濃度值。粒子羣優化:處理候選解中的不確定性/不精確性

在我的優化目標函數中,我使用濃度時間序列曲線和模型預測之間的佈雷柯蒂斯距離[1]來測量適應度(模型預測是使用與優化問題的候選解決方案對應的參數生成的) 。

目前我沒有考慮到我的濃度數據不準確。實際上,濃度已經四捨五入爲整數值。如果PSO例行程序和/或目標函數「意識到」輸入數據的不精確性,我懷疑我可以得到更好的PSO模型。

我能夠找到預測時間序列和數據時間序列的最小和最大Bray Curtis距離,但我不確定如何最好地在PSO代碼中使用這些值。

當評估候選解決方案在進化優化環境下的適應度時,有沒有人對如何處理數據不精確性有任何建議?

第二個問題是時間序列數據同時受到儀器和定時誤差的影響。我很高興地假設這兩種類型的錯誤都是正態分佈的,並且具有不變的標準偏差,但我們不再確定在量化適用於PSO優化時如何最好地處理這種不確定性。

[1] http://docs.scipy.org/doc/scipy/reference/generated/scipy.spatial.distance.braycurtis.html

回答

0

PSO應該更有彈性比大多數算法的噪聲數據。您是否觀察過PSO如何運行的實際問題?確保使用相當稀疏的拓撲結構。如果真的可以歸結爲它,你可以讓每個粒子用於個人和社區的最佳效果,而不是它所見過的最好的價值,而是最近500次迭代中的最佳價值。這有點破解,但可能值得一試。最後,如果算法沒有問題,你可能不用擔心。

+1

我才知道有模型擬合問題,即原始數據我正在同是受舍入誤差開始後。我已經在使用稀疏粒子通信拓撲(Von Neumann格)。自從發佈我的問題後,我發現如果將Bray Curtis距離的定義改爲sum(sgn(| u_i-v_i | -p)| u_i-v_i | -p)/ sum(| u_i + v_i |)其中p是向量u的最大精度(即p =((u中的最大小數位數)+1)/ 2 – 2012-03-28 15:42:26