2017-02-11 47 views
1

我嘗試用Encog一些測試和AutoMPGRegression例如:與線輸出重量可靠性吻合迴歸。 (錯誤思考)

https://github.com/encog/encog-java-examples/blob/master/src/main/java/org/encog/examples/guide/regression/AutoMPGRegression.java

我的問題很簡單,就是有沒有辦法重可靠性設置數據CSV輸出線?

在事實,數據的一些樣品可能比其他人更可靠,所以不可靠行的數據,我們應該告訴Encog這不是那麼重要,如果神經網絡不符合該輸出。 AutoMPGRegression樣品CSV數據的

提取物:

18.0 8 307.0  130.0  3504.  12.0 70 1 "chevrolet chevelle malibu" 

15.0 8 350.0  165.0  3693.  11.5 70 1 "buick skylark 320" 

18.0 8 318.0  150.0  3436.  11.0 70 1 "plymouth satellite" 

我想告訴給Encog,對於第2行,則輸出值「15」具有50%的fiability,所以誤差應當ponderated爲那條線。

感謝您的幫助, TRIX

+0

@ Gama11或TRIX是什麼fiability? –

+0

@YuraZaletskyy通過fiability /可靠性我的意思是這是少跌多確保爲給定的輸入,我們有輸出。 – trix

回答

0

問得好!你所要求的實際上是異常值的正確分類:當教學數據中的一小部分不是整個訓練數據的良好表示時。由於通常神經網絡很好地理解了兩個特殊的行在某種程度上是異常的,並且沒有你的幫助就能「理解」它。如果你有1%-5%的異常值,神經網絡或多或少會在你沒有幫助的情況下忽略它們。在我的一些測試中,神經網絡甚至能夠「忽略」10%的異常值。換句話說,神經網絡會將異常值視爲噪聲。你真正需要的是確保你的訓練集和驗證集具有大致相似的異常值百分比。