0

我一直在加強深讀了學習如這裏:在深度Q /強化學習中預處理是否降低了準確度?

https://www.nervanasys.com/demystifying-deep-reinforcement-learning/

這將是一段時間之前,我明白所有的數學,但不使用的庫阻止我。無論如何,我知道在卷積ANN中,如果你想對圖像進行學習,你必須對圖像進行預處理,否則計算神經網絡所需的計算能力是天文數字。這是否會以任何方式降低網絡的質量?如果是這樣如何?例如,假設您有足夠的計算能力爲網絡提供視頻流中每個高質量圖像的每個像素,以便學習如何達到目標。這會讓網絡更加善於實現其目標嗎?它是否會擴大網絡可以實現的目標類型,可能使其具有更好的泛化能力?

我也在計算機視覺的背景下思考這個問題,你可能有一個機器人推理其環境以學習執行任務。它似乎預處理它收到的圖像將類似於極其殘酷的視線。

回答

1

通過預處理圖像,你的意思是將它們縮放到標準尺寸,如256x256像素?

通過將圖像下采樣到256x256像素的大小,您失去了信息,因此保持高分辨率的圖像應該會給您更好的結果。

但它也將耗費你更多的計算機能力,所以這是不值得的。在Scaling up Image Recognition中,作者聲稱通過使用分辨率爲512x512而不是256x256的圖像,它們實現了較低的錯誤率。然而它只降低了0.54%,這並不多。

在另一個任務中,我猜想使用更高分辨率圖像的效果應該是相似的,它會讓模型看到更多細節,因此它可能會更好,但由於所需計算能力的增加,它可能不值得。

請注意,我提供的鏈接的作者在ImageNet上被捕,所以即使錯誤率的下降可能是真實的,在ImageNet競賽中取得的分數也應該被忽略。

+0

是的,我的意思是縮小比例。我還沒有使用轉換網絡,但我已經採取了一個課程,並開始玩弄一些代碼。我提出這個問題是因爲我想象的是我自己的願景,如果我不得不繼續這樣做,那就是縮小世界的扭曲看法,以及我沒有做得更好。人們會認爲改善會很大。在12MP圖像和256x256之間有很大的區別。也許如果有些測試是用比512更高的東西來完成的?當然有計算需要考慮,雖然重要的是知道保持規模提供什麼也很重要。 – xendi

+0

就像我告訴過你的,我確信有更多的參考文獻,分辨率越高,結果就越好,但是改進的代價是需要更多的計算。 – gcucurull