當人們嘗試用CNN解決語義分割的任務時,他們通常在訓練期間使用softmax-crossentropy損失(參見Fully conv. - Long)。但是,當比較不同方法的表現時,比如交叉口聯合度量就會被報告。爲什麼不使用IOU進行培訓?
我的問題是爲什麼不直接培訓他們想要優化的措施?對我而言,在培訓期間對某種程度的訓練似乎很古怪,但對另一種基準評估方法進行評估。
我可以看到IOU對訓練樣本存在問題,其中類不存在(union = 0,intersection = 0 =>零除零)。但是,當我可以確保每個我的基本事實樣本都包含所有類別時,是否有另一個不使用這種方法的原因?
可能要包括一些數學這裏,使這個不鏈接唯一的答案。他們的算法與[Y.Wang等人](http://www.cs.umanitoba.ca/~ywang/papers/isvc16.pdf)類似。粗略地說,'I = = sum(Y * Y')'和'U〜= sum(Y + Y' - Y * Y')'。你的論文使用「I/U」的負數日誌,而我鏈接的使用「1-I/U」。我喜歡負面的日誌形式,但我很快就會嘗試。你也在I/U之後而不是之前總結。 – Poik
以我個人的觀點來看,對訓練集中的每個樣本計算I/U,然後進行求和,這在物理上更爲合理。通過這種方式,您可以根據每個樣本評估準確度,並將單個誤差加起來。首先執行總和可能會導致錯誤取消('sum(I)/ sum(U)'可能會給出好的分數,而'sum(I/U)'可能不會用於相同的數據)。雖然我絕不是專家 – MPA