2017-08-08 105 views
1

我有對象檢測API的問題,我的損失是從訓練開始非常低:從訓練開始低損耗Tensorflow對象檢測API

信息:tensorflow:全球第3步:損失= 1.6555(1.949秒/步)

INFO:tensorflow:全球步驟4:損耗= 1.1560(2.021秒/步)

INFO:tensorflow:全球步驟5:損耗= 1.7363(2.201秒/步)

幾千步之後的mAP大約是0.25 ... tensorflow是否在其他地方保存了一些額外的「檢查點」而不是培訓文件夾?這似乎是模型使用以前訓練過的網絡的權重,即使有配置路徑在新鮮的檢查點和一切都在不同的文件夾:(

我正在關注如何訓練模型的博客教程[https://medium.com/towards-data-science/how-to-train-your-own-object-detector-with-tensorflows-object-detector-api-bec72ecfe1d9]對象檢測API我使用自己的數據集,只有一個類(只有幾個圖像來測試它的工作)和自己的配置(更快的rcnn resnet101),它做得很好,模型能夠檢測新圖像上的類,然後嘗試但是現在我想在大型的400幅圖像上訓練,首先我嘗試了4個類,並且出現了低損失的問題,所以我嘗試了僅僅一個類(我甚至再次將我的數據集標記爲只有一個類)再次相同。現在,即使在以前的配置上,我在乞討中訓練的幾張圖片也無法正常工作。

有人可以幫忙嗎? 因爲現在即使是之前工作過的5張圖像配置不藏漢工作,我不認爲它相關的壞數據集或東西.. :(

回答

1

雖然這不是我可以這樣說your're不是安慰你答案我開始使用相同的模型並且經歷了低損失,我的初始訓練是完全失敗的,所以我決定合理地整理我的數據集並使用更高精度的預先設置重新訓練模型(以前我使用過移動網絡),因此我遇到了低初始損失問題

到目前爲止,我只是隨它一起滾動,讓你知道它是否以滿意的方式工作,也許它應該是這樣(懷疑它非常多) 。

編輯 - 正如有人提到我沒有發佈對這個問題的答案,所以這是我對這個問題的更新。我以很低的起跑損失訓練了很多車型,並且在訓練開始時平均損失達到了0.002。我發現(至少在我的情況下),你訓練這種模型的時間越長,它會產生更糟糕的結果。我最好的演員被凍結在2,5千步,而那些繼續10k +的演員極其容易出現誤報。我猜如果你遇到非常低的起跑損失,你不應該讓它跑很長一段時間。無法解釋這是如何工作的,因爲我對機器學習很陌生,但這是來自我個人的經驗。希望這可以幫助至少一點點

+0

這不是答案,不能放在答案部分 – Ibo

+0

對不起,做了更新,希望現在好一點。 –