我一直在使用單GPU(GeForce GTX 980 Ti,6GB)的適度機器上訓練Inception V3。最大批量大小看起來大約爲40
。在適度的硬件設置上訓練Tensorflow Inception-v3 Imagenet
我已使用inception_train.py
文件中指定的默認學習率設置:initial_learning_rate = 0.1
,num_epochs_per_decay = 30
和learning_rate_decay_factor = 0.16
。一對夫婦的訓練精度最好我能做到的,是如下(約500K-1M迭代)周後:
2016-06-06 12:07:52.245005: precision @ 1 = 0.5767 recall @ 5 = 0.8143 [50016 examples]
2016-06-09 22:35:10.118852: precision @ 1 = 0.5957 recall @ 5 = 0.8294 [50016 examples]
2016-06-14 15:30:59.532629: precision @ 1 = 0.6112 recall @ 5 = 0.8396 [50016 examples]
2016-06-20 13:57:14.025797: precision @ 1 = 0.6136 recall @ 5 = 0.8423 [50016 examples]
我試着朝訓練課結束的設置擺弄,但在準確性方面看不到任何改進。
我已經從頭開始了一個新的培訓課程,其中num_epochs_per_decay
= 10和learning_rate_decay_factor
= 0.001基於本論壇中的一些其他帖子,但它在這裏是黑暗中的一種掌握。
上好的默認值小的硬件設置,像我的任何建議?