5
我目前在TensorFlow中實現深度雙Q學習算法。我有一個基於NumPy數組實現的體驗重播緩衝區。但是,一些性能分析表明,使用feed_dict將NumPy數組中的數據饋送到圖形的效率非常低。這也在文檔https://www.tensorflow.org/performance/performance_guide中指出。爲強化學習算法提供高效數據供給
有沒有人有建議可以更有效地完成餵養?使用靜態數據集可以通過輸入管道(如記錄讀取器)完成饋送。然而,體驗重播緩衝區會隨着時間而改變,使得這種類型的餵食更具挑戰性。
任何答案非常感謝,謝謝!