我試圖做一個基於視覺的強化學習機器人爲井字遊戲,並堅持如何保存數據並快速檢索它。有效的方法來存儲數組,並檢查它們是否存在於Python
因此,將數據保存爲例如起始點列表爲[0, 0, 0, 0, 0, 0, 0, 0, 0]
,併爲該[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
啓動策略。
問題是: 在什麼格式,我應該保存當前的狀態和政策,所以我可以訪問它的快速檢查,如果狀態已經存在,並且更新的政策?我在考慮pandas
和pickle
,但發現使用列表實現有點困難。
你想保存什麼樣的數據?你想有效地拿出什麼?數據是否分類? – mrCarnivore
您是否試圖專注於9個元素的列表的性能? – Adirio
數據不會被排序,機器人截取遊戲截圖,將其轉換爲列表並將井字遊戲狀態存儲爲9長列表,但在機器人學習之後會有數千個狀態,並且隨着機器人更新它的策略,我必須檢索狀態是否存在,並且是否存在針對當前狀態的某種策略,否則:將數據附加新狀態和「零策略」。 –