4

如果我想研究機器人的RL算法,我應該如何使用Gazebo OpenAI Gym來測試,訓練和測試算法?我是否應該從OpenAI Gym開始,並將具有良好分數的算法帶入Gazebo環境以用於真實世界的場景?OpenAI Gym and Gazebo測試機器人RL算法?

+0

爲什麼不是兩個? ;-) [將OpenAI Gym擴展爲機器人:使用ROS和Gazebo進行強化學習的工具包](https://arxiv.org/pdf/1608.05742.pdf) –

+0

@TokeFaurby This pdf is what that made me question this question。如果兩者都可以組合使用,那麼RL算法是否應該先在OpenAI Gym上進行測試,然後在Gazebo上進行高分測試?還是有更好的方法?[這也是我最初的問題,但建議的編輯使其探索其他可能性] – shivangg

+0

歡迎!我正在研究一個類似的項目。我將開始實施[深度強化學習的持續控制](https://arxiv.org/abs/1509.02971)DeepMind論文(使用OpenAI健身房)。一旦你有這個工作,我會轉移到Gazebo。 PS請將所有相關信息添加到OP中(即您應該提及該文件,這會使幫助變得更容易) –

回答

4

因素採摘時的框架內

  • 工作需要多少時間需要起牀,不管你選擇要加快考慮?
  • 環境中的性能能否可靠地預測實際機器人的性能?
  • 需要多少錢?

如果您希望您的方法最終適用於實際的機器人,您應該在密切模擬您的目標環境和平臺的環境中進行測試。 OpenAI體育館的first party robot simulation environments使用MuJuCo,這不是免費的。此外,這些模擬對於玩具控制設置比實際的機器人問題更多。你可以更好地編寫ROS節點並在Gazebo中模擬你的問題。你也可以看看Erle Robotics的gym-gazebo這個工具,它可以讓你在健身房和ROS之間架起一座橋。