openai-gym

0熱度

1回答

我是鋼筋學習的完全新手。我對keras-rl代理的輸出層激活函數的選擇有一個疑問。在由keras-rl（https://github.com/matthiasplappert/keras-rl/tree/master/examples）提供的所有示例中，在輸出層中選擇線性激活函數。爲什麼是這樣？如果我使用不同的激活功能，我們會期望什麼效果？例如，如果我使用離散操作空間爲5的OpenAI環境，我還應

1熱度

1回答

運行健身房時，健康檢查返回numpy的屬性錯誤__version__

我想要打開ai健身房的工作，但我面臨着一個非常持久的錯誤。當我運行我的程序時（只是簡單的演示卡車解算器）我得到這個錯誤。（文件「gperm.py」是cartpole解算器） File "gperm.py", line 1, in <module> import gym File "/Users/sonyaferraro/Desktop/dpy/gym/__init__.py", line 4

0熱度

1回答

無法爲FCEUX禁用GUI 2.2.2

我試圖在AWS上運行FCEUX模擬器而沒有圖形渲染，因此我的機器學習算法可以訓練得更快。到目前爲止，我已經嘗試從命令行使用以下命令運行FCEUX： fceux --nogui 1 /home/me/gym/gym/envs/ppaquette_gym_super_mario/roms/super-mario.nes fceux /home/me/gym/gym/envs/ppaquette_g

1熱度

1回答

Mujoco入門步驟：使用Simulate.cpp丟失共享庫

我試圖從Ubuntu 17.04（最新版本）安裝Mujoco（沒有成功）。指令網站：Getting started 版本：mjpro150 linux和/或Linux的mjpro140 我已經有許可證。操作如下：戴上mjkey.txt與倉激活碼= OK 運行simulate.cpp = 錯誤現狀：目錄 [email protected]:~/Documents/mjpro150/bin$

0熱度

1回答

OpenAI無法啓動程序

每當我嘗試在宇宙上運行該程序時，我會在套接字關閉時發生此錯誤。我不知道如何解決這個問題，而且我一直在搞這個問題。我使用的是openAI給出的示例代碼，但由於某種原因，Flash遊戲並未像原本應該那樣加載。有什麼建議麼？順便提一下，我遵循https://github.com/openai/universe給出的python代碼。這是這樣的： import gym import universe

0熱度

1回答

將<class'list'>轉換爲numpy.ndarray

我對python有點新，我正在使用來自OpenAI的miniWOB。我想用cv2打印出我對我的經紀人的觀察結果。但真的沒關係。我的問題是我不知道哪些數據類型從健身房收到我的「觀察」。但是我想把它作爲一個簡單的三維數組。這種格式我可以使用cv2打印出來。所以任何人都可以幫助我將我的<類的列表觀察轉換爲：< type nunpy.ndarray>？我已經嘗試過觀察= np.asarray（觀察），但後

0熱度

1回答

函數逼近器和q學習

我正在嘗試使用動作值近似函數來實現q-learning。我正在使用openai-gym和「MountainCar-v0」環境來測試我的算法。我的問題是，它沒有收斂或找到目標。基本上，approximator的工作方式如下，您可以輸入2個特徵：位置和速度，以及單熱編碼中的3個動作之一：0 - > [1,0,0]，1 - > [ 0,1,0]和2 - > [0,0,1]。對於一個特定的動作，輸出是動

4熱度

1回答

env.render（）for OpenAI後出現錯誤

我試圖讓下面的代碼正常工作。 import gym env = gym.make("CartPole-v0") env.reset() env.render() 我運行的第3線沒有問題，但是當我運行4我得到的錯誤： Traceback (most recent call last): File "<ipython-input-3-a692a1a1ffe7>", line

2熱度

1回答

OpenAI健身房播放器模式

有誰知道如何運行一個OpenAI健身房環境作爲播放器。讓人類玩家玩一輪推車杆？我已經看到有env.mode ='human'，但是我一直無法讓它正常運行。我試圖按照https://www.pinchofintelligence.com/getting-started-openai-gym/給出的例子，但它似乎不適用於我。任何幫助，你可以給予將不勝感激。謝謝

0熱度

1回答

從一個數組

我想用Q學習訓練CatPole-V0餵養tensorflow佔位符。當試圖更新用豐富的經驗，我收到以下錯誤重傳緩衝器： ValueError: Cannot feed value of shape (128,) for Tensor 'Placeholder_1:0', which has shape '(?, 2)' 相關的代碼片段是： def update_replay_buffer(re