openai-gym

    0熱度

    1回答

    我是鋼筋學習的完全新手。我對keras-rl代理的輸出層激活函數的選擇有一個疑問。在由keras-rl(https://github.com/matthiasplappert/keras-rl/tree/master/examples)提供的所有示例中,在輸出層中選擇線性激活函數。爲什麼是這樣?如果我使用不同的激活功能,我們會期望什麼效果?例如,如果我使用離散操作空間爲5的OpenAI環境,我還應

    1熱度

    1回答

    我想要打開ai健身房的工作,但我面臨着一個非常持久的錯誤。當我運行我的程序時(只是簡單的演示卡車解算器)我得到這個錯誤。 (文件「gperm.py」是cartpole解算器) File "gperm.py", line 1, in <module> import gym File "/Users/sonyaferraro/Desktop/dpy/gym/__init__.py", line 4

    0熱度

    1回答

    我試圖在AWS上運行FCEUX模擬器而沒有圖形渲染,因此我的機器學習算法可以訓練得更快。到目前爲止,我已經嘗試從命令行使用以下命令運行FCEUX: fceux --nogui 1 /home/me/gym/gym/envs/ppaquette_gym_super_mario/roms/super-mario.nes fceux /home/me/gym/gym/envs/ppaquette_g

    1熱度

    1回答

    我試圖從Ubuntu 17.04(最新版本)安裝Mujoco(沒有成功)。 指令網站:Getting started 版本:mjpro150 linux和/或Linux的mjpro140 我已經有許可證。 操作如下: 戴上mjkey.txt與倉激活碼= OK 運行simulate.cpp = 錯誤 現狀: 目錄 [email protected]:~/Documents/mjpro150/bin$

    0熱度

    1回答

    每當我嘗試在宇宙上運行該程序時,我會在套接字關閉時發生此錯誤。我不知道如何解決這個問題,而且我一直在搞這個問題。我使用的是openAI給出的示例代碼,但由於某種原因,Flash遊戲並未像原本應該那樣加載。有什麼建議麼? 順便提一下,我遵循https://github.com/openai/universe給出的python代碼。這是這樣的: import gym import universe

    0熱度

    1回答

    我對python有點新,我正在使用來自OpenAI的miniWOB。我想用cv2打印出我對我的經紀人的觀察結果。但真的沒關係。我的問題是我不知道哪些數據類型從健身房收到我的「觀察」。但是我想把它作爲一個簡單的三維數組。這種格式我可以使用cv2打印出來。所以任何人都可以幫助我將我的<類的列表觀察轉換爲:< type nunpy.ndarray>?我已經嘗試過觀察= np.asarray(觀察),但後

    0熱度

    1回答

    我正在嘗試使用動作值近似函數來實現q-learning。我正在使用openai-gym和「MountainCar-v0」環境來測試我的算法。我的問題是,它沒有收斂或找到目標。 基本上,approximator的工作方式如下,您可以輸入2個特徵:位置和速度,以及單熱編碼中的3個動作之一:0 - > [1,0,0],1 - > [ 0,1,0]和2 - > [0,0,1]。對於一個特定的動作,輸出是動

    4熱度

    1回答

    我試圖讓下面的代碼正常工作。 import gym env = gym.make("CartPole-v0") env.reset() env.render() 我運行的第3線沒有問題,但是當我運行4我得到的錯誤: Traceback (most recent call last): File "<ipython-input-3-a692a1a1ffe7>", line

    2熱度

    1回答

    有誰知道如何運行一個OpenAI健身房環境作爲播放器。讓人類玩家玩一輪推車杆?我已經看到有env.mode ='human',但是我一直無法讓它正常運行。我試圖按照https://www.pinchofintelligence.com/getting-started-openai-gym/給出的例子,但它似乎不適用於我。 任何幫助,你可以給予將不勝感激。 謝謝

    0熱度

    1回答

    我想用Q學習訓練CatPole-V0餵養tensorflow佔位符。當試圖更新用豐富的經驗,我收到以下錯誤重傳緩衝器: ValueError: Cannot feed value of shape (128,) for Tensor 'Placeholder_1:0', which has shape '(?, 2)' 相關的代碼片段是: def update_replay_buffer(re