我有以下問題。R:makeCluster中的錯誤(多核):無法打開連接
爲什麼在標準節點上提交作業(最大內核數爲56)時一切正常,但是當我向large_memory節點(最大內核數128)提交相同的作業/代碼時,出現錯誤?
- 並行化代碼中R:
no_cores < - detectCores() - 1
CL < - makeCluster(no_cores,OUTFILE = paste0( './ info_parallel.log'))
- ERROR ...
在錯誤SocketConnection處(主,端口=端口,集團王= TRUE,開= 「A + B」:
無法打開連接
電話:... doTryCatch - > recvData - > makeSOCKmaster - > SocketConnection處
另外:警告消息:
在SocketConnection處(主,端口=端口,阻斷= TRUE,開放= 「A + b」,:
本地主機:11232不能被打開
執行暫停
錯誤在反序列化(節點$ CON):從連接讀取錯誤
電話:... doTryCatch - > recvData - > recvData.SOCKnode - >反序列化
執行停止
錯誤在反序列化(節點$ CON):從連接讀取錯誤
電話:... doTryCatch - > recvData - > recvData.SOCKnode - >反序列化
執行停止
正如我所說的R代碼運行的標準節點上細,因此我假定它與large_memory節點的問題。那可能是什麼?
謝謝,
谷歌搜索的許多答案是以下答案: 可能是防火牆站在計算節點和登錄節點之間,或者登錄節點不允許連接到計算節點的端口11232。 - 我嘗試從登錄節點ssh到計算節點;然後直接在計算節點上運行R代碼。或者將連接設置到端口11232.但仍然有相同的錯誤。 –