我想使用snow::clusterApply並行應用功能。我的函數在函數的一部分中使用臨時(預定義)種子,但通常應保持獨立的隨機數。每個「工作」都有不同的臨時種子。 我可以做到以下幾點: # setting up cluster of type="SOCK"
library(snow)
cl <- makeSOCKcluster(2)
# this is my function
myfu
我使用的是doSNOW包,更具體地說是parLapply函數對大柵格數據集(操作系統:Windows x64)列表執行重分類(以及後續的其他操作)。 代碼看起來有點像這樣簡約的例子: library(raster)
library(doSNOW)
#create list containing test rasters
x <- raster(ncol=10980,nrow=10900)
我試圖在本地主機上完美工作並行運行R.現在我想切換到多節點設置並在同一網絡中創建多個虛擬機。然而,當我試圖設置羣集時,出現以下錯誤: Error in socketConnection(master, port = port, blocking = TRUE, open = "a+b", :
cannot open the connection
Calls: <Anonymous> ... d
我有一個大的循環,將花費太長時間(〜100天)。我希望能夠通過雪庫加快速度,但我並不擅長應用報表。這只是循環的一部分,但如果我能把這部分弄清楚,其餘部分應該是直截了當的。我可以用一堆apply語句或循環,但是使用函數來獲取對象'p'的應用語句將是理想的。 原始數據 dim(m1) == x x # x >>> 0
dim(m2) == y x # y >>> 0, y > x, y > x-10
我有一個函數,我動態地建立多個公式作爲字符串,並將它們投射到公式爲as.formula。然後我使用doSNOW和foreach以並行處理的方式調用該函數,並通過dplyr::mutate_使用這些公式。 當我使用lapply(formula_list, as.formula)時,在並行運行時出現錯誤could not find function *custom_function*,但在本地運行時工
在R中使用tm包和並行計算時,我遇到了一個問題,我不確定我是在做一些愚蠢的事情還是它是一個錯誤。 我創建了一個小型可重複的例子: # Load the libraries
library(tm)
library(snow)
# Create a Document Term Matrix
test_sentence = c("this is a test", "this is anothe