我正在使用降雪進行並行計算。我總是隻在一臺機器上安裝多個CPU(> 20個內核)。我正在處理大量數據(> 20GB)。 sfExport()需要很長時間。什麼時候需要使用sfExport(R降雪包)
當我在我的筆記本電腦上運行我的測試代碼並檢查CPU使用情況時,有時也會在沒有sfExport()的情況下運行。
我的代碼的某些部分嵌套了sfLapply()函數。像:
func2 <- function(c,d, ...) {
result <-
list(x = c+d,
y = ..,
...
)
return(result)
}
func1 <- function(x, a, b, c, ...) {
library(snowfall)
d <- a+b
result <- sfLapply(as.list(b$row), func2, c, d, ...)
return(result)
}
result <- sfLapply(as.list(data.table$row), func1, a, b, c, ..)
我什麼時候需要將數據導出到所有CPU?
感謝和問候 尼科