我在多節點Linux集羣上運行R。我想在不使用並行計算軟件(如MPI或雪)的情況下使用腳本或批處理模式在R上運行我的分析。R編程 - 使用PBS在多節點linux集羣上提交作業
我知道這可以通過劃分輸入數據,使每個節點運行不同部分的數據。
我的問題是我該如何解決這個問題?我不知道我應該如何編寫我的腳本。一個例子會非常有幫助!
我一直在使用PBS運行我的腳本,但它似乎只運行在一個節點上,因爲R是單線程程序。因此,我需要弄清楚如何調整我的代碼,以便將勞動力分配給所有節點。
這是我到目前爲止已經做的:
1)命令行:
> qsub myjobs.pbs
2)myjobs.pbs:
> #!/bin/sh
> #PBS -l nodes=6:ppn=2
> #PBS -l walltime=00:05:00
> #PBS -l arch=x86_64
>
> pbsdsh -v $PBS_O_WORKDIR/myscript.sh
3)的MyScript .sh:
#!/bin/sh
cd $PBS_O_WORKDIR
R CMD BATCH --no-save my_script.R
4)my_script.R:
> library(survival)
> ...
> write.table(test,"TESTER.csv",
> sep=",", row.names=F, quote=F)
任何建議將不勝感激!謝謝!
-CC
您確定pbs啓動多個實例嗎? 嘗試在作業批處理文件 – Anycorn 2010-06-29 21:25:35