本質上,我有一個大的數據框:10,000,000x900(行,列),我試圖並行地轉換每列的類。最終的結果必須是一個data.frameR並行大型數據幀轉換
這裏就是我有這麼遠:
假裝df
是已經定義的數據幀,所有列是數字和字符類的混合物
library(snow)
cl=makeCluster(50,type="SOCK")
cl.out=clusterApplyLB(cl,df,function(x)factor(x,exclude=NULL))
cl.out
是我想要的,只是我需要的是這是一個data.frame類列表
所以這是我卡住...我要嘗試,並結合所有的元素cl.out到data.frame w這不會是平行的嗎? (SLOW,時間是個問題)
我可以使用不同的包來實現其他東西嗎? (foreach?)
我必須硬編碼一些c纔能有效地完成這項工作嗎?
任何幫助,將不勝感激。
感謝,
轉換是相當緩慢的使用過程。我相信還有比簡單地將類屬性附加到數據blob上更多的東西。 –
它不是很乾淨,但可以嘗試直接更改屬性: 'class(cl.out)< - 「data.frame」'。 –