2
使用SparkR,我想知道是否有可能一個Spark數據幀轉換成H2O框架?轉換SparkR數據幀,以H2O框架
我見過將R data.frames
轉換爲h2o幀的例子,但遺憾的是,這不是一個可行的選項(數據大小)。
我知道這是可能使用sparklyr
和rsparkling
創建H2O框架,但我不使用HIVE,或者Hadoop的,sparklyr
或rsparkling
。
相反,我的目標是從這個sdf
轉換:
set.seed(123)
df<- data.frame(ColA=rep(c("dog", "cat", "fish", "shark"), 4), ColB=rnorm(16), ColC=rep(seq(1:8),2))
sdf<- SparkR::createDataFrame(df)
成這樣:
as.h2o(sdf, destination_frame = "hsdf") # fails, came from Spark (SparkR)
as.h2o(df, destination_frame = "hdf") # succeeds, but this is a regular R data.frame
希望有人想出一個辦法做到這一點使用什麼SparkR可以提供。我認爲這將是一個巨大的福音於R用戶。