sparkr

    0熱度

    3回答

    查找平均火花數據框的所有數值型變量的我有一個星火數據框與下面的結構出現在R: - Var1----- Var 2----- Var 3 ------- Var 4----- Group 98.64---- 32.35---- 11906.91-- 08.65----- A 94.83---- 29.36---- 17287.57-- 06.01----- B 99.94---- 35.3

    1熱度

    1回答

    我在本地筆記本電腦上使用RStudio並嘗試連接到現有的遠程HDInsight Spark羣集。 幾個問題: 1)我需要在HDInsight星火集羣已經安裝RStudio? 2)如何將本地RStudio連接到遠程Spark羣集?我一直在看SparkR文檔here,但似乎沒有給出連接示例(即URL,憑證等)?

    0熱度

    1回答

    將火花數據幀寫入csv和實木複合地板時發生錯誤。我已經嘗試安裝winutil,但仍未解決錯誤。 我的代碼 INVALID_IMEI <- c("","000000000000000") setwd("D:/Revas/Jatim Old") fileList <- list.files() cdrSchema <- structType(structField("da

    0熱度

    1回答

    我想知道是否有方法來計算火花數據框每列中不同項目的數量?也就是說,給定數據集: set.seed(123) df<- data.frame(ColA=rep(c("dog", "cat", "fish", "shark"), 4), ColB=rnorm(16), ColC=rep(seq(1:8),2)) df 我這樣做R中獲得的計數: sapply(df, function(x){le

    0熱度

    1回答

    我可以在url http://ec2-54-186-47-36.us-west-2.compute.amazonaws.com:8080/看到我有兩個工作節點和一個主節點,它顯示了spark集羣。我的2工作節點和1個主運行命令JPS我可以看到,所有的服務都起來。 下面的腳本,我使用初始化SPARKR會議。 if (nchar(Sys.getenv("SPARK_HOME")) < 1) {

    1熱度

    1回答

    我正在使用SparkR構建一些舊代碼的新版本。在這樣的 hiveContext <- sparkRHive.init(sc) hive_db = 'our_database' db <- sql(hiveContext, paste0("use ", hive_db)) 塊我聽說'sparkRHive.init' is deprecated. Use 'sparkR.session' in

    1熱度

    2回答

    我有一個SparkR數據幀組的最後一個值,如下所示: #Create R data.frame custId <- c(rep(1001, 5), rep(1002, 3), 1003) date <- c('2013-08-01','2014-01-01','2014-02-01','2014-03-01','2014-04-01','2014-02-01','2014-03-01','20

    0熱度

    2回答

    如何爲火花數據框執行以下任務。 在dplyr,我這樣做: library(dplyr) df1 <- data.frame(x = 1:10, y = 101:110) df2 <- data.frame(r = 5:10, s = 205:210) df3 <- df1 %>% filter(x %in% df2$r) 如何爲sparkR數據框執行(以%DF2 $ R X%)命令過濾器

    0熱度

    1回答

    如何爲Spark數據框以特定格式投射字符串? 2.2或更高版本 df = data.frame(dt1 = c("22DEC16", "12JUN16"), x = c(10,20)) df = df %>% mutate(dt2 = as.Date(dt1, "%d%b%y")) > df dt1 x dt2 1 22DEC16 10 2016-12-22 2 12JUN

    2熱度

    1回答

    使用SparkR,我想知道是否有可能一個Spark數據幀轉換成H2O框架? 我見過將R data.frames轉換爲h2o幀的例子,但遺憾的是,這不是一個可行的選項(數據大小)。 我知道這是可能使用sparklyr和rsparkling創建H2O框架,但我不使用HIVE,或者Hadoop的,sparklyr或rsparkling。 相反,我的目標是從這個sdf轉換: set.seed(123)