sparklyr

    2熱度

    1回答

    我試圖複製[R數據框星火2.0.1使用copy_to功能,但它說 根刮DIR:HDFS上的/ tmp /蜂巢應可寫。當前的權限是:RW-RW-RW- 我執行winutils.exe更改權限,但我仍然得到許可的相同的異常。 %HADOOP_HOME%\bin\winutils.exe chmod 777 \tmp\hive 我試着命令的其他變體一樣 - %HADOOP_HOME%\bin\win

    3熱度

    2回答

    我在CSV使用SpraklyR schema <- structType(structField("TransTime", "array<timestamp>", TRUE), structField("TransDay", "Date", TRUE)) spark_read_csv(sc, filename, "path", infer_schema = FALSE, sch

    1熱度

    2回答

    我有一個字符串,它是yyyymmdd,並且想要將它變成使用sparklyr的日期對象,以便我可以從另一箇中減去一個日期。 此代碼爲yyyy-mm-dd hr:min:sec temp_table <- taxi %>% mutate(hrs = (unix_timestamp(tpep_dropoff_datetime) - unix_timestamp(tpep_pickup_datetime

    2熱度

    2回答

    我試圖在sparklyR中綁定兩個不同的數據框(具有相同的行數 - 行匹配)的簡單操作。 例如: library(sparklyr) library(dplyr) sc <- spark_connect(master = "local[*]") iris_tbl <- copy_to(sc, iris, name="iris", overwrite=TRUE) #check colum

    -1熱度

    1回答

    R未檢測到爲使用sparklyr軟件包而安裝的最新Java版本(1.8)。 config <- spark_config() config$sparklyr.gateway.port = 10000 config$sparklyr.gateway.connect.timeout = 1 config$sparklyr.gateway.start.wait = 1000 library(sp

    1熱度

    1回答

    我在Spark中使用SparklyR和Spark 2.0.2調用邏輯迴歸後出現以下錯誤。 ml_logistic_regression(Data, ml_formula) 我讀入Spark的數據集比較大(2.2GB)。以下是錯誤消息: Error: org.apache.spark.SparkException: Job aborted due to stage failure: Task

    0熱度

    2回答

    我想讀取一個csv文件到與谷歌計算羣集中的sparklyr包的結構。這是配置: 測試星火框架 install.packages("sparklyr") install.packages("dplyr") library(sparklyr) spark_install(version = "1.6.2") Sys.setenv(SPARK_HOME="/usr/lib/spark")

    1熱度

    1回答

    library(sparklyr) library(dplyr) home <- "/usr/hdp/current/spark-client" sc <- spark_connect(master = "yarn-client", spark_home = home, version = "1.6.2") readFromSpark <- spark_read_csv(sc, name=

    0熱度

    1回答

    sparklyr中的sdf_register和copy_to命令之間有什麼區別? 你什麼時候使用每個命令?

    2熱度

    1回答

    新的虛擬變量列我試圖創建一個sparklyr模型矩陣。有一個功能ml_create_dummy_variables()用於一次爲一個分類變量創建虛擬變量。據我所知,沒有model.matrix()等同於創建一個模型矩陣。這很容易使用ml_create_dummy_variables(),但我不明白爲什麼新的虛擬變量不存儲在Spark數據框中。 考慮這個例子: ###create dummy dat