我想讀取一個csv文件到與谷歌計算羣集中的sparklyr包的結構。這是配置:閱讀csv函數sparklyr錯誤
測試星火框架install.packages("sparklyr")
install.packages("dplyr")
library(sparklyr)
spark_install(version = "1.6.2")
Sys.setenv(SPARK_HOME="/usr/lib/spark")
config <- spark_config()
sc <- spark_connect(master = "yarn-client", config=config ,version = "1.6.2")
有表示「無效參數」的錯誤只是粘貼,我將用於spark_read_csv功能路徑字符串後。即使我沒有點擊保存按鈕,它也會彈出。
任何想法,爲什麼我得到這個錯誤?有趣的是,我只是在amazon EMR中嘗試了相同的安裝配置,並且遇到了同樣的問題。
感謝您的建議schristel,但我使用了spack_read_csv指南中指出的格式,但仍然遇到錯誤。在谷歌計算的情況下,我將文件傳輸到rstudio工作區,並嘗試使用「file:// home/ruser/filename」和「file:/// home/ruser/filename」。 –
好吧,如果沒有可重複使用的例子,我無法排除故障,但是運氣好。如果您找到解決方案,請跟進! – schristel
謝謝Schristel。這是我如何設置命令:secondary_two_tbl < - spark_read_csv(sc,「SECONDARYtwo.csv」, path =「file:/// home/ruser/sparkly-blog」) –