我在HDFS @/user/Cloudera/Test/中有一些數據。我非常能夠通過運行「hdfs -dfs -cat Test/」來查看記錄。用於HDFS文件系統的網址
現在是同一個文件,我需要它在scala中讀作RDD。 我已經在scala shell中嘗試了以下內容。
VAL文件= sc.textFile( 「HDFS://quickstart.cloudera:8020 /用戶/ Cloudera的/測試」)
然後我已經寫一些過濾器和用於循環讀取詞語的但是,當我最後使用Println時,它說沒有找到文件。
任何人都可以請幫助我知道在這種情況下什麼是HDFS網址。 注:我使用了Cloudera CDH5.0 VM
那麼'/ user/Cloudera/Test /'是一個文本文件?它似乎更像是一個文件夾 –