有沒有辦法直接使用HDFS路徑從HDFS讀取任何文件格式,而不必從HDFS本地讀取文件並讀取它。直接從HDFS讀取文件
1
A
回答
2
你必須拉整個文件。無論您使用的是cat
還是text
命令,整個文件仍將流式傳輸到您的shell。命令結束時只剩下文件的剩餘部分。所以,如果你計劃幾次檢查文件,最好get
它
作爲一個hdfs客戶端,你必須聯繫namenode獲取特定文件的所有塊位置。
1
可以與HDFS DFS嘗試-cat
用法:HDFS DFS -cat [-ignoreCrc] URI [URI ...]
hdfs dfs -cat /your/path
2
您可以在HDFS使用cat
命令來讀取正規文本文件。
hdfs dfs -cat /path/to/file.csv
讀取壓縮文件一樣gz, bz2
等,你可以使用:
hdfs dfs -text /path/to/file.gz
這些都是Hadoop的原生支持使用FsShell
comamnds兩種讀法。對於其他複雜文件類型,您將不得不使用更復雜的方式,例如Java程序或其他類似的東西。
2
HDFS DFS - 貓/路徑或Hadoop的FS - 貓/路徑
相關問題
- 1. 直接從HDFS讀取文件到shell函數中
- 2. 能否直接讀取存儲在HDFS中的文件?
- 3. 直接從zip中讀取HTML文件
- 4. 從HDFS讀取簡單的Avro文件
- 5. 如何從hdfs讀取文件
- 6. 從pyspark讀取hdfs中的文件
- 7. 從HDFS讀取文件時出現MalformedURLException
- 8. 無法從HDFS讀取文件
- 9. 從遠程HDFS讀取文件
- 10. 如何強制直接從HDFS讀取Apache Mahout應用程序
- 11. 讀入csv文件從HDFS
- 12. 使用HDFS從HDFS讀取文件Java API
- 13. 在HDFS中直接生成文件
- 14. 直接從csv讀取var
- 15. 如何直接讀取dbf/dbt文件?
- 16. 在Java中讀取一個文件hdfs
- 17. 在eclipse中讀取HDFS文件
- 18. 直接HDFS訪問
- 19. 從文件中讀取直到EOF
- 20. 使用pyspark直接從網站讀取json文件
- 21. 無法直接從使用javascript的路徑讀取excel文件
- 22. 駱駝從直接讀取文件和過程
- 23. 如何直接從網頁讀取/寫入本地文件(html)
- 24. C庫直接從文件流中讀取和解析JSON
- 25. 在C++中直接從文件讀取數據到RAM
- 26. 直接從Python網站讀取csv文件3
- 27. 從文件讀取整數值並直接輸入到程序
- 28. 如何直接從服務器與Python讀取Excel文件
- 29. 直接向/從內存讀取/寫入Excel文件
- 30. 直接從文件中讀取大量bmp數據
標記爲答案,因爲它致意所有其他的答案 – Newb101