0
A
回答
0
我不知道你使用的Spark是在Azure上還是在本地。所以他們是兩種情況,但類似。
要在本地運行的火花,有一個官方blog,介紹如何從星火訪問Azure的Blob存儲。關鍵是您需要在
core-site.xml
文件中將Azure存儲帳戶配置爲HDFS兼容存儲,並將兩個罐子hadoop-azure
&azure-storage
添加到您的類路徑中,以便通過協議wasb[s]
訪問HDFS。您可以參考官方的tutorial來了解HDFS兼容存儲與和blog關於HDInsight配置的更多詳細信息。對於在Azure上運行的Spark,區別僅在於使用訪問HDFS,其他準備工作是在使用Spark創建HDInsight羣集時由Azure完成的。
的方法列出文件是listFiles
或SparkContext
wholeTextFiles
。
希望它有幫助。
相關問題
- 1. 如何從Azure blob容器獲取所有/某些文件(CloudBlockBlob)?
- 2. 如何使用Java從azure blob獲取特定文件的屬性?
- 3. 如何使用Azure存儲模擬器blob端點獲取blob?
- 4. 從Azure Blob存儲使用ascx文件
- 5. 使用VB.NET獲取Azure blob上的容器列表
- 6. 從Azure blob存儲中讀取文件
- 7. Azure Blob存儲列表Blob
- 8. 如何使用git2go/libgit2從blob獲取實際文件?
- 9. Put /使用Android在Azure上獲取BLOB
- 10. 如何獲取Azure Blob存儲的縮略圖PDF文件
- 11. 無法從azure blob容器獲取文件名
- 12. 獲取從Azure Blob修改的最新文件
- 13. 從azure blob存儲內存流中獲取wave文件
- 14. 從MapReduce獲取Azure Blob路徑
- 15. 如何從Azure啓動任務中的blob存儲獲取副本文件?
- 16. 如何使用LINQ從XML文件獲取完整列表?
- 17. 如何在使用blob時獲取azure blob的更新副本狀態StartCopyAsync
- 18. C#從Azure中檢索blob列表
- 19. Node.js Azure OCR - 使用本地文件(blob)
- 20. 我如何直接從URL到Azure Blob獲取數據
- 21. Umbraco/Azure Blob列表緩存
- 22. 如何使用javascript獲取文件夾中的文件列表
- 23. Azure Blob:獲取C中的阻止列表#
- 24. 通過REST獲取更優化的Azure Blob列表
- 25. 無法使列表blob請求(Windows Azure)?
- 26. 從Azure Blob存儲下載文件
- 27. 使用Blob從數據庫獲取文件
- 28. 如何使用PHP從MySQL列出blob文件?
- 29. 如何從文件列表中獲取文件名
- 30. 如何從文件夾結構中獲取文件列表