我看到有hdfs3,毒蛇咬傷等等。哪一個是最好的支持和綜合?使用Python3與HDFS交互的最佳模塊是什麼?
2
A
回答
1
據我所知,並不像人們想象的那樣多。但我建議官方Python包hdfs 2.0.12
可在website或從終端運行下載:
pip install hdfs
的一些特點:
- 的Python(2和3)綁定爲WebHDFS (和HttpFS)API, 支持安全和不安全的羣集。
- 命令行界面 用於傳輸文件並啓動交互式客戶端shell,其別名爲 ,以實現方便的namenode URL緩存。
- 通過 可選擴展的其他功能:avro,可以直接從 HDFS讀取和寫入Avro文件。數據幀,以加載和保存熊貓數據框。 Kerberos,到 支持Kerberos認證的集羣。
1
我試過蛇咬傷,hdfs3和hdfs。
Snakebite只支持下載(不上傳),所以它不適合我。
在這些3只hdfs3的支持HA設置,所以這是我的選擇,但我沒讓它用數據節點的主機名(這裏所描述的問題:https://rainerpeter.wordpress.com/2014/02/12/connect-to-hdfs-running-in-ec2-using-public-ip-addresses/)與multihomed networks工作
所以我結束使用hdfs(2.0.16),因爲它支持上傳。我不得不使用bash添加一些解決方法來支持HA。
PS。有一篇比較有趣的文章比較了爲與Hadoop文件系統交互而開發的Python庫,文章位於http://wesmckinney.com/blog/python-hdfs-interfaces/
相關問題
- 1. 跨模塊使用變量的最佳方法是什麼? (Python3)
- 2. 什麼是編寫和測試交互式python3代碼的最佳工具?
- 3. 使用Yii2與外部API進行交互的最佳實踐是什麼?
- 4. 使用C#4.0與Excel進行交互的最佳方式是什麼?
- 5. 處理彼此使用模塊的最佳方式是什麼?
- 6. 什麼是java和javascript交互的最佳方式?
- 7. 交互式數據可視化的最佳語言是什麼?
- 8. 調試SOAP交互的最佳方式是什麼?
- 9. python中交互式調試的最佳方式是什麼?
- 10. 與AmpersandJS一起使用的最佳模板系統是什麼?
- 11. 如何使mahout與hadoop HDFS交互
- 12. 什麼是顯示和與技能樹交互的最佳方式
- 13. 與ICQ交互的最佳C++庫?
- 14. 什麼是引用父/包含nodejs模塊的最佳方式?
- 15. 模型與另一個類的模型進行交互時,組織Rspec測試的最佳方法是什麼?
- 16. https應該使用什麼python web交互模塊?
- 17. 什麼是與DLL互相溝通的最佳方式
- 18. 什麼是可用於將Aramex模塊與Magento 1.9.2集成的最佳擴展?
- 19. 與Singleton交互的最有效方式是什麼?
- 20. 什麼是OCaml中的HttpRequest的最佳模塊
- 21. 什麼是創建交互式應用程序原型的最佳方式?
- 22. 什麼是在用戶交互後旋轉圖像的最佳方式
- 23. 使用現有代碼與MySQL交互的網站的最佳方法是什麼?
- 24. 什麼是創建新遊戲的最佳方式! 2.1模塊?
- 25. 什麼是創建ASP.NET門戶和模塊的最佳實踐?
- 26. 命名空間AMD模塊的最佳途徑是什麼?
- 27. 什麼是組織遊戲模塊的最佳方式
- 28. 什麼是lighttpd的最佳緩存模塊?
- 29. 什麼是node.js的最佳控制流模塊?
- 30. 什麼是Maven模塊命名的最佳實踐?