在本地運行PIG腳本和mapreduce之間的實際區別是什麼? 我知道mapreduce模式是當你在安裝hdfs的集羣上運行它時。這是否意味着本地模式不需要HDFS,因此即使mapreduce作業也不會被觸發?有什麼區別,你什麼時候有另一個?PIG local和mapreduce模式之間的區別
8
A
回答
8
本地模式將建立一個模擬的mapreduce作業,運行在磁盤上的本地文件中。理論上相當於MapReduce,但它不是一個「真正的」先生的工作。你不應該能夠從用戶的角度來分辨差異。
本地模式非常適合開發。
6
本地模式:所有腳本都在一臺機器上運行,不需要Hadoop MapReduce和HDFS。這對於開發和測試Pig邏輯非常有用。如果您使用一小部分數據來開發或測試您的代碼,那麼本地模式可能比通過MapReduce基礎架構更快。
本地模式不需要Hadoop。在本地模式下運行時,Pig程序在本地Java虛擬機的上下文中運行,並且數據訪問是通過單個機器的本地文件系統訪問的。本地模式實際上是Hadoop的LocalJobRunner類中MapReduce的本地模擬。
MapReduce模式(也稱爲Hadoop模式):Pig在Hadoop集羣上執行。在這種情況下,Pig腳本被轉換爲一系列MapReduce作業,然後在Hadoop集羣上運行。
如果您有一個要執行操作的數據並希望以交互方式開發一個程序,您可能很快就會發現事情變得非常緩慢,並且您可能會開始增加存儲量。本地模式允許您以更加交互的方式處理數據的一部分,以便您可以找出Pig程序的邏輯(並計算出錯誤)。
當您按照自己的意願設置好自己的操作並且操作平穩運行之後,就可以使用MapReduce模式針對完整數據集運行該腳本。
相關問題
- 1. PTX - .local和.param之間的區別
- 2. lambdas中的[&captured]和[&local = captured]之間的區別是什麼?
- 3. Vistor模式和狀態模式之間的區別?
- 4. 網絡模式和非網絡模式之間的區別
- 5. 火花獨立模式和本地模式之間的區別?
- 6. 代理模式和適配器模式之間的區別?
- 7. 本機模式和集成模式之間的區別
- 8. 怪癖模式和標準模式之間的區別JavaScript
- 9. 構造器模式和原型模式之間的區別
- 10. // * [local-name()='element']和// *:element?之間的區別是什麼?
- 11. 現有的MapReduce和YARN之間的區別(MRv2)
- 12. mapreduce分割和火花分割之間的區別
- 13. 擴展和模塊之間的區別?
- 14. 模板include和jquery.load之間的區別?
- 15. MVVM - 模型和ViewModel之間的區別
- 16. 模塊和封閉之間的區別
- 17. C++:NVI和模板方法模式之間的區別?
- 18. 模塊模式中get/set和Object.defineProperty之間的區別
- 19. 模板方法(分離)和策略模式之間的區別?
- 20. rm和mp3格式之間的區別
- 21. 「。」之間的區別和 「$」 表達式
- 22. 特權模式,內核模式和超級用戶模式之間的區別
- 23. 之間的〜/和的區別../
- 24. ASP.NET中的SessionState中的「InProc」和「stateServer」模式之間的區別
- 25. '#','%'和'$'之間的區別
- 26. {!!之間的區別!!}和{{}}
- 27. '+ ='和'= +'之間的區別?
- 28. 「。+」和「。+?」之間的區別
- 29. .eq之間的區別。和==
- 30. #。/和#之間的區別。 ./
需要注意的一件事是,本地模式下不支持計數器,但這是由於Hadoop Map/Reduce而不是Pig。 – cyang 2012-07-28 00:51:10