14
A
回答
17
您可以有幾種方法做到這一點:
要設置減速機的數量對所有豬opeations,您可以使用
default_parallel
屬性 - 但這意味着每一個步驟將使用一個單一的減速機,降低吞吐量:set default_parallel 1;
之前要調用STORE,如果操作中的一個執行是(CO-基團,CROSS,DISTINCT,GROUP,JOIN(內),JOIN(外),和ORDER BY),然後你c一個使用
PARALLEL 1
關鍵字來表示使用單一減速機來完成該命令:GROUP a BY grp PARALLEL 1;
有關更多信息,請參見Pig Cookbook - Parallel Features
15
您還可以使用Hadoop的getmerge命令合併所有這些part- *文件。 這隻有在您從Pig shell(而不是從Java)運行Pig腳本時纔有可能。
這比建議的解決方案更具優勢:因爲您仍然可以使用多個reducer來處理數據,所以您的工作可能運行得更快,尤其是如果每個reducer輸出的數據很少。
grunt> fs -getmerge <Pig output file> <local file>
相關問題
- 1. CSV輸出到一個單元
- 2. 輸出到.CSV?
- 3. PHP輸出到CSV
- 4. 輸出Hirb到CSV
- 5. CSV輸出錯誤訂單
- 6. 將CSV CSV標準輸出到read.csv
- 7. SQL查詢輸出到.csv
- 8. 從Unicode輸出Unicode到CSV
- 9. 將數組輸出到csv
- 10. 輸出查詢到CSV,codeigniter
- 11. workfront api輸出到csv
- 12. Xml文件到CSV輸出
- 13. 輸出beautifulsoup數據到CSV
- 14. CSV輸出到幾列
- 15. 將CSV輸出到數組
- 16. PHP輸出到CSV問題
- 17. scrapy CSV輸出
- 18. Python CSV輸出
- 19. XSLT到CSV:輸出元素到多行
- 20. SQl輸出爲CSV,不帶單引號
- 21. 水壺 - 兩個CSV輸入到PostgreSQL輸出
- 22. django輸出空csv
- 23. 輸出數組CSV
- 24. 用django輸出csv
- 25. CSV輸出爲空
- 26. PHP - 解析一個CSV文件,並寫入輸出到另一個CSV文件
- 27. JasperReports導出CSV,空輸出
- 28. R:與清單的輸出數據幀到csv
- 29. 將單元格數組輸出到CSV文件(MATLAB)
- 30. Python re.findall輸出到CSV只有有時
偉大的東西,克里斯,謝謝! – JasonA 2012-03-29 14:41:45
我不認爲這是理想的,因爲在大輸出數據上使用太少的減速器可能會導致內存不足錯誤。 – FreeTymeKiyan 2017-09-27 18:32:50