1
A
回答
0
這是可能的。當豬腳本由Oozie運行時,它將作爲單圖映射縮減作業運行,該作業僅運行豬腳本,然後運行其他映射減少作業(當豬以mapred
模式運行時)。
看來,Pig動作配置不允許在本地模式下運行,但您仍然可以使用shell動作類型以本地模式運行Pig腳本。您只需確保您的腳本,輸入和輸出數據都在HDFS中。
0
我不認爲,我們可以從oozie以本地模式運行豬。維沙爾寫的評論是有道理的。在某些情況下,如果數據量較少,最好在本地模式下使用豬。要以本地模式運行,您可以通過編寫shell腳本並在crontab中安排它來運行。如果您通過oozie嘗試此操作。根據我的知識,這將不太合適,因爲Oozie是爲了在HDFS中運行。
如果你想oozie運行一些數據。它預計數據將在HDFS中(即分佈式)。而且您必須在hdfs.s中擁有豬腳本。我從AlanGates看到帖子,他提到PIG用於處理來自/到HDFS的數據,而配置單元用於本地到HDFS或HDFS到HDFS。
相關問題
- 1. 運行PIG腳本
- 2. 運行oozie時Hadoop日誌
- 3. 使用Oozie運行級聯
- 4. 執行算術運算Pig
- 5. 運行Cassandra + Pig時出錯
- 6. JAVA_HOME錯誤運行時PIG
- 7. oozie:運行數百個並行工作
- 8. 從oozie運行但沒有在命令行運行時,Sqoop失敗
- 9. 從Oozie的
- 10. 從失敗節點重新運行的Oozie協調器動作
- 11. 從Pig中提取一行
- 12. 使用Pig運行字符串通過Java使用Pig
- 13. 運行Oozie時出現問題
- 14. 運行shell腳本oozie動作
- 15. 使用Cloudera VM運行Oozie問題
- 16. 使用oozie運行多個mapreduce作業?
- 17. 通過oozie運行查詢(無腳本)
- 18. Oozie協調員動作重新運行
- 19. 如何部署和運行oozie工作?
- 20. 運行oozie fork時出現LeaseExpiredException
- 21. 在oozie shell動作中運行豬
- 22. 通過oozie運行shell腳本
- 23. Apache Pig,程序運行問題
- 24. Datastax Cassandra PIG只運行一個MAP
- 25. 在Pig中運行UDF時出錯
- 26. 使用JAVA和UNIX運行Pig命令
- 27. Oozie的SSH行動
- 28. Oozie的SSH行動
- 29. Bigquery命令從oozie工作流程運行失敗
- 30. Oozie shell操作 - 從shell問題運行配置單元問題
感謝您的回答 但本地模式下的Pig從本地文件系統加載/存儲數據而不是HDFS。 保持對hdfs的豬是有道理的,但在hdfs doest上的輸入和輸出路徑有意義嗎? 你能告訴我如何爲它編寫oozie工作流程嗎? –
你應該知道Oozie是如何運行的。它使用一個映射器和不含reducer的map-reduce作業運行豬或shell腳本。因此,執行節點是從map-reduce集羣中隨機選擇的。所以你不能說在哪個節點上運行你的腳本。因爲使用本地文件系統沒有意義,所以使用HDFS是因爲它在所有節點上都可用。以「hdfs:// namenode:port/path/to/file」的形式使用完整URI來引用豬腳本中的HDFS路徑。 –
如果您在Oozie的本地模式下運行豬時提供了一些推理,那將非常有用。 –