1
有沒有人知道任何列出所有操作員的Apache豬文檔(如group by,streaming等)以及PIG採取的相應操作,即操作員的MR作業類型/數量結果是?MR作業的豬文檔
我特別感興趣的是流媒體方面,它如何映射到MR作業。
有沒有人知道任何列出所有操作員的Apache豬文檔(如group by,streaming等)以及PIG採取的相應操作,即操作員的MR作業類型/數量結果是?MR作業的豬文檔
我特別感興趣的是流媒體方面,它如何映射到MR作業。
但是到目前爲止還沒有一個完整的清單,但我認爲這是值得閱讀以下文章/章節:
之上建立一個高級別數據流系統的map-reduce:豬八戒經驗
(第4節。編譯來的MapReduce)
http://infolab.stanford.edu/~olston/publications/vldb09.pdf
隱語:一個不那麼外語用於數據處理
(第4.2章MapReduce的計劃編制)
http://infolab.stanford.edu/~olston/publications/sigmod08.pdf
此外,您可以隨時在腳本 上發出EXPLAIN或ILLUSTRATE以查看幕後發生的情況。