1
我有豬腳本,只有當我在腳本的中間存儲和加載變量時才起作用。豬需要存儲/加載工作
我的試驗表明,類似下面的順序將DISTINCT失敗後:
- FOREACH
- DISTINCT
- 集團
- FOREACH
- STORE
- STORE
但是,如果我存儲和隨後如下加載變量同樣會取得成功:
- FOREACH
- DISTINCT
- STORE
- LOAD
- 集團
- FOREACH
- STORE
工作序列我是:
的foreach /加入/的foreach
組/的foreach
加入/的foreach
此外我不能簡單地進行編碼的store & rmf作爲Pig的代碼優化功能將嘗試跳過它認爲無用的所有步驟(因爲我存儲了一個變量,然後在同一個變量名上加載它)。
有沒有人見過這樣奇怪的行爲?
編輯:不幸的是我不能在這裏粘貼代碼。
感謝您的反饋意見。你有什麼線索爲什麼豬會這樣做? –
我同意你 - 豬發現他並不真的需要運行這個,因爲你沒有存儲結果。也許我會更多地瞭解它 – Mzf