我正在使用Pig解析我的應用程序日誌,以瞭解哪些暴露的方法已被上個月未被調用的用戶調用過(由同一用戶)。hadoop pig bag subtraction
我設法得到方法調用上個月之前用戶和上個月組合後:
前的最後一個月的關係樣品
u1 {(m1),(m2)}
u2 {(m3),(m4)}
上個月關係樣品後
u1 {(m1),(m3)}
u2 {(m1),(m4)}
我想要的是由用戶找到AFTER中哪些方法不在之前,即
NEWLY_CALLED預期的結果
u1 {(m3)}
u2 {(m1)}
問:我怎麼能做到這一點的豬?是否可以減去包包?
我已經嘗試過DIFF函數,但它不執行預期的減法。
問候,
喬爾
我剛剛做了幾分鐘前:)感謝馬克的建議! 我要提議我對豬/豬崽做了什麼,因爲我瘦了它可能會幫助其他人。 – 2012-08-17 09:00:29
@JoelCostigliola有內置函數['SUBTRACT'](http://search-hadoop.com/c/Pig:src/org/apache/pig/builtin/SUBTRACT.java%7C%7C+%252B%2528private +靜態%2529)。這是你需要的嗎? – wenlong 2013-07-22 07:40:34
@文龍在豬0.11.1中被減支持? – 2014-01-22 17:46:02