我在Apache的PIG以下關係。濾袋由父值在Apache的PIG
TSERIES: {ORDERED: {(timestamp: long,contentHost: chararray)},ts1: long}
我要做到以下幾點:
F = foreach TSERIES {
ts = filter ORDERED by timestamp > TSERIES.ts1;
generate ts;
}
總之,我想保持與timestmap高於TS1, 但小豬不會允許有序包中的所有元素,特別是這部分ts = filter ORDERED by timestamp > TSERIES.ts1;
。
這可能嗎?我正在使用版本0.9.2-cdh4.0.1
(cloudera)。
是否TS1恰巧是任何機會,每個元組獨特之處? –
我沒有強烈的保證,但我會說這是爲99%的獨特。因爲它是一個時間戳,沒有硬性規定是說,兩個時間戳不能在這種情況下(點擊流數據)完全一樣。 –
我對豬0.14有同樣的問題。你有沒有找到一種方法來使它工作? –