我有一個過濾器關鍵字列表(大約1000個數字),我需要使用這個列表過濾一個關係領域的豬。豬過濾器匹配過多
最初,我宣佈這些關鍵字如: %declare p1'。 keyword1。'; .... ...
%declare p1000'。 keyword1000。';
然後我做過濾,如:
過濾= FITLER SRC BY(未$ 0匹配 '$ P1')和(非$ 0匹配 '$ P2')和......(不是$ 0匹配'$ P1000');
DUMP過濾;
假設我的源關係在SRC中,我需要對第一個字段應用過濾,即$ 0。
如果我將過濾器的數量減少到100-200,它工作正常。但是,隨着過濾器數量增加到1000個。它不起作用。
有人可以提出一個解決方法來獲得正確的結果嗎?
在此先感謝
你能給我輕微的概述,我應如何在驅動程序中豬腳本鏈接我的用戶定義的函數。 – 2012-05-02 05:22:30
查看文檔中的REGISTER和DEFINE函數http://pig.apache.org/docs/r0.9.2/basic.html#register – 2012-05-02 06:53:16