2013-06-03 43 views
0

我正在分析具有各種域名的日誌文件。我想從輸出報告中排除/忽略任何包含單詞「macys」的域。下面是一個例子輸出:忽略級聯中的輸出

l.macys.com 87516

www.google.com 3016

search.yahoo.com 584

www.bing.com 166

macys-L0135874392.htm 1

我想要和輸出文件是我不會看到任何域的單詞「macys」。

任何想法?

感謝,

回答

0

這聽起來像是一個完美的用例的層疊Filter

你會用RegexFilter此設置:

Pipe pipe = new Pipe(incomingPipe, new Fields("UrlColumn"), 
    new RegexFilter(".*macys.*", true), Fields.All); 

定製的正則表達式的匹配使用情況。上面的那個將刪除所有包含單詞「macys」的元組(行)