2016-09-19 61 views
0

我有排斥regexs(推理 - 我不希望包含的.js和.css文件):排除的.js和.css文件從蜘蛛

.*\Q.css\E 
.*\Q.js\E 

那些正確設置爲背景:

/JSON /上下文/視圖/ excludeRegexs /?zapapiformat = JSON & CONTEXTNAME =自動上下文

{ "excludeRegexs":"[.*\\Q.css\\E, .*\\Q.js\\E]" } 

然而,一旦我跑了蜘蛛,並且查詢結果蜘蛛

/JSON /蜘蛛/瀏覽/ fullResults /?zapapiformat = JSON & scanId = 0

我還是看到了很多的.js的和.css文件

{"fullResults":[{"urlsInScope":[ 
    {"statusReason":"OK","method":"GET","messageId":"259", 
    "url":"https://contosco.com/modernizr.min.js","statusCode":"200"} 
    ... lot of other .js references here ... 
]} ... ]} 

也有一種方法如何測試正則表達式某種方式沒有實際運行掃描?

+0

也許你需要使用'{ 「excludeRegexs」:」 * \\。 。(css | js)$「}' –

回答

0

正則表達式沒有錯。原來"context"是放錯那些排除的地方(我想知道"exclusionRegexs""context"中是什麼)。正確的地方,把那些正則表達式是蜘蛛排除 - 即

/UI /蜘蛛/動作/ excludeFromScan/

+0

他們要定義上下文。如果您只是瀏覽/掃描上下文,那麼這些URL應該被忽略。 –