我想爲一個爬蟲做一個排除正則表達式。我想索引出現在/archives/
目錄中的所有.php
文件,但不是其他任何地方。所以正則表達式應該匹配所有.php
文件,除了那些在/archives/
目錄中(但是深度嵌套)的文件。因此,例如,將指數正則表達式來找到一些.php文件
www.mysite.com/archives/123qwe/index.php
但不
www.mysite.com/123qwe/index.php
我相信這個正則表達式應該工作:(?<!\/archives\/.*)\.php$
不過,我不能夠使用<
字符,因爲我需要將正則表達式提交到一個web表單中,該表單從輸入中清理<
。並使用<
打破正則表達式。那麼有沒有另一種方式來形成這個正則表達式,而不需要<
?
這個問題不是關於正則表達式本身,而是關於表單序列化。 – 2011-04-21 19:47:24
我正在尋找一種替代方法來進行我的正則表達式匹配。我無法控制表單,所以我無法使用<。 – thugsb 2011-04-21 19:49:03