我試圖製作一個表達式來搜索how2bypass.co.cc這樣的頁面,並返回「form」標籤中「action」屬性的內容,以及內容任何輸入標籤中的「名稱」和「類型」屬性。我無法使用html解析器,因爲我的最終目標是自動檢測給定頁面是否是Web代理,並且一旦網站發現我正在做這些事情,他們可能會開始做一些愚蠢的事情,比如編寫整個JavaScript文件阻止我解析它。在php中使用正則表達式匹配html屬性
我正在使用的代碼
preg_match_all('/<form.*action\="(.*?)".*>[^<]*<input.*type\=/i', $pageContents, $inputMatches);
這爲action屬性工作正常,但一旦我把「後鍵入\ =代碼停止工作。這是爲什麼?它工作正常一次,但不是兩次
謝謝,我沒有意識到。*會這樣做。但是,我原來的問題依然存在。把報價打破錶達,我不明白爲什麼。 澄清:爲什麼 \t /