0
我遍歷整個html文件,逐個字符地搜索並且我想要獲取html標記。在html文件中查找JavaScript腳本
如果我遇到'<'這意味着對我來說,是想要的標籤的開始,並分別考慮'>'作爲結束。當然,JavaScript腳本里面可能有'<'以及'>',所以我的程序會在發生時將它們視爲想要的標籤。我想防止這樣的錯誤。
是否有任何正則表達式,我可以使用它或任何想法來做到這一點? 我試圖使用JavaScript編程語言關鍵字檢查腳本,但是這種方法並不能說服我。
請參閱[RegEx匹配開放標籤,除了XHTML獨立標籤](http://stackoverflow.com/questions/1732348 /正則表達式匹配開放標籤,除了-XHTML-自足標籤)。使用DOM解析器。 –
你想要做的是非常非常非常困難,因爲你可以在JavaScript代碼中找到字符'<' and '>':1)比較,2)字符串,3)註釋(內聯和多行),4)文字正則表達式模式好運處理這個),5)移位運算符,並且不要忘記最終的CSS字符串和註釋。總之,你不能用簡單的模式來處理這個問題。 –
JS有現有的HTML解析器,你爲什麼試圖從頭開始寫一個? – zzzzBov