2017-03-18 60 views
0

我遍歷整個html文件,逐個字符地搜索並且我想要獲取html標記。在html文件中查找JavaScript腳本

如果我遇到'<'這意味着對我來說,是想要的標籤的開始,並分別考慮'>'作爲結束。當然,JavaScript腳本里面可能有'<'以及'>',所以我的程序會在發生時將它們視爲想要的標籤。我想防止這樣的錯誤。

是否有任何正則表達式,我可以使用它或任何想法來做到這一點? 我試圖使用JavaScript編程語言關鍵字檢查腳本,但是這種方法並不能說服我。

+1

請參閱[RegEx匹配開放標籤,除了XHTML獨立標籤](http://stackoverflow.com/questions/1732348 /正則表達式匹配開放標籤,除了-XHTML-自足標籤)。使用DOM解析器。 –

+2

你想要做的是非常非常非常困難,因爲你可以在JavaScript代碼中找到字符'<' and '>':1)比較,2)字符串,3)註釋(內聯和多行),4)文字正則表達式模式好運處理這個),5)移位運算符,並且不要忘記最終的CSS字符串和註釋。總之,你不能用簡單的模式來處理這個問題。 –

+2

JS有現有的HTML解析器,你爲什麼試圖從頭開始寫一個? – zzzzBov

回答

1

我很抱歉,我沒有真正抓住你想要什麼,,如果你想獲得任何標記或HTML的所有標記與他們的代碼,你可以使用
document.querySelectorAll("TagName")[0].outerHTML其中陣列0意味着它首先創立的,使用循環獲取所有的一個...我很抱歉,如果它不是你想要的...