我有一些HTML代碼中的字符串,例如:如何使用RegEx搜索雙引號包圍的文本?
This is <strong id="c1-id-8">some</strong> <em id="c1-id-9">text</em>
我需要去掉從每一個HTML標籤的id
屬性,但我有一個正則表達式零的經驗,所以我搜索在這裏和那裏從互聯網上,我寫了這種模式:[\s]+id=\".*\"
不幸的是,它不工作,因爲我期望。事實上,我希望正則表達式能夠捕獲id="
,隨後是任何重複任意次數的字符,並以最接近的雙引號結尾;實際上,在這個例子中,我期待趕上id="c1-id-8"
和id="c1-id-9"
。 但是,模式返回了子字符串id="c1-id-8">some</strong> <em id="c1-id-9"
,它發現id="
的第一個匹配項和最後一個雙引號字符。
你能告訴我我的模式有什麼問題,請問該如何解決? 非常感謝你
爲∞個時間,**使用解析器** HTML是不是一個正規的語言 –