2013-01-09 58 views
1

部分,我想匹配下面的標記正則表達式匹配特定的XML - 在Python

<text link="no"> 
    ... 
</text> 

唯一重要的是,我想與鏈接=「無」的文本元素相匹配的屬性和任何在裏面。

我使用Python和目前我有以下的正則表達式這是不工作:

'<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*' 

所以我考慮到文本可以有其他屬性。

幫助將不勝感激!

+5

你爲什麼不使用XML解析庫? – fge

+1

這是一個傳統的把這個鏈接在這裏:**你不能用正則表達式解析[X] HTML:** http://stackoverflow.com/a/1732454/471214 – mmdemirbas

+0

好吧,所以我想我會必須使用解析庫....讓我們看看什麼pyparsing必須提供... Thx爲您的答覆 – pypat

回答