我的正則表達式不會對我的字符串做任何事情。python正則表達式匹配任何東西
蟒蛇
data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article\1</article>', data, flags=re.MULTILINE)
print datareg
我得到
random
<article stuff
</article>random stuff
我想
<article stuff
</article>
唉,來吧:不[Cthulhu解析](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)再次。 – pillmuncher
@pillmuncher:它看起來像格式不正確的HTML,所以我懷疑HTML解析器能夠很輕鬆地使用它。 – Blender
@Blender:我認爲你是對的。但是替代似乎也不是有效的XML。我想知道,需要破解XML的是什麼? – pillmuncher