我已經寫了下面的regex
但它不工作。你能幫我麼?謝謝:-)提取藝術家和音樂文本(正則表達式)
track_desc = '''<img src="http://images.raaga.com/catalog/cd/A/A0000102.jpg" align="right" border="0" width="100" height="100" vspace="4" hspace="4" />
<p>
</p>
<p> Artist(s) David: <br/>
Music: Ramana Gogula<br/>
</p>'''
rx = "<p><\/p><p>Artist\(s\): (.*?)<br\/>Music: (.*?)<br\/><\/p>"
m = re.search(rx, track_desc)
輸出應該是:
Artist(s) David
Music: Ramana Gogula
嚴重傾向於替代正則表達式。 – FailedDev
強制性引用在這裏:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – bgporter
我想這樣格式不好的HTML,甚至解析器不會對你有太大的幫助,儘管你至少可以用它來從HTML中提取文本。 – Acorn