1
我試圖解析HTML的片段是這樣的:解析HTML在美麗的湯
<div><span>adrress</span>text of address</div>
我如何可以採取分段「地址的文本」編程沒有Beatiful湯span標記?
現在我把DIV的全部內容,並刪除跨度,但我覺得有一個更好的辦法
我試圖解析HTML的片段是這樣的:解析HTML在美麗的湯
<div><span>adrress</span>text of address</div>
我如何可以採取分段「地址的文本」編程沒有Beatiful湯span標記?
現在我把DIV的全部內容,並刪除跨度,但我覺得有一個更好的辦法
>>> fragment = '<div><span>adrress</span>text of address</div>'
>>> soup = BeautifulSoup(fragment)
>>> soup.div.span.nextSibling
u'text of address'
方法如下:
>>> from BeautifulSoup import BeautifulSoup
>>> text = "<div><span>address</span>text of address</div>"
>>> print BeautifulSoup(text).find('div').contents[-1]
text of address
對不起,我的第一個答案,我誤解了問題。
是否可以使用正則表達式? – tanaydin
@tanaydin正則表達式和html不會放在一起。 – kingdamian42