解析HTML在美麗的湯

我試圖解析HTML的片段是這樣的：解析HTML在美麗的湯

<div><span>adrress</span>text of address</div>

我如何可以採取分段「地址的文本」編程沒有Beatiful湯span標記？

現在我把DIV的全部內容，並刪除跨度，但我覺得有一個更好的辦法

來源

2013-06-19 kharandziuk

是否可以使用正則表達式？ – tanaydin

@tanaydin正則表達式和html不會放在一起。 – kingdamian42

>>> fragment = '<div><span>adrress</span>text of address</div>' 
>>> soup = BeautifulSoup(fragment) 
>>> soup.div.span.nextSibling 
u'text of address'

來源

2013-06-19 14:03:13 falsetru

方法如下：

>>> from BeautifulSoup import BeautifulSoup 
>>> text = "<div><span>address</span>text of address</div>" 
>>> print BeautifulSoup(text).find('div').contents[-1] 
text of address

對不起，我的第一個答案，我誤解了問題。

來源

2013-06-19 13:59:43 zmo

解析HTML在美麗的湯

回答

相關問題