2012-04-10 40 views
4

我想使用BeautifulSoup解碼實體,但沒有運氣。使用BeautifulSoup解碼html實體

from BeautifulSoup import BeautifulSoup 

decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES) 

print decoded 

輸出根本沒有解碼。我在這裏找到了很多使用這種方法的答案。 我是否做錯了什麼?

我想爲此使用BeautifulSoup,所以請不要打擾告訴我,標準庫有一個解碼實體的方法。

回答

1

您需要print decoded.contents

>>> print decoded 
<p> </p> 
>>> print decoded.contents 
[u'<p> </p>']