2011-06-24 16 views

回答

33

使用getText代替:

import BeautifulSoup 
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>') 

print soup.getText(separator=u' ') 
# u'this is example' 
1

如果Beautifulsoup的版本沒有getText那麼你可以這樣做:

In [26]: ' '.join(soup.findAll(text=True)) 
Out[26]: u'this is example'