2010-06-09 34 views

回答

0

你想剝離什麼,所有腳本和樣式元素?它應該是這樣的:

''.join(BeautifulSoup(content).findAll(text=lambda text: 
text.parent.name != "script" and 
text.parent.name != "style")) 
+0

這是正確的,可能正則表達式替換可以做到這一點,但我想知道如果美麗的處理tthat。還是「簡單版本的webstemmer」也可以這樣做? – goh 2010-06-09 01:42:15