0
嘿傢伙不漂亮帶內CSS和JavaScript內容?使用後沒有BeautifulSoup帶內聯CSS和JavaScript內容
content3 = ''.join(BeautifulSoup(content).findAll(text=True))
我仍然有他們纏綿。
嘿傢伙不漂亮帶內CSS和JavaScript內容?使用後沒有BeautifulSoup帶內聯CSS和JavaScript內容
content3 = ''.join(BeautifulSoup(content).findAll(text=True))
我仍然有他們纏綿。
你想剝離什麼,所有腳本和樣式元素?它應該是這樣的:
''.join(BeautifulSoup(content).findAll(text=lambda text:
text.parent.name != "script" and
text.parent.name != "style"))
這是正確的,可能正則表達式替換可以做到這一點,但我想知道如果美麗的處理tthat。還是「簡單版本的webstemmer」也可以這樣做? – goh 2010-06-09 01:42:15