1
我有一個<twitterwidget>
在page需要刪除(不需要在推文中的文本)。 我試圖BeautifulSoup:刪除一個小部件
for script in soup(["script", "style"]):
script.extract()
但它沒有幫助,從微博文本仍然存在。 我也試着刪除單獨p
與鳴叫:
for s in soup('p'):
try:
if s["lang"]=="en":
s.extract()
except:
pass
但它只能解決部分問題 - 從twitterwidget
一些垃圾仍然有.. 我將如何擺脫小部件的一勞永逸?
的問題是,它無法找到它。在頁面上有一個''標記,但是當我嘗試使用'ctrl + f'或使用'findAll'找到它時,它不可見。看到它的唯一方法是突出Twitter的文本,並看看它的父... –
parsecer
@parsecer,它是動態創建使用js,所以除非你使用的東西,可以運行js獲取源,它不會是那裏。你如何獲得源代碼? –
截至目前 - 基本上 - 使用網絡瀏覽器的代碼查看器。 – parsecer